网站首页 > 技术教程 正文
今天小妹继续掰扯的仍是R语言数据处理领域的明星plyr 包里的,明星函数 ddply的一个参数,来看看这个函数用来“分组”的小秘密。
一 极速预览版
今天的主要内容是:在使用ddply 对数据集A进行分组时,既可以使用A的某列来分,也可以使用A以外的某列数来分;既可以使用A某列的原始值来分,也可以使用A的某列构造一个布尔值来分。
二 详细分解版
首先今天用来演示的数据集仍是一个构造出来的模拟数据,范例如下:
1. ddply的常规分组法
Hadley Wickham 大神说了,第二个参数是要定义这样一个变量:variables to split data frame by, as as.quoted variables,
aformulaorcharacter vector 故以下三种写法都是可以的。
2. ddply的花式分组法
除了干巴巴的用原来的变量分组,能不能变点花样出来?
有没有看到!强大的ddply既可以把变量进行变化后再分组,又可以用原来的变量构造新的判断条件来分组,有木有很高级? (虽然也可以先根据需要构造一个新变量加入原数据,再使用常规做法实现同样目标,但这样写相当于把两步合成一步,更简洁错的机会就更少啦!)
3.ddply的移花接木分组法
最后上ddply借用别的向量来分组的做法。此处添加一列学习成绩,看看学习成绩更高的人平均收入会更高吗?(模拟数据,仅供娱乐)
看到没?同样奏效!唯一需要注意的是:这个借来的向量长度 要与原数据的行数相同才行哦~
4. 小结
使用ddply时,不论索引变量如何设置,都只是给 “输入数据”一个分组的条件而已,只要通过这个变量能让电脑知道:它应该把哪些列放在一起,哪些列分开就可以了
---------------------------------------------
< 鸡汤时间 >
ddply从出生以来就被大家推崇备至,一个重要原因是它分组计算的技能。分组实际上对应的是很高深的“分类解决问题”的思想,借用Hadley Wickham 大神对plyr包的描述所言:
正所谓:学习编程,掌握的函数都只是工具,解决问题的思维才是核心。修炼的路上,以此共勉。
猜你喜欢
- 2024-10-27 经典车Plymouth Road Runner Superbird 哔哔鸟
- 2024-10-27 30天快速入门西门子PLC(第四天)(西门子plc入门教程)
- 2024-10-27 沉船捞出165年前牛仔裤?(沉船捞出165年前牛仔裤视频)
- 2024-10-27 轮胎知识,有这一篇就够了(轮胎了解)
- 2024-10-27 理查德米勒推出拉菲尔·纳达尔RM27-02“石英”陀飞轮限量腕表
- 2024-10-27 索尼推Xperia 1 III更新:魅族Flyme适配的本地应用来了
- 2024-10-27 ply apply comply(plyopen官方网站)
- 2024-10-27 Revit导出3D模型插件【GLTF|OBJ|DAE|STL|PLY|OFF|XYZ】
- 2024-10-27 床品的支数越高越好吗?你完全错了!
- 2024-10-27 搭建庇护所,是野外生存的一项重要技能,它不但可以保暖隔热
你 发表评论:
欢迎- 08-02Linux基础- IP地址
- 08-02【网络】IP地址冲突如何快速定位?
- 08-02在mac中利用自带终端连接Linux服务器
- 08-02如何使用 Prometheus 监控 Linux 服务器性能
- 08-02CentOS Linux 7 的IP地址配置
- 08-02内网IP与外网IP
- 08-02一文带你了解IP地址别名
- 08-02Linux中如何修改ip地址?
- 最近发表
- 标签列表
-
- 下划线是什么 (87)
- 精美网站 (58)
- qq登录界面 (90)
- nginx 命令 (82)
- nginx .http (73)
- nginx lua (70)
- nginx 重定向 (68)
- Nginx超时 (65)
- nginx 监控 (57)
- odbc (59)
- rar密码破解工具 (62)
- annotation (71)
- 红黑树 (57)
- 智力题 (62)
- php空间申请 (61)
- 按键精灵 注册码 (69)
- 软件测试报告 (59)
- ntcreatefile (64)
- 闪动文字 (56)
- guid (66)
- abap (63)
- mpeg 2 (65)
- column (63)
- dreamweaver教程 (57)
- excel行列转换 (56)
本文暂时没有评论,来添加一个吧(●'◡'●)