加入收藏 | 设为首页 | 会员中心 | 我要投稿 衡阳站长网 (https://www.0734zz.cn/)- 数据集成、设备管理、备份、数据加密、智能搜索!
当前位置: 首页 > 大数据 > 正文

R语言数据处理——tidyr包

发布时间:2021-03-14 01:28:02 所属栏目:大数据 来源:网络整理
导读:????在实际进行数据分析的过程中,我们常需要对数据进行一些相应的整理, “ tidyr 包 ”中的 gather( 宽数据转为长数据 )、 spread( 长数据转为宽数据 )、 unit( 多列合并为一列 )、 separate( 将一列分离为多列 ) 这四个 函数为我们的数据整理提供

????在实际进行数据分析的过程中,我们常需要对数据进行一些相应的整理,“tidyr包”中的gather(宽数据转为长数据)、spread(长数据转为宽数据)、unit(多列合并为一列)、separate(将一列分离为多列)这四个函数为我们的数据整理提供了极大的便利。

????下面本文将以R自带的mtcars数据集来演示tidyr包”的用法。

数据准备:

R语言数据处理——tidyr包

为方便处理,在数据集中增加一列car?:

gather

gather的调用格式为:

这里,...表示需要聚合的指定列。

利用gather进行聚合:

R语言数据处理——tidyr包

? ? ????如聚合结果所示,除了car列外,其余列聚合成两列,分别命名为attributevalue。如果你想gathermapgear之间的所有列而保持carbcar列不变,可以如此操作:

spread

spread的调用格式为:

R语言数据处理——tidyr包

利用spread进行聚合:

R语言数据处理——tidyr包

unite

unite的调用格式如下:这里,...表示需要合并的列,col表示合并后的列。

数据构造:

R语言数据处理——tidyr包

现在,我们需要把datehourminsecond列合并为新列datetime。通常,R中的日期时间格式为"Year-Month-Day-Hour:Min:Second"。

R语言数据处理——tidyr包

separate

separate的调用格式为:

R语言数据处理——tidyr包

我们可以用separate函数将数据恢复到刚创建的时候,如下所示:

分离过程为,先将datetime分为date列和time列。再将time列分为hourminsecond列。

英文原版见:Data manipulation with tidyr

(http://datascienceplus.com/data-manipulation-with-tidyr/)

(编辑:衡阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读