全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
3059 2
2014-11-05
有一个数据集,30万rows,数个columns. 第一个column是关于时间,格式为 “06/01/2012 12:00:00 PM”,跨度是一年内的年头到年尾。 第2个column是关于颜色,有 red, blue, green,等等。

第1步,现在需要把时间那个column先作处理,把它们按月分割,从1月到12月。然后再作 “当第2个column取某种特定颜色时候,这种颜色在12个月份出现的次数” 的图。

同理,第2步是把第1个column按 morning, afternoon, evening, mid-night 分割,再作 “当第2个column取某种特定颜色时候,这种颜色在4个不同时间段出现的次数” 的图。这一步我的思路是先向量化,再用cut command分割成四个labels,再把此向量放回去。

请问这两步有没有简洁有效的方法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-11-8 10:03:34
substr("time",1,2)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-11-8 10:03:43
hist()
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群