有一个数据集,30万rows,数个columns. 第一个column是关于时间,格式为 “06/01/2012 12:00:00 PM”,跨度是一年内的年头到年尾。 第2个column是关于颜色,有 red, blue, green,等等。 
第1步,现在需要把时间那个column先作处理,把它们按月分割,从1月到12月。然后再作 “当第2个column取某种特定颜色时候,这种颜色在12个月份出现的次数” 的图。 
同理,第2步是把第1个column按 morning, afternoon, evening, mid-night 分割,再作 “当第2个column取某种特定颜色时候,这种颜色在4个不同时间段出现的次数” 的图。这一步我的思路是先向量化,再用cut command分割成四个labels,再把此向量放回去。
请问这两步有没有简洁有效的方法。