全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
4130 3
2016-02-24
原文件中有两列信息:date,value
想得到新的统计信息并存入另一个文件:year,sum,均值,正值个数,负值个数
因为date列为日期格式,想要按照年来统计value值,如2015,2014……,不知道怎样处理,各位大侠多多指教啊!
date                    value   

2015/12/31      -0.04157   

2015/11/30      0.054807   

2015/6/17      -0.03497   

2015/6/2      -0.05114   

2015/5/7      0.299337   

2015/3/5      -0.04905   

2015/1/14      0.320734   

2014/11/21      0.048179   

2014/9/15      -0.02405   

2014/8/21      0.011848   

2014/7/10      0.040365   

2014/5/6      -0.0249   

2014/4/21      -0.00684   

2014/2/24      -0.06535   

2013/12/6      -0.03319   

2013/11/27      0.044168   

2013/10/16      -0.02158   

2013/10/8      0.228148   

2013/7/30      0.028169   

2013/7/23      -0.01887   

2013/6/7      -0.03525   

2013/3/28      -0.13196   

2013/2/22      0.365025
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-2-24 18:56:15
groupby
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-2-25 20:42:36
不难,写好了。
结果是:
year,总数,均值,正值个数,负值个数
2013,0.42466,0.047184444444444446,4,5
2014,-0.02074800000000001,-0.0029640000000000014,3,4
2015,0.49814800000000004,0.071164,3,4
附件列表
Snip20160225_31.png

原图尺寸 160.53 KB

Snip20160225_31.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-8 12:24:16
多谢多谢!也可以使用resample,希望对大家有帮助。
重采样(resampling)指的是将时间序列从一个频率转换到另一个频率的过程。pandas 对象都含有一个 .resample(freq, how=None, axis=0, fill_method=None, closed=None, label=None, convention='start', kind=None, loffset=None, limit=None, base=0) 方法用于实现这个过程。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群