全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1271 4
2014-10-15
刚学习R,现在有一堆问题,先提几个吧!
1. 导入数据之后怎么才能不让数据显示出来,因为数据量很大的情况下程序看不见了
2. 如果导入数据非常大,(观测500万以上,变量20以上,占空间2G以上),如何处理?我现在的数据就是那么大,一个文件,需要整体处理,不能一条或者数万条的处理
谢谢!会有论坛币给予
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-10-15 13:53:34
1,赋参
2,是每列每行都必须要?      或者不能随机抽取处理?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-15 14:26:08
yywan0913 发表于 2014-10-15 13:53
1,赋参
2,是每列每行都必须要?      或者不能随机抽取处理?
每一行都需要,不能随机处理,就是所有公司从2000年到现在的日数据,共计550万条左右,我需要进行各种处理,譬如求最大回撤,需要回归
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-15 15:48:30
duofengting 发表于 2014-10-15 14:26
每一行都需要,不能随机处理,就是所有公司从2000年到现在的日数据,共计550万条左右,我需要进行各种处理 ...
那应该只需要某些列吧?  不是只要日数据么。。20个变量都要?
都要的话就全读入咯!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-15 19:33:04
我知道一个相关的包:ff包,可以处理较大的数据,实际是走磁盘,但让人感觉是在处理内存数据。也有基于其上的统计包,不过这个我就没有细看了。我用该包主要是处理1000支股票若干年的周数据,满打满算也就40多万行。但是你这个就玩大了,2G我不知道能不能用ff包跑。建议:
(1)不要处理所有公司的股票,挑一些来处理
(2)ff包毕竟是拓展功能,基于其上的统计包并不多,而且阅读该包的英文pdf文档十分痛苦,我足足看了一个月,所以还是建议——多买几个内存条吧!该换电脑换电脑,该买内存买内存。这个才是最方便的方法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群