关于R的一些问题，求助！

1326

收藏 2014-10-15

刚学习R，现在有一堆问题，先提几个吧！
1. 导入数据之后怎么才能不让数据显示出来，因为数据量很大的情况下程序看不见了
2. 如果导入数据非常大，（观测500万以上，变量20以上，占空间2G以上），如何处理？我现在的数据就是那么大，一个文件，需要整体处理，不能一条或者数万条的处理
谢谢！会有论坛币给予

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

yywan0913

2014-10-15 13:53:34

1，赋参
2，是每列每行都必须要？或者不能随机抽取处理？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

duofengting

2014-10-15 14:26:08

yywan0913 发表于 2014-10-15 13:53
1，赋参
2，是每列每行都必须要？或者不能随机抽取处理？

每一行都需要，不能随机处理，就是所有公司从2000年到现在的日数据，共计550万条左右，我需要进行各种处理，譬如求最大回撤，需要回归

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

yywan0913

2014-10-15 15:48:30

duofengting 发表于 2014-10-15 14:26
每一行都需要，不能随机处理，就是所有公司从2000年到现在的日数据，共计550万条左右，我需要进行各种处理 ...

那应该只需要某些列吧？不是只要日数据么。。20个变量都要？
都要的话就全读入咯！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

meishanjia1900

2014-10-15 19:33:04

我知道一个相关的包：ff包，可以处理较大的数据，实际是走磁盘，但让人感觉是在处理内存数据。也有基于其上的统计包，不过这个我就没有细看了。我用该包主要是处理1000支股票若干年的周数据，满打满算也就40多万行。但是你这个就玩大了，2G我不知道能不能用ff包跑。建议：
（1）不要处理所有公司的股票，挑一些来处理
（2）ff包毕竟是拓展功能，基于其上的统计包并不多，而且阅读该包的英文pdf文档十分痛苦，我足足看了一个月，所以还是建议——多买几个内存条吧！该换电脑换电脑，该买内存买内存。这个才是最方便的方法。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群