全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
6230 6
2015-07-06
因所使用数据太大,stata打不开,请问各位大神,如何只使用其中一部分变量。怎么用stata实现。比如有1000个变量,我只需要其中的100,观测值数量不变。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-7-7 00:19:13
最简单的方法,用软件产生随机数,再把数据按随机数大小排序(一般由小-大),取前面n个即可。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-7 11:38:14
gxnnhsd 发表于 2015-7-7 00:19
最简单的方法,用软件产生随机数,再把数据按随机数大小排序(一般由小-大),取前面n个即可。
比如我有100000个观测值,100个变量,但是我依然要使用这100000个观测值,只是将变量减少,这样可以减小文件大小,stata就可以读取了。是不是用 use xx.dta option  ,这个option应该是什么呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-7 12:06:14
cyllwt 发表于 2015-7-7 11:38
比如我有100000个观测值,100个变量,但是我依然要使用这100000个观测值,只是将变量减少,这样可以减小文 ...
据我所知不能这样。Stata一般读个3、4G的文件不会是很大问题啊,为什么非要这么做?实在是需要的话用SAS先处理一下吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-7 16:30:47
夏目贵志 发表于 2015-7-7 12:06
据我所知不能这样。Stata一般读个3、4G的文件不会是很大问题啊,为什么非要这么做?实在是需要的话用SAS先 ...
我也是奇怪,以前读1个多G可以,现在这个不到3个G,有如下提示,望指点:

op. sys. refuses to provide memory
    Stata's data-storage memory manager has already allocated 1520m bytes and it just attempted to allocate
    another 16m bytes.  The operating system said no.  Perhaps you are running another memory-consuming task and
    the command will work later when the task completes.  Perhaps you are on a multiuser system that is
    especially busy and the command will work later when activity quiets down.  Perhaps a system administrator
    has put a limit on what you can allocate; see help memory.  Or perhaps that's all the memory your computer
    can allocate to Stata.
r(909);
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-7 17:16:21
谢谢各位,已找到相关命令,use 变量名 using 数据名,即可,附参考网站:
http://www.stata.com/support/faqs/windows/large-datasets-and-memory/
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群