全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
11128 15
2014-03-23

如下是我自己总结的各软件应该如何使用:

1.      SAS: 用于处理海量数据,当数据上百万,千万的时候R和 Matlab就已经很难再胜任。个人觉得主要原因在于:Matlab, R 读取的数据都放在内存里,一旦数据过大就会导致处理速度变慢,尤其在笔记本上跑的时候。而SAS读入的数据都存在临时文件夹里,只有在执行语句的时候才把对应的数据调出来,所以内存管理很有效。SAS还有一点很好的地方在于:逻辑库的运用。数据集都是用Table 保存的。我自己在做研究时,最初的原始数据集都偏向用SAS处理。各个变量和数据来源都呈现得很清晰。不过我个人不喜欢用SAS做分析,感觉语言太繁杂,不直接。平时用最多目测就是SQL 功能

2.      R:我用R的原因包括:1)涉及字符处理我都用R,感觉比SAS,Matlab方便,尤其是在用数据框结构时,比Matlab 处理得快很多。2)统计测试较全, R的包很方便,做初步测试的时候很便捷。Matlab 的包就很麻烦,的自己手都添加 3)我觉得最重要的还是,R读取的数据格式叫广泛,我有些数据用SAS, Matlab读出来都有问题,不过用R读,效果就很好。

3.      Matlab : 如果数据是纯数字类型的,我首选Matlab。做模拟实验,或者数值算法,尤其是蒙特卡洛模拟,它都是首选。例如在做有关衍生品定价方面的研究时,用Matlab 就很方便。

4.      Stata: 我觉得做研究的话,Stata的统计分析已经很全了,尤其是做计量经济学。我一般做研究的时候喜欢先用R或者Matlab做测试;等思路基本通顺后,就改用Stata. 目前写的Paper后面的所有表格基本都是用Stata生成的,很方便。


希望以上内容能对各位有所帮助


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-3-23 04:40:11
个人感觉sas用于处理海量数据时似乎不太适合在windows系统的pc上使用,除非计算机性能特别优良,在linux下应该有更大的用途,毕竟sas是从硬盘上读取数据如果计算机配置不是特别理想,基本一Run就死......
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-23 05:25:22
zxn2011 发表于 2014-3-23 04:40
个人感觉sas用于处理海量数据时似乎不太适合在windows系统的pc上使用,除非计算机性能特别优良,在linux下应该 ...
学习了,多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-23 07:04:47
牛,分析到位
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-23 07:42:43
很有帮助的总结。收藏了,多谢。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-23 07:51:21
受教了,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群