全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
2546 5
2011-08-23
看到的一些理论文章里面都有很适合本文方法的样本数据供分析。但实际中是不是到手一批数据之后,并不知道该用哪种方法来对其分析合适。
有没有对数据初步“review”一下的方法,来判断是该用什么合适的方法类对其分析?

当然针对具体的行业,熟悉的业务常识可以给出一个大致的判断。
但想知道出了业务知识辅助之外,单纯的从数据角度来判断的办法有吗?

数据少些的时候可能通过先作图来观察数据的整体情况,但如果数据量和数据维度都比较大时(比如十万行、100多列的数据,更别说现在动辄有上百万的数据),这种直观的方法是不是就不好用了。这时就要特征选择、抽样等预处理工作首先进行了吗?

除了作图观察外,还有没有数值类的方法来观察数据整体情况。

请知道的高手们多多指教,多谢啊!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-8-23 18:43:11
关键在于你要解决什么问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-8-23 20:45:08
比如做个多维数据的非线性分类吧,可以用Logistic回归、也可以用SVM。
再比如聚类分析的实现,有K-MEANS这样的划分法,也有CURE这样的层次法。

针对样本数据呈现的不同特征,使用不同的方法肯定也是效果不同的。当然可以用不同的方法探索性的建模,然后用测试数据比较。
但就是想知道在这之前,有没有办法观察样本呈现的特征是什么,然后选择合适的算法建模。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-8-23 20:52:47
你要干什么嘛  连干什么都不说。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-8-23 21:09:16
工作中不是专门做数据统计分析的,所以没有专门的项目来做。现在处于学习阶段,只是想到的一些疑问。
但知道的实际例子比如信用评分评级,属于上面说的第一个分类问题吧。
或者零售行业的根据客户消费习惯分类研究特征,属于第二个聚类问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-8-24 10:38:54
看了一下R的图形功能,支持的类型都非常强大。原来很如陋寡闻,关联图、条件密度、热图等根本没听过的。
看来需要好好学习一下统计图形了,也许就能部分解决我的疑问吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群