全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
11580 8
2012-06-02
悬赏 5 个论坛币 未解决
我在做一个31个省区的某个方面的分析 老师让我先聚类 然后在判别分析,我不是很理解,是不是先拿大多数省区做一个聚类分析,分类后,再把剩余的几个省区做个判别分析,他说这样可以检验聚类分析的准确性,但是那几个剩余省区开始在哪一类根本不清楚啊,如何判断准确与否?
望高手不吝指教!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-6-2 09:35:38
是两种方法的结果互相验证,或者你凭什么说你的聚类分析(或者判别分析)的结果是正确的?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-2 09:45:34
我不敢保证开始聚类分析的结果就是合适的 但是剩余几个省区由于不知道他们本应该属于哪一类,现在得到的判别分析的结果也不能证明什么啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-12-18 22:33:24
聚类分析我们知道有两种方法,比如我们事先不知道应该分为几类的时候,可以用分层聚类法,当知道需要分为几类的时候,用快速聚类法。但是这个分类的结果是否合理,是受到你采用的变量以及距离的测度方法等多个因素的影响的,可能会出现分类结果不稳定的现象。所以这个时候我们就要用判别分析去验证,之前的聚类是不是合适。具体的验证,其实就是我们讲的交叉验证的那5个内容,包括增加样本验证什么的,还有以其中一部分作为判别方程样本,另一小部分作为验证样本进行的交叉验证,然后回头看之前的聚类结果是否合理
类似于你是一个医生,每次病人来了之后,你根据自己之前的从医经验,觉得你去检查那几项,我就能知道你是病人还是好人。但事实上每个病人的情况都是很复杂的,而且你自己了解的内容是有限的,所以不能保证你所判别的病人和正常人,就一定是合理的。这个时候就需要对所有的病人和正常人放到一起建立判别方程,然后逐个重新检查一次,看看是否之前有别人被你判断错误了,就是这个意思。具体怎么做,还是我之前说过的交叉验证,交叉验证的5个方法事实上都是可以用的,具体怎么用,根据你样本的实际情况来决定
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-12-18 22:34:25
聚类分析我们知道有两种方法,比如我们事先不知道应该分为几类的时候,可以用分层聚类法,当知道需要分为几类的时候,用快速聚类法。但是这个分类的结果是否合理,是受到你采用的变量以及距离的测度方法等多个因素的影响的,可能会出现分类结果不稳定的现象。所以这个时候我们就要用判别分析去验证,之前的聚类是不是合适。具体的验证,其实就是我们讲的交叉验证的那5个内容,包括增加样本验证什么的,还有以其中一部分作为判别方程样本,另一小部分作为验证样本进行的交叉验证,然后回头看之前的聚类结果是否合理
类似于你是一个医生,每次病人来了之后,你根据自己之前的从医经验,觉得你去检查那几项,我就能知道你是病人还是好人。但事实上每个病人的情况都是很复杂的,而且你自己了解的内容是有限的,所以不能保证你所判别的病人和正常人,就一定是合理的。这个时候就需要对所有的病人和正常人放到一起建立判别方程,然后逐个重新检查一次,看看是否之前有别人被你判断错误了,就是这个意思。具体怎么做,还是我之前说过的交叉验证,交叉验证的5个方法事实上都是可以用的,具体怎么用,根据你样本的实际情况来决定
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-12-18 22:38:22
总之你记住,判别分析和聚类分析的结果都是不确定的
当样本量增多,当变量变化的时候,测度的距离方法不同,结果就会不同
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群