全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4435 2
2012-05-14
问题:
对一批用户利用proc fastclus做了K-Means聚类后,发现得到的3个用户群用户数差异较大,分配不均,针对此问题特想对结果做一修正,该如何做?请高手指教!

目前本人的做法是:
对聚类结果利用proc candisc进行典型分析,然后依据2个典型变量再利用proc discrim对用户进行重新判别归类,得到最终的结果要比之前好一些,基本算是解决了用户分配不均的问题。但这么做是否合理?用户分配不均可能完全是由数据本身所致。请高手指点一二!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-5-14 12:59:59
这是一个非常好的话题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-5-16 18:34:06
再次提问:在聚类分析过程中,样本中有一部分用户的性别是缺失的,但是在聚类的时候又不能舍弃掉这部分用户,请问:对于缺失的性别值该如何处理比较合适?是随机分配还是...?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群