全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2570 1
2013-09-10
假如对某用户群体做聚类分析,心里已经有了这些人群有哪些分类,我们放入的变量也是基于我们对该用户行为的了解。
那这种得算半监督吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-9-13 11:26:18
1.聚类之所以叫无监督,原因是做聚类时,没有所谓的响应变量y,无法做评估。好坏无法从数据建模数据本身去评估,所以我们会发现聚类分析到底聚成几类、样本被分到的类是否正确其实是没有什么统一的理论去说明的;
2.心里是心里,如果心里判断准确还要算法和模型做什么呢。所以你说还是聚类,属于无监督。
3.所谓半监督是建模样本中有部分样本有y值,大部分样本没有y。这种问题比无监督处理起来更容易评估。比起有监督(全部样本都有y)又更难一些。所以一般称之为半监督;
4.之所以会产生半监督问题,是因为科学研究中很多问题获取样本的x值相当容易,获取y值非常不容易,考虑到成本所以只获取到了很少量的样本的y值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群