全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
18826 5
2012-01-13
在做聚类分析时,我发现用余弦相似度和皮尔逊相关系数作为相似性度量所得到聚类结果有一定差异。请问,这两者有什么区别?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-1-14 11:01:34
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-2-21 11:00:26
遇到同样的疑惑,还没明白本质区别
但是:1.如果数据密集(所有数据几乎都有属性值,属性值量级重要),就用欧几里德算法

2.数据受级别膨胀影响(不同的用户使用不同的评分标准),就用皮尔逊相关系数算法

3.数据稀疏性强,就考虑用夹角余弦相似度算法
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-27 16:49:52
金珠翠 发表于 2014-2-21 11:00
遇到同样的疑惑,还没明白本质区别
但是:1.如果数据密集(所有数据几乎都有属性值,属性值量级重要),就 ...
很好的经验总结
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-13 10:18:49
金珠翠 发表于 2014-2-21 11:00
遇到同样的疑惑,还没明白本质区别
但是:1.如果数据密集(所有数据几乎都有属性值,属性值量级重要),就 ...
能说明为什么这样麽?是不是因为 不同用户有不同的评分标准所以应该去中心化,而数据比较稀疏,计算出来的平均数不准,所以要用余弦相似度呀?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-18 10:34:05
请问stata中有直接计算余弦相似度的命令吗?多谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群