全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1085 2
2013-01-28
发布一种两个分布的相似度、距离的度量——胡氏相似度、距离(原创,如果已有此定义欢迎指出)。
Bhattacharyya会夸大相似度,比如取两个值的分布,概率分别为90%、10%,另一个概率分别为10%、90%,巴氏距离会得到0.6的相似度。
胡氏距离的结果是0.36,更合理。

(请回复,谢谢!如想不回复查看,请等待更新,可能在3个月后)

本帖隐藏的内容

离散型胡氏相似度 H=Σ(2*p(x)*q(x)/(p(x)+q(x)))
连续型胡氏相似度 H=∫(2*p(x)*q(x)/(p(x)+q(x)))dx
离散型胡氏距离 -log(Σ(2*p(x)*q(x)/(p(x)+q(x))))
连续型胡氏距离 -log(∫(2*p(x)*q(x)/(p(x)+q(x))))dx
p(x)、q(x)任一值为0时,对应的2*p(x)*q(x)/(p(x)+q(x))取值为0

注:
离散型巴氏相似度 B=Σ(sqrt(p(x)*q(x)))
连续型巴氏相似度 B=∫(sqrt(p(x)*q(x)))dx
根据0≤a≤1、0≤b≤1,0≤2ab/(a+b)≤sqrt(ab)≤(a+b)/2≤1;容易证明上式均满足相似度[0,1]、距离[0,∞)的条件,且同分布相似度为1、距离为0,完全不同的分布相似度为0、距离为无穷。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-1-28 21:43:34
胡氏距离?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-24 11:23:28
巴氏用的是几何平均值,胡氏用的是调和平均值。
取最小值也是一个不错的选择。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群