1.相关系数
pearson线性相关系数
spearman秩相关系数,rho=1-6sigma(Ri- Qi)/n(n**2-1)
2.夹角余弦
度量两个方向的夹角大小,并划归到-1到1之间,比如向量
cos theta = A*B/(|A|*|B|),两向量的内积除以两个向量的模
3.Jaccard相似系数
度量两个无序集合的相近成度,值介于0-1
set A与set B的交集除以set A与set B的并集
4.距离算法
比如欧式几何平方距离
比如二维空间的两个点(x1,y1),(x2,y2)之间的距离
distance=sqrt((x1-x2)**2-(y1-y2)**2)
5.apriori算法中的支持度和置信度组合使用
主要用来测度关联销售或者购物篮的频繁项集之间的可捆绑销售的程度