有监督学习:
生成模型
判别模型
参数模型
非参数模型
概率模型
非概率模型
k取值设置为奇数
如果发生类别一样多,模型无法判断,返回概率为50%,模型只能猜。在sklearn中当概率50%,会判断其二分类标签为0
**********************************
聚类算法模型结构:
创建k个点作为初始质心(通常是随机选择)
当任意一个簇分配结果发生改变时:
对数据集中的每个点:
对每个质心:
计算质心与数据点之间的欧式距离
将数据点分配到距其最近的簇
对每个簇,计算簇中所有点的均值并将均值作为新的质心
直到簇不再发生变化或达到最大迭代次数
*************************************
组内差异小 组外差异大
组内差异衡量标准:误差平方和
组外差异衡量标准: