全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1076 0
2015-02-19
定义一:设阈值T是给定的正数,如果集合G中任意两个元素的距离d_ij都满足:d_ij<T(i,j \in G),则称G对于阈值T组成一个类。定义二:设阈值T是给定的正数,如果集合G中每个i \in G都满足下面条件,其中n是集合元素个数,则称G对于阈值T组成一个类:
\[\frac{1}{n-1}\sum_{j \in G}d_ij<=T\]
定义三:设T和H(H>T)是两个给定的正数,如果集合G中的两两元素距离的平均满足下条件,则真G对于阈值T,H形成一个类:
\[\frac{1}{n(n-1)}\sum_{i \in G}\sum_{j \in G}d_ij \leq T,d_ij \leq H\]
定义四:设T是给定正数,将集合G任意一i\inG,一定存在j inG,使得两元素的距离d_ij满足下面条件,则称G对于阈值T形成分类:
\[d_{ij} \leq T\]
定义五:设阈值T是给定的正数,将集合G任意分为两类:G1和G2,这两类之间的距离D(G1,G2)满足:D(G1,G2)<T,则称G对于阈值T组成一个类。

设类G包含n个样本,其中X_(t)为m维总体的样本,通常用下面三种特征刻画类:


(1)均值或者质心:
\[{\bar{X}}_G=\frac{1}{n}\sum_{t=1}^{n}X_{(t)}\]
(2)样本离差阵A_G级样本协方差阵S_G:
\[A_G=\sum{t=1}^{n}(X_{(t)}-{\bar{X}}_G)(X_{(t)}-{\bar{X}}_G)',\,S_G=\frac{1}{n-1}A_G\]
(3)类的直径:用D_G表示类G的直径,常用的直径有:
\[D_G=\sum_{t=1}^{n}(X_{(t)}-{\bar{X}}_G)'(X_{(t)}-{\bar{X}}_G)=tr(A_G),\,D_G=\max_{i,j \in G}d_ij\]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群