从根节点T.2处的完整培训示例数据开始。给定一个节点Tp(对于“父节点”)和幸存样本集DTp,对于每对s=(ν,r)和1≤ ν≤ d和r∈ R、 将DTpL拆分为两个子集,即数据点的集合DTpL(xi,yi)∈ 其中第ν个分量xi,ν<r,以及由xi,ν定义的集合DTpR≥ r、 我们将s称为拆分,DTpL(s)和DTpR(s)分别称为DTp的相关左拆分和右拆分。请注意,我们可以将自己限制为有限数量的拆分,因为DTp中(xi,yi)只有很多特征值xi,ν,并且我们可以在xi,ν的两个连续值之间任意选择r,例如中间值。3、对于j=1,N、 设πp,jbe为数据点的比例(xi,yi)∈ 对于yi=j的dtpf,同样,对于给定的分裂,设πL,j(s)和πR,j(s)是这些点inDTpL(s)和DTpR(s)的比例。将这些数字收集到三个向量πp(s)中=πp,1(s),πp,N(s),πL(s)=πL,1(s),πL,N(s)同样,对于πR(s),计算每个分裂的纯度增益,定义为G(s):=G(πp)-pL(s)G(πp,L(s))+pR(s)G(πp,R(s)),式中,pL(s):=#DTpL(s)/#DTpand pR(s):=#DTpR(s)/#DTp左拆分和右拆分的DTp点分数。4、最后,选择拆分s*其中纯度增益最大,并用数据集DTpL确定两个子节点Tp、Land Tp、Rw*) 和DTpR*).5、重复步骤2至4,直到每个新节点都有一个关联的数据集,该数据集只包含属于单个名称j的特征数据,或者直到达到节点数量上的某些人工停止标准。很明显,节点实际上可以通过相关数据集进行识别。