大写的Y和N代表每个实例的移动意图。非数学范畴[0,30]年轻[65+∞)old[30,65]middle[30,65]middle[0,30]young[30,65]middle YoungMiddle old numerical numerical0 00图A.2:变量AGEI12Numerical0.4340.806-0.2710.131-0.722-0.288SPEI12Category的一次热编码和二值化示例[-0.722, -0.5022)bin1[-0.5022, -0.2825)bin2[-0.2825, -0.0628)bin3[-0.0628,0.1568)bin4[0.1568,0.3765)bin5[0.3765,0.5962)bin6[0.5962,0.806)bin7bin1 bin2 bin4…数值…0.00 00 00 00 00 00 00 00 0图A.3:SPEIA预印本12个月时间刻度的离散化示例-20201年12月8日25 6列车测试图A.4:10倍交叉验证示例。图A.4显示了第二次折叠的示例。A.2基于树的方法近似使用决策树的学习功能。定义。从根到叶代表分类规则。实例图A.1是使用样本数据集的决策树示例。叶子。每个节点代表对特征的测试,每个分支对应于特征的潜在值。实例在图A.1中的树中,年龄是根节点。这个节点有三个分支(年轻、中等和老年)年轻,干旱很严重,人们有一个移动的意图(移动)。通过选择每个节点上提供最佳数据分割的变量,构建决策树。这种划分基于对每个变量的杂质率(通过计算熵或基尼指数等获得)的测量。最佳变量是杂质率最低的变量。通常,此度量有利于拆分,允许在目标属性上具有优势或(强)区分性标签。模特。