模型(4.2)与模型2.1和2.2之间的绩效差异向我们展示了增加自由度来解释城市和行业就业模式的有效性。每年,我们都会将数据分为训练集和测试集。这些集合被定义为随机选择的城市和现象对(c、f)列表。其中一些线对属于toR(列车组),而其他线对属于S(测试组)。使用训练数据确定模型参数后,通过预测测试集上的相关变量的准确程度对模型进行比较。我们选择20%作为测试集的大小。将使用均方根误差RMSE评估预测≡vuut | S | X(c,f)∈Syc,f- dyc,f,平均绝对误差,MAE≡|S | X(c,f)∈Syc,f- dyc,f,式中,dyc,fis为预测值。这两个指标都量化了模型的预测准确性,但RMSE对异常值更为敏感,而MAE量化了平均预测误差。感谢F.Neffke提出这些备选方案。比较模型的另一种方法是根据所有可用数据对模型进行拟合,然后根据每个模型的复杂性进行一些统计惩罚,如Akaike信息准则(AIC)或贝叶斯信息准则(BIC),然后选择性能最好的模型(如AIC值最低的模型)。该方法通常渐近等价于上述方法(参见,例如,[117118])。选择“先培训后测试”的方法有两个原因。首先,数据量足够大,可以为列车和测试集提供较大的数据量,以进行交叉验证。这使我们摆脱了AIC或BIC等指标背后的基本假设。