估计的函数用^k表示(-d(i)),^l(-d(i))和^m(-d(i)),其中d(i)∈ {1,2,…,D}表示包含第i个出版商的折叠,以及-d(i)表示我们在训练机器学习模型并生成第i个发布者的预测值时排除了折叠d(i)。然后我们估算了残差^wij=yij-^k(-d(i)条,^vij=情感-^l(-d(i))(第ij条),以及^uij=zij- ^m(-d(i)条。在我们的模型中,我们选择XGBoost作为机器学习算法,该算法通常被认为是许多机器学习任务的最先进算法,并已被数据科学家和研究人员广泛采用(Chen和Guestrin,2016)。按照Chernozhukov等人(2018年)的做法,我们选择D=10。最后,我们通过对估计的残差进行两阶段最小二乘(2SLS)回归来估计β。具体而言,我们首先回归^vijon^uij,并获得预测值^vpredij。然后,我们通过回归^wijon^vpredijj和控制出版商固定效应来估计β。6.3. 负面情绪表达对级联的人口统计学和社会关系的影响基于主模型,我们进一步研究了负面情绪表达对级联中所有用户的人口统计学(即年龄、性别和网络程度)以及他们之间的社会关系的影响。正如我们在第7.2节中详细介绍的,我们测试了消极情绪表达对平均年龄、性别构成、年龄和性别的影响,平均网络度(由用户的平均网络度衡量)我们还使用20倍交叉拟合估计器运行了相同的模型,结果是一致的。Yu等人:在线内容中的情绪影响图2文章级联中嵌入的四种消极情绪表达的影响(A)深度,(B)大小,(C)最大宽度,(D)结构病毒性。注:x轴显示模型系数的大小。