用于选择分析的深层神经网络：一种统计学习理论

nandehutu2022

1175

收藏 2022-06-11

英文标题：
《Deep Neural Networks for Choice Analysis: A Statistical Learning Theory
Perspective》
---
作者：
Shenhao Wang, Qingyi Wang, Nate Bailey, Jinhua Zhao
---
最新提交年份：
2019
---
英文摘要：
While researchers increasingly use deep neural networks (DNN) to analyze individual choices, overfitting and interpretability issues remain as obstacles in theory and practice. By using statistical learning theory, this study presents a framework to examine the tradeoff between estimation and approximation errors, and between prediction and interpretation losses. It operationalizes the DNN interpretability in the choice analysis by formulating the metrics of interpretation loss as the difference between true and estimated choice probability functions. This study also uses the statistical learning theory to upper bound the estimation error of both prediction and interpretation losses in DNN, shedding light on why DNN does not have the overfitting issue. Three scenarios are then simulated to compare DNN to binary logit model (BNL). We found that DNN outperforms BNL in terms of both prediction and interpretation for most of the scenarios, and larger sample size unleashes the predictive power of DNN but not BNL. DNN is also used to analyze the choice of trip purposes and travel modes based on the National Household Travel Survey 2017 (NHTS2017) dataset. These experiments indicate that DNN can be used for choice analysis beyond the current practice of demand forecasting because it has the inherent utility interpretation, the flexibility of accommodating various information formats, and the power of automatically learning utility specification. DNN is both more predictive and interpretable than BNL unless the modelers have complete knowledge about the choice task, and the sample size is small. Overall, statistical learning theory can be a foundation for future studies in the non-asymptotic data regime or using high-dimensional statistical models in choice analysis, and the experiments show the feasibility and effectiveness of DNN for its wide applications to policy and behavioral analysis.
---
中文摘要：
虽然研究人员越来越多地使用深层神经网络（DNN）来分析个人选择，但过度拟合和可解释性问题仍然是理论和实践中的障碍。通过使用统计学习理论，本研究提出了一个框架，以检查估计和近似误差之间的权衡，以及预测和解释损失之间的权衡。它通过将解释损失的度量公式化为真实选择概率函数和估计选择概率函数之间的差异，从而在选择分析中实现DNN的可解释性。本研究还利用统计学习理论对DNN中预测和解释损失的估计误差上界，揭示了DNN不存在过拟合问题的原因。然后对三种情况进行模拟，以比较DNN和二进制logit模型（BNL）。我们发现，对于大多数情景，DNN在预测和解释方面都优于BNL，并且更大的样本量释放了DNN的预测能力，而不是BNL。DNN还用于根据2017年全国家庭旅游调查（NHTS2017）数据集分析出行目的和出行方式的选择。这些实验表明，DNN可以用于当前需求预测实践之外的选择分析，因为它具有固有的效用解释、适应各种信息格式的灵活性以及自动学习效用规范的能力。DNN比BNL更具预测性和可解释性，除非建模人员对选择任务有完整的了解，并且样本量较小。总的来说，统计学习理论可以为未来在非渐近数据领域的研究或在选择分析中使用高维统计模型奠定基础，实验表明DNN在政策和行为分析中的广泛应用是可行和有效的。
---
分类信息：

一级分类：Economics 经济学
二级分类：General Economics 一般经济学
分类描述：General methodological, applied, and empirical contributions to economics.
对经济学的一般方法、应用和经验贡献。
--
一级分类：Quantitative Finance 数量金融学
二级分类：Economics 经济学
分类描述：q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学，包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
PDF下载：
-->

Deep_Neural_Networks_for_Choice_Analysis:_A_Statistical_Learning_Theory_Perspective.pdf
大小:(2.6 MB)

马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

nandehutu2022

2022-6-11 00:36:40

深度神经网络用于选择分析：非统计学习理论视角Shenhao Wangqiyi WangNate BaileyJinhua Zhao麻省理工学院Ugust 2019摘要尽管研究人员越来越多地使用深度神经网络（DNN）来分析个人选择，但过度拟合和可解释性问题仍然是理论和实践中的障碍。通过使用统计学习理论，本研究提出了一个框架来检验估计与近似误差之间以及预测与解释损失之间的权衡。它通过制定解释损失的度量，即真实选择概率函数和估计选择概率函数之间的差异，来操作选择分析中的DNN解释性。基于DNN的选择模型的解释依赖于函数估计和自动效用规范，与依赖于参数估计和手工能力规范的传统选择模型的解释相反。本研究还利用统计学习理论对DNN中预测和解释损失的估计误差进行了上界，从而揭示了为什么DNN不存在过度拟合问题。然后对三种场景进行模拟，以比较DNNto二进制logit模型（BNL）。我们发现，DNN在大多数场景的预测和解释方面都优于BNL，并且更大的样本量释放了DNN的预测能力，而不是BNL。DNN还用于根据2017年全国家庭旅游调查（NHTS2017）数据集分析出行目的和出行方式的选择。这些实验表明，DNN可以用于当前需求预测实践之外的选择分析，因为它具有固有的效用解释、适应各种信息格式的灵活性以及自动学习效用规范的能力。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

能者818

2022-6-11 00:36:44

DNNis比BNL更具预测性和可解释性，除非建模人员对选择任务有完整的了解，并且样本量较小（<10）。总的来说，统计学习理论可以为未来在非渐近数据领域的研究或在选择分析中使用高维统计模型奠定基础，实验表明DNN在政策和行为分析中广泛应用的可行性和有效性。关键词：深层神经网络、选择建模、统计学习理论、可解释性1。简介选择建模是一个丰富的理论领域，广泛应用于整个交通研究以及许多其他领域[61、7、62]。虽然传统的离散选择模型已用于decades，但由于这些模型在许多领域的高性能，研究人员最近对使用机器学习分类器进行选择分析越来越感兴趣【34、48、27】。传统的离散选择模型依赖于研究人员使用领域知识来过滤各种模型规格，并找到最符合观测数据的模型。机器学习分类器可以改进这种方法，因为它们具有自动探索和非凡的近似能力。通过使用灵活的模型族假设，许多机器学习方法的逼近能力远远高于离散选择模型，离散选择模型通常被限制为具有手工特征的线性参数形式（如二次或对数形式）。在所有机器学习分类器中，深层神经网络（DNN）由于以下几个因素而特别强大。它具有很高的近似能力【33、32、19】，可以灵活地容纳各种类型的信息【37、38】，如实验研究所示，它具有很高的预测能力【23、34】，并已应用于许多领域【38、26、24】。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-6-11 00:36:47

然而，有两个尚未解决的问题阻碍了DNN在许多运输选择分析环境中的适用性：相对较小数据集中的模型过度设置，以及缺乏可解释性。将DNN应用于运输选择分析研究的第一个问题是其对该领域通常可用的小型数据集的超拟合模型的潜力。一个过度拟合的模型精确地描述了培训数据，但样本外性能较差。经典统计理论表明，Vapnik-Chervonenkis（VC）维度（模型复杂性的度量）必须相对于样本量小，以避免过度拟合[64，63]。然而，使用DNN的场景通常处于非渐近区域，其中经典渐近假设不成立【66】。虽然越来越多的交通研究使用DNN来预测出行选择，即使是在小数据集上也具有很高的准确性【34、27、14、21、44、52、67】，但这一理论问题仍然没有解决，并且在使用DNN进行选择分析时，对于哪些情况可能导致过度匹配问题，没有实用指南。DNN在运输选择应用中的第二个问题是其缺乏可解释性。预测是所有建模的一个典型重点，无论是通过离散选择模型还是机器学习分类器进行，但许多交通应用也需要解释。可解释性对研究人员很重要，他们试图了解模式份额、弹性、边际替代率和社会福利的发现，以及公众，其中可解释性被发现有助于建立信任[41]，并向用户解释结果[22]。DNN通常被定义为“黑箱”模型，在所有机器学习分类中，它被列为可解释性较低的模型【36、41、70】。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-11 00:36:50

以前大多数使用DNN进行交通选择建模的研究都只局限于使用DNN预测模式选择、活动选择、汽车拥有量或其他个人选择[30、68、14、15、47、27]。只有少数运输研究涉及到DNN在choicemodeling中的可解释性，但没有提供明确的指标来衡量可解释性的质量【53，9，27】。DNN模型的可解释性，尤其是与离散选择模型相比，将是决定这些方法是否可以扩展到需求预测之外的交通环境的关键因素，并对我们理解个人决策行为具有实际意义。本文试图通过建立一个由两个维度组成的统计学习理论框架来解决这两个问题。第一个维度是估计和近似误差的分解。我们证明，选择模型中使用的DNN架构的估计误差不是很大，解决了第一个过度匹配问题。证明了DNN中参数的大小比非渐近估计误差上界中参数的个数更重要。第二个维度涉及预测和解释损失。特别是，我们通过制定衡量解释损失的指标来证实解释的概念，作为预测损失的对应物。在我们的公式中，解释损失是通过真实选择概率函数和估计选择概率函数之间的差异来衡量的，因为所有有价值的经济信息都可以从该函数中得到。DNN中的模型可解释性依赖于基于自动学习效用规范的全选择概率函数。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-6-11 00:36:53

这与传统的选择模型形成鲜明对比，传统的选择模型是通过为效用函数选择的各个参数来解释的。通过这种解释损失的新概念，我们可以从预测和解释损失两个方面对模型进行评估，使我们能够评估和展示DNN作为选择分析研究的强大预测和解释工具的潜力。为了阐明这一理论框架，我们通过四个实验将DNN与具有代表性的离散选择建模方法二进制logit模型（BNL）进行了比较。其中三个实验使用合成数据并结合蒙特卡罗模拟，说明了在不同样本大小和输入维度下，预测误差和估计误差之间以及解释和预测损失之间的权衡。最后一个实验使用了2017年全国家庭旅行调查（NHTS 2017）的数据，以阐明这一新理论框架的实际相关性，使我们能够为未来DNN在选择建模研究中的应用提供实际建议。在所有这些实验中，选择BNL与DNNBE进行比较，因为BNL比其他DCM（如嵌套和混合logit模型）更类似于DNN。虽然BNL只是DCM的一个成员，但本文的发现也可以扩展到本文中未用于比较的DCM。本研究首次引入了基于DNN的选择分析的统计学习理论的统一框架。该框架完善了非渐近数据体系，并为高维数据的选择建模奠定了基础，而经典统计工具无法充分分析高维数据。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

mingdashike22

2022-6-11 00:36:56

我们回应了DNN中的两个关键问题：过度拟合和可解释性，这可以指导设计实验、进行调查、培训模型以及在基于DNN的选择模型中提供政策建议的过程。我们的实验阐述了DNN何时以及为什么优于经典多项式logit模型，并为未来的研究提出了具体的建模建议。本文中的理论和实验说明了DNN模型的可预测性和可解释性，并证明了其在需求预测之外以及在通常为离散选择模型保留的领域（如政策和行为分析）中的应用。本文的组织结构如下。在第2节中，我们更详细地描述了我们的框架的理论背景和相关的过去研究。在本节中，我们制定了可用于DCM和DNN的解释评估指标，然后使用统计学习理论来描述由近似误差和估计误差以及预测和解释损失之间的双重权衡产生的四个象限。每个象限的介绍之后是对之前与它们最相关的研究的回顾。在第3节中，我们描述了我们对合成数据的三个模拟实验，说明了四个象限之间的权衡动态。然后，我们将我们的框架应用于NHTS数据，并讨论结果。第4节总结了本文，并对影响和未来研究进行了评论。2、理论与文献综述2.1。使用统计学习理论建立基于DNN的选择模型。Let s（xi）表示个人i从{0，1}个备选方案中选择备选方案1的概率，以及包括备选方案和个人特定变量的输入：s（xi）：Rd→ [0, 1].

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

大多数88

2022-6-11 00:36:59

个人选择易学∈ {0，1}是一个贝努利随机变量，具有选择备选方案1的s（xi）概率。这种软决策规则是选择分析中常见的假设，它比不涉及概率决策的硬决策规则更通用。让f（xi）：Rd→ {0，1}表示硬决策规则映射。让Fdenote表示由前馈DNN表示的模型类，逐层特征转换Φ（xi，w）=（gmo ...g级o g）（xi），其中gj（x）=ReLU（hWj，xi），表示DNN中的一个标准模块，由ReLU激活和线性变换组成。当DNN应用于二元选择情况时，选择概率s（xi，w）变为（xi，w）=σ（Φ（xi，w））=1+e-Φ（xi，w）（1），其中σ是Sigmoid激活函数，w代表DNN中的所有系数。注意，Φ与确定性效用差异V相似- Vin选择型号。Φ越大，个体i越可能选择备选方案1而不是0。让Frepresent表示BNLandΦ（xi，w）=hw的模型类，xii表示BNL中的线性特征映射。可以看出，BNL是DNN的特例（见附录I）：F F、 BNLis中s（xi）的选择概率与方程1相似，只是用Φ替换Φ。设S={xi，yi}Ni=1表示样本；N样本量；x个~ Px（x）x的数据生成过程；和s*（x），f*（x），和w*带有Softmax或Sigmoid激活函数的trueAn渐近软决策规则成为硬决策规则。模型和参数。经验风险最小化用于获得其估计值：^s（x）、^f（x）和^w.definition 1。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-6-11 00:37:03

经验风险最小化（ERM）定义为asminf∈F^L（F）=最小值∈FNNXi=1l（yi，f（xi））（2）基于ERM的估计量定义为^f=argminf∈F^L（F）=argminf∈FNNXi=1l（yi，f（xi））（3）在训练ERM时，选择特定的预期损失函数L（y，x）=Ex，y[L（y，f（x））]至关重要。一种常见的选择是对数损失，这与经典的最大似然估计有关。为了了解任何估计器的样本外性能，我们需要检查异常：定义2。^f的过度误差定义为【L（^f）】- L（f*)] （4） ^s的定义为【L（^s）】- L（s）*)] （5） L（^f）和L（^s）是估计量的总体误差，而L（f*) 和L（s）*) 是真实模型的populationerror。超额误差衡量估计量的误差偏离真实模型的程度，在随机抽样S上取平均值。超额误差的严格上界可以保证可靠的样本外性能。在下面的讨论中，我们将主要使用f*和^f作为运行示例，但以下所有参数都适用于s*和^s.超额误差可分解为估计误差和近似误差，如下所示。ES[升（华氏度）- L（f*)] = ES[升（华氏度）- L（f*F） ]+ES[L（F）*F）- L（f*)] （6）其中f*F=argminf∈FL（f），函数类f中的最佳函数，近似于f*.定义3。估计误差指的是toES【L（^f）】- L（f*F）（7）定义4。近似误差指的是toES[L（f*F）- L（f*)] （8）估计误差是方程6中的第一项，近似误差是第二项。估计误差是一个衡量^f是否超过fits的量：非常大的L（^f）- L（f*F）意味着严重的过度匹配。由于估计误差有一个^f项，它从采样和训练中捕获随机性。近似误差更具确定性，仅捕获最佳函数f之间的差异*Fin函数类F和真函数F*.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-6-11 00:37:05

以下四小节将依次介绍DNN的预测损失、解释损失、近似误差和估计误差。2.2. 预测损失定义5。预测损失定义为L0/1（f）=Ex，y[{y 6=f（x）}]（9）经验预测损失定义为^L0/1（f）=NNXi=1{yi6=f（xi）}（10）预测损失无疑是评估预测绩效最常用和最广泛使用的指标。几乎所有使用机器学习分类器预测任何旅行相关决策的研究都基于样本外预测损失来评估其模型【17、60、48、1、27、14、30】。使用预测损失作为评估指标的做法也主导了其他应用机器学习分类器解决实际问题的领域【37、38、28】。一些经验性的Albenchmark论文使用预测损失作为评估指标，比较了数百个模型和数据集的性能，从而得出了可概括的结论[23，36]。我们的研究还将使用该预测损失来评估模型的预测性能。2.3. 解释损失定义6。解释损失定义为真实和估计选择概率函数之间的差异*- s | | L（Px）=Zx（s*（十）- s（x））dP（x）（11）经验解释损失定义为^Ls（s）=NNXi=1（s*（xi）- s（xi）（12）解释损失通过真实和估计选择概率之间的差异来衡量，在域X上进行积分，并通过Px（X）进行加权。我们选择使用这种测量方法，因为研究人员可以通过选择概率函数s（x）获得最重要的经济信息。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-11 00:37:09

例如，选择备选方案1相对于价格xjc的概率导数可以计算为导数dxj（x）；其相关弹性isd log s（x）d log xj；行程时间节省值（VTT）可计算为两个导数Ds（x）/dxj1ds（x）/dxj2的比值；效用差异可以通过使用倒S形函数V来计算- V=σ-1（s）；或者，备选方案1的经验市场份额可以通过PNI=1s（xi）来计算。因此，一个精确的函数估值器^s（x）可以帮助恢复弹性值、边际替代率（如VTT）、市场份额、效用值和社会福利，它们提供了实践中所需的大部分经济信息。必须看到，我们关注的是函数估计^s（x），而不是参数估计^w，这是大多数计量经济学模型的传统关注点。DNN几乎不可能专注于参数估计，原因至少有三个。首先，一个简单的前馈DNN很容易有上万个参数，而这个庞大的数字使得研究人员无法讨论单个参数。其次，DNN具有称为参数空间对称性的特性【11】，这意味着不同的参数可能导致相同的选择概率函数s（x）。因此，在DNN中解释单个参数w是真空的。第三，研究表明，语义信息不能从单个神经元中揭示出来，而是从DNN中每一层的空间中揭示出来[59]。大量研究使用DNN中的函数估计器进行解释，而没有一项研究使用单个神经元/参数[43、31、3、56]。Mullainathan和Spiess【45】认为，ML分类（包括DNN）与计量经济学模型在本质上是不同的，因为ML分类侧重于^y，而计量经济学模型侧重于^w。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-6-11 00:37:12

这通常是正确的；然而，在DNN的情况下，选择概率函数^s（x）的准确估计器可以满足我们传统上通过使用^w实现的大多数解释目的。事实上，运输领域的一些研究已经可视化或计算了选择概率函数的梯度信息，以解释ML分类，支持我们基于选择概率函数对解释损失的定义[53、9、27]。此外，解释弹性Dsdxjis的过程与在MLcommunity中使用输入梯度的讨论相同【3，43】。因此，将重点从参数估计转移到函数估计，使研究人员能够在选择分析的背景下解释DNN结果，这种转移是不可避免的，也是可取的。虽然我们对解释损失的定义通过选择概率函数捕捉到关键经济信息，但这并不是定义解释损失的唯一方法。Lipton（2016）[41]讨论了可解释性的多个方面，包括可模拟性、可分解性、算法变换性和事后可解释性。我们对解释损失的定义侧重于仅限于经济信息的事后解释性，而不涉及解释性的其他方面以及通过事后解释方法获得的其他类型的信息【54、43、31】。尽管我们的方法与长期的选择建模传统保持一致，但正如Bertsimas等人（2019）最近的一份工作文件所示，我们有可能以其他方式确定解释损失。2.4. 近似误差，因为BNL是DNN（F）的一个子集 F）（如图1所示），DNNis的近似误差总是小于BNL【64】。直观地说，最佳模型（f*F）在Fis中也在F中，所以通常F是正确的*Fcan近似值f*优于f*F

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

大多数88

2022-6-11 00:37:15

形式上，提案1。DNN中预测损失的近似误差总是小于BNLES[L0/1（f*F）- L0/1（f*)] ≤ ES[L0/1（f*F）- L0/1（f*)] （13）同样，DNN中解释损失的近似误差也小于inBNL：ES[Le（s*F）- Le（s）*)] ≤ (s)*F）- Le（s）*)] （14）虽然这些结果不难看到，但可以从各种数学视角来理解。第一个观点是20世纪90年代发展起来的DNN的普遍逼近定理。研究表明，当宽度变为有限时，即使是浅层神经网络（SNN）也是一个渐近通用近似器[19、33、32]。最近，这个渐进的视角引出了一个更为非渐进的问题，即为什么深度对于SNN对于实际用例来说足够强大是必要的。研究表明，在许多情况下，DNN可以用比SNN少的指数级神经元数来近似函数[18、55、51]。这一观点与我们的重点非常相关，因为BNL是SNN的一种类型[9]。NN和BNL之间的选择可以等效为DNN和SNN之间的选择。X0X1ZY 0Y 1（a）F0单层稀疏神经网络（BNL）X0X1ZY 0Y 1（b）F1深层密集前馈神经网络（DNN）图1。BNL和DNN两种体系结构；第一个图表示具有线性规格的BNL，第二个图表示DNN。从视觉上看，DNN是BNL的扩展，其函数类也是BNL的扩展。两个图中的红色神经元都是效用值的可视化对象，而DNN中的蓝色神经元则是指定效用的过程。除了这些数学观点外，我们还强调了描述BNL和DNN之间相似性的经济观点，以及它们在自动和手工实用规范之间的差异。BNL和DNN在分类上是相似的，因为两者都涉及指定和比较效用值的过程。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-6-11 00:37:18

选择建模设置中的效用规格和比较的概念是众所周知的【62，7】，但它们也可以应用于NN。事实上，DNN的最后一层可以命名为公用设施，最后一层之前的层可以视为公用设施规范。然而，他们的主要区别在于，传统的BNL方法使用基于专家先验知识的手工实用规范，而DNN则基于复杂模型假设自动学习实用规范。因此，虽然我们的研究仅讨论BNL的线性效用规范，但BNL和DNN广泛体现了两种效用规范范式。任何形式的手工特征，例如合并二次项或对数项，都可以始终用作DNN的输入，从而实现额外的自动学习能力。在许多任务中，自动特征学习几乎是不可避免的，例如人脸识别，在这些任务中，手工制作人脸特征似乎几乎是不可能的[45]。ML社区的研究通常称赞这种自动特征学习的威力，尽管研究人员是否应该只依赖自动特征学习，还是应该依赖自动和手工特征学习的混合，这仍然是一个激烈的争论【38、8、40】。然而，底线是，纯手工实用性规范将无法最大限度地提高数据的预测和解释能力，使用或至少增强DNN中自动特征学习的能力可能会极大地增加未来的建模实践。2.5. 估计误差更具挑战性的问题是DNN的估计误差，特别是因为较小的近似误差总是与较大的估计误差相关。具体而言，问题是当DNN的参数数量过大时，它是否具有良好的有界估计误差。为了解决这个问题，我们将给出两个证明。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-11 00:37:21

虽然两者都依赖于经验过程理论，但第一种方法使用的是收缩不等式，它比第二种基于VC维度的证明提供了更严格的上界。基于经验过程理论的证明表明，DNN中预测和解释损失的估计误差可以是有界的，或者至少由土地规则化控制。我们认为这一部分是至关重要的，因为经验过程理论为依赖于用于个人选择建模的高维统计工具的未来研究提供了新的基础。我们在下面的章节中只列出了关键命题，附录II中提供了详细的证明。定义7。经验Rademacher复杂性定义为^Rn（F | S）=Ehsupf∈FNNXi=1if（xi）一（15）我∈ {+1, -1} 概率为[0.5，0.5]；F | SDE注意到投射到样本S的函数类F。命题2。^f的估计误差可由Rademacher复杂度上界[L（^f）- L（f*F） ]≤ 2ES^Rn（lo F | S）（16）提案2的证明见附录II。A、 Rademacher复杂性度量数据集S上函数类F条件的复杂性。命题2表明，估计误差可以由函数类l的复杂性上界oF、定义为loF={lof（x）| f（x）∈ F} 。直观地说，随着函数类f变得更大，很难搜索最佳模型^f。Italso与传统统计学一致，因为VC维度越高或参数越多（函数类越复杂），估计误差越大。具体而言，命题2可用作预测和解释损失估计误差的上限：命题3。预测损失的估计误差可以（间接）为上界[L0/1（^f）-^Lγ（^f）]≤γES^Rn（F | S）（17）命题4。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-6-11 00:37:24

解释损失的估计误差可以是上界byES[Le（^s）- Ls（s）*F） ]≤ 4ES^Rn（F | S）（18）命题3和命题4的证明见附录II。B和II。C、命题3通过使用γ-裕度误差（定义见附录II.B），提供了ES[L0/1（^f）]的上限。而左手侧与ES不完全相同[L0/1（^f）- L0/1（f*F），则γL（F）和γES^Rn（F | S）都可以在实践中计算。与预测损失的估计误差相比，解释部分更容易，命题4表明，解释损失的估计误差由Rademacher复杂度上界，直到一个常数。剩下的一个问题是如何为DNN的Rademacher复杂性提供有效的上界。提案5。设Hdbe是域X（X）上深度为D的一类神经网络∈ B（d）），其中每个参数矩阵Wjhas Frobenius范数最多为MF（j），其一个完整范数最多为M（j），并具有ReLU激活函数。然后利用收缩不等式，DNN（F）的拉德马赫复杂度可以上界为^Rn（F | S）。O(√对数d×QDj=12M（j）√N）（19）文献[25]中发现的最紧密的界限是：Rn（F | S）。√日志d×(√2对数D+1）×QDj=1MF（j）√N（20）提案6。具有0/1损失的DNN的Rademacher复杂度可由VC维数^Rn（l）上界o F）。4rv log（N+1）N.4rT D log（T）×log（N+1）N（21），其中T表示参数总数，D表示DNN的深度【6】。命题5描述了影响估计误差上界的重要因素，包括输入维度d、各层M（j）或MF（j）的参数范数以及样本大小。结果是直观的：样本量越大，输入维数和参数范数越小，DNN的估计误差越有界。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-6-11 00:37:27

附录II提供了命题5和命题6的证明。D和II。E、命题5和命题6之间的差异揭示了关于估计误差的最重要信息：研究人员不必像命题6那样计算v和N的比率，而可以像命题5那样计算每一层系数对估计误差上限的范数。当研究人员选择一种特定的DNA体系结构时，参数的总数是固定的，因此很难通过VC维度控制Rademacher的复杂性。相反，各层M（j）中的权重规范可以通过颜色规则化来控制。因此，命题5以及命题3和命题4提供了有效且比传统VC维度视角更严格的估计误差上界。上述结果在很大程度上依赖于近二十年来非渐近统计学习理论，尤其是经验过程理论的进展。一般介绍参见【12、65、2、66、63】；对[64，63，57，6]关于基于VC维数的DNN的Rademacher复杂度界的证明；关于基于收缩不等式的DNN的Rademacher复杂性界的证明，参见[25，46，5，4]。2.6. 到目前为止，我们已经为两个维度和四个象限提供了具体的数学公式和理论讨论，这些定义了我们的理论框架，如表1所示。从历史的角度来看，这两个方面都很重要。估计和近似误差之间的权衡是统计学习理论中的一阶分解[64、63、65]。正如LeoBreiman（2001）[13]指出的那样，预测与解释标志着两种统计文化的差异，最近Mullainathan和Spiess（2017）[45]再次指出了这一点。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-6-11 00:37:30

在我们的研究中，从理论角度来看，这两个维度可以用来连接经典的低维LDCMS和新的高维DNN模型。近似误差估计误差预测损失预测损失近似误差*F）- L0/1（f*)]预测损失估计误差[L0/1（^f）- L0/1（f*F）解释损失近似解释损失误差*F）- Le（s）*)]解释损失估计误差- Le（s）*F）表1：理论框架的两个维度3。实验3.1。实验设计实验包括两部分：一部分是三个模拟数据集，另一部分是NHTSdataset。模拟数据集和真实数据集的实验在其目的方面是互补的。通过蒙特卡罗模拟，底层真实数据生成过程（DGP；例如*（x）或f*（x））是已知的，因此我们可以计算与s相关的近似和估计误差*（x）和f*（x），这在真实数据集的实验中无法完成。另一方面，真实的数据集揭示了真实的决策过程，在蒙特卡罗模拟中，有时必须对其进行任意假设。在这两个实验中，我们将具有固定超参数的DNN架构与具有线性效用规范的oneBNL模型进行了比较。DNN结构有5层，每层100个神经元，以及ReLU激活功能。DNN培训使用标准ERM程序，包括初始化（29）、Adam优化（35）和轻度正则化。所有oursimulations中的BNL仅使用线性规格。同样，BNL的这种线性规范并不限制我们讨论的一般性，因为任何基于领域知识的实用规范都可以作为输入提供给DNN。DNN的理论性质与参数和超参数的具体选择没有太大差异。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

能者818

2022-6-11 00:37:33

BNL和DNN广泛代表了手工和自动公用设施规格之间的差异，BNL型号和DNN的规格选择对于本研究而言并不重要。蒙特卡罗模拟实验包括三个场景，代表了研究人员在现实中面临的三个典型案例。这三种情况因实际DGP相对于Fand F的“位置”不同：（1）F*∈ 风扇f*∈ F（2） f级*6.∈ 风扇f*∈ F（3） f级*6.∈ 风扇f*6.∈ F、场景1表示一个简单的BNL是真正的DGP的情况，它属于BNL和DNN的两个模型类，因此BNL和DNN的近似误差均为零。Secnario 2表示真实DGP比BNL更复杂的情况，因此BNL的近似误差大于零，而DNN的近似误差仍然为零。场景2通常发生在信息完整，而modeltraining中使用的功能在choice建模中指定错误的情况下。情景3表示两个BNLand DNN都有严格的正近似误差，当忽略重要变量时会发生这种误差，传统上称为忽略变量偏差。就f、f和f之间的函数关系而言*, 这三种情况都是详尽无遗的。我们的模拟还改变了样本大小和输入变量的数量，以证明估计误差是如何变化的，这基于我们关于DNN测试误差的理论（命题5）。蒙特卡罗模拟中的样本量从100个（调查中可能最小的一个）到100万个（现有基于交通调查问卷或观察性调查中观察到的最大数量）。输入变量的数量是20或50，这在选择分析中很典型。对于每个实验，我们分析预测和解释损失的四个象限、估计和近似误差，映射回表1中的理论框架。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-6-11 00:37:36

模拟的更多细节见附录III。NHTS数据集的实验分析了出行模式选择和出行目的选择，这是过去研究中分析的两种流行出行行为【20、69、16】，样本大小从100到50万不等。之所以选择NHTS数据集，是因为它覆盖了整个美国，并且是仅有的样本量在100万量级的数据集之一。由于缺乏真实的数据生成过程，估计和近似误差的分解对于真实数据集的实验是不可能的，但我们讨论了基于DNN的选择模型的预测和解释。3.2. 三个模拟数据集实验3.2.1。场景1在场景1中，s*（x） =σ（hw，xi），其中σ是Sigmoid函数，w是随机生成的变量，取{-1，+1}值的概率相等，x生成为多元高斯分布。在图2中，上排显示了模拟的预测损失（图2a和2b）和解释损失（图2c和2d），以及20和50个输入变量。在每个子图中，y轴代表预测或解释损失的值；x轴表示样本大小；每个点是一个训练结果，红色代表DNN，蓝色代表BNL；红色和蓝色曲线是样本量条件下损失的平均值。黑色虚线表示可能的最小损失，用于测量每个DGP中的随机性量。在场景1中，红色曲线和黑色虚线之间的间隙是估计误差，因为它正好是ES[L（^f）- L（f*F）】。黄色曲线表示基于命题5的估计误差理论上限。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

能者818

2022-6-11 00:37:39

图2的下一行显示了选择概率和输入变量之间的关系，输入变量的样本大小从100到1000000不等。在每个子图中，黑色曲线代表真实的s*（x）；每条红色曲线表示DNN的估计函数^s（x），每条蓝色曲线表示BNL的估计函数^s（x）。随着样本量的增加，DNN和BNL中预测和解释损失的估计误差均收敛到零，DNN估计误差的收敛速度仅略慢于BNL，如图2a至2d所示。毫不奇怪，估计误差总是随着样本量的增加而减少，因为等式17和18意味着较大的样本量会导致较小的样本外预测和解释损失。在场景1，f中是什么*Fis与f相同*. 因此L（f*F）由黑色虚线表示（a）预测损失（20 Var）（b）预测损失（50 Var）（c）解释损失（20Var）（d）解释损失（50Var）（e）选择概率曲线（20 Var）；样本量=100、1000、10000、100000、1000000图。2、场景1。上排：比较DNN和BNL的预测和解释损失；下一行：可视化选择概率如何随输入变化；红色曲线：DNN，蓝色曲线：BNL，黑色曲线：真实模型。上一行中的图与表1中的理论框架对应：红色和黑色曲线之间的差异是DNN的预测/解释损失，由于近似误差为零，因此仅等于这种情况下的估计误差。令人惊讶的是，DNN的收敛速度仅略慢于BNL，尤其是从经典统计角度来看，因为DNN中的参数数量是简约BNL模型的2000倍。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

能者818

2022-6-11 00:37:43

更准确地说，我们的DNN体系结构的VC维v=50000×5×log（50000）’300万（方程式21），这比我们使用的任何样本量都大，远远不同于经典的渐近数据体系。相反，基于收缩不等式（命题5和命题6）的理论上界用黄色曲线表示，该曲线比基于VC维的曲线更紧，尽管与模拟结果相比，它仍然很松散。因此，仿真结果与我们的理论讨论一致，即DNN中的参数数量不应用于测量其估计误差界。根据经验，DNN和BNL需要大致相同数量的数据才能进行准确的解释和预测。对于20或50个变量，至少需要约10个样本，以便DNN的预测和解释损失接近理论最小值。虽然这10个样本量略大于问卷调查通常获得的样本量，但并非无法达到；例如，NHTS数据集有大约700000个观测值，远远大于10个。（a）预测损失（20 Var）（b）预测损失（50 Var）（c）解释损失（20 Var）（d）解释损失（50 Var）（e）选择概率曲线（20 Var）；样本量=100、1000、10000、100000、1000000图。3、场景2。上排：比较DNN和BNL的预测和解释损失；下一行：可视化选择概率如何随输入变化；红色曲线：DNN，蓝色曲线：BNL，黑色曲线：真实模型。上排中的图映射到表1中的理论框架。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-6-11 00:37:45

与情景1不同，BNL有近似误差，因为蓝色曲线不能收敛到理论最小值，而DNN没有近似误差。为了解释DNN结果，我们可视化了^s（x）和一个输入变量xj之间的关系，如图2e所示。在一些研究中，这种可视化^s（x）对xjh的敏感性的方法被用于解释DNN结果【53、9、43】。同样，DNN估计的^s（x）很快收敛到真实的s（x），它捕获了s形选择概率曲线和线性效用规范，即使它不是先验的线性规范。总的来说，当研究人员非常确信先前的专家知识已经捕捉到了每一条信息时，具有手工特征的BNL在预测和解释方面表现得更好，尽管DNN只略差一点。3.2.2. 情景2A更现实的情况是研究人员无法正确指定效用函数的情景。在场景2中，s*（x） =σ（wφ（x）），其中φ（x）采用二次变换：φ（[x，x，…，xd]）=[x，x，…，xd，x，x，…，xd]）。那么BNL FHL为误指定错误，而NN FD不是。结果如图3所示，图3的格式与图2完全相同。在场景2中，DNN在预测和解释损失方面占主导地位，即使样本量相对较小，如图3a至3d所示。DNN占优势的关键原因是它的零近似误差，而BNL的大近似误差是通过理论最小值和蓝色曲线收敛到的损耗值之间的差距来测量的。样本量仍然是BNL和DNN的一个关键因素，尽管这两个因素的临界量有所不同。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-6-11 00:37:49

BNL收敛到其最佳值（f*F）只有大约10个观测值，而DNN收敛到其最佳值（F*F=F*) 当样本量达到10或10左右时。这一结果与我们的理论讨论非常一致。BNL与经典统计一致，由于v/N较小，其估计误差较小。这一结果还表明，像BNL这样的低维统计工具无法发挥大样本数据集的预测能力。只有像DNN这样非常复杂的模型才能充分发挥大样本的预测和解释能力。图3e显示了^s（x）和具有不同样本大小的输入变量x之间的关系。由于功能错误，即使样本量变得非常大，BNL也不可能恢复真实模式，而DNN凭借自动实用规范的能力，即使没有事先的领域知识，也可以逐渐了解潜在的真实实用规范。与图3c和3d一致，DNN需要大约10和10的样本量来恢复选择概率函数的真实模式。由于BNL中的误判及其相应的近似误差，即使样本量非常小，DNN也有可能在预测和解释方面优于BNL。3.2.3. 场景3A更现实的情况是，研究人员既不能收集全部信息，也不能正确指定效用函数（f*6.∈ 风扇f*6.∈ F）。在场景3中，s*（x） =σ（wφ（x）），其中φ（x）=[1，x，x，…，xd，x，x，…，xd，xx，…，xd-1xd]，包括二次变换和相互作用项。制作f*6.∈ F、在训练中，我们从20个变量中随机抽取5个变量，从50个变量中随机抽取20个变量，这样即使F*Fcannot近似值f*好

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-6-11 00:37:52

结果如图4所示，格式与前面的相同。如图4所示，结果与场景2中的结果非常相似，只有一个关键差异，即DNN也存在近似误差。DNN的近似误差由理论最小值与DNN收敛到的预测和解释损失值之间的差异测量：由于存在近似误差，红色曲线不再收敛到理论最小值，如图4a-4d所示。这也是一个重要的信息，即DNN虽然经常被称为通用近似器，但仍能避免忽略变量等威胁。如果信息不完整，DNN不太可能接近基本的*（x）嗯。然而，图4e表明，DNN仍然可以很好地捕捉到关于观察变量的选择概率函数，即使忽略了变量。当样本量达到10或10时，红色曲线（DNN）可以近似真实的钟形选择概率函数。（a）预测损失（20 Var）（b）预测损失（50 Var）（c）解释损失（20 Var）（d）解释损失（50 Var）（e）选择概率曲线（20 Var）；样本量=100、1000、10000、100000、1000000图。4、场景3。上排：比较DNN和BNL的预测和解释损失；下一行：可视化选择概率如何随输入变化；红色曲线：DNN，蓝色曲线：BNL，黑色曲线：真实模型。与情景1和2不同，BNL和DNN都有近似误差，因为红色曲线无法收敛到理论最小值。总的来说，此场景表明DNN无法解决所有问题。“universalapproximator”声明仅适用于观察到的信息的函数形式，因此只有在模型中观察到所有信息时才适用。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-6-11 00:37:56

然而，即使忽略了信息，DNN在预测和解释方面仍优于BNL，因为它能够将观察到的信息延伸到未观察到的信息，并且能够自动学习效用规范。3.3. NHTS数据集的实验选择NHTS数据集是因为其广泛的地理覆盖范围（全美国）、大样本量（780000次旅行）和大量的输入变量，使我们能够观察预测精度随样本量和输入变量的变化。NHTS数据集的10%用于测试模型性能。为了与我们的模拟形成一个平行的讨论，NHT实验改变了样本大小（从100到500000）和输入变量的数量（20和50）。选择的输入变量是决定模式选择和跳闸目的的最重要变量。结果如图5所示，格式与前一个类似，但有两个不同之处：自s*（x）（a）模式选择预测（20个变量）（b）模式选择预测（50个变量）（c）出行目的预测（20个变量）（d）出行目的预测（50个变量）（e）选择概率变化w.r.t.出行距离（从左到右：样本量100、1000、10000、100000500000）图5。NHTS数据集。上排：比较DNN和BNL在预测出行模式选择和出行目的中的预测损失；下一行：可视化选择概率如何随输入变化。近似误差不再可用，因为理论最小值也未知。有趣的是，从5c到5d的数字显示了混合场景1和场景2的模式：当样本量为10左右时，BNL优于DNN，而当样本量大于10时，DNN开始优于BNL。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-6-11 00:38:00

BNL的收敛速度非常快，大约在10个样本大小时停止，而DNN的收敛仍然不清楚，因为当样本大小达到50万时，红色曲线仍有下降趋势。这再次证明，只有非常大的样本量才能发挥DNN的全部预测能力，尽管即使在问卷调查中，10个样本量也不是无法达到的。这些结果还表明，手工编制的实用程序规范已经捕获了某些信息，因为当样本量相对较小时，它的性能更好，尽管它没有捕获数据集中所有可能的信息，但当样本量较大时，它的性能更差。显然，DNN的逼近误差小于BNL，但DNN的估计误差也不大。图5e显示了驾驶概率如何随行程距离变化。结果与我们在场景2和场景3中的发现非常相似，因为当样本量达到时，DNN开始收敛，当样本量等于10或10时，其模式变得非常稳定。DNN和BNL之间的差异再次表明BNL中存在近似误差。DNN和BNL的驱动概率函数相似且直观，因为两者都是单调递增的，而DNN似乎比BNL捕捉到了更多的微妙之处：BNL表示近似线性关系，而DNN描述了对行程距离变化的敏感性大致降低的关系。这种敏感性的降低是非常直观的，因为人们不太可能改变他们的驾驶行为，因为旅行距离已经足够大了。结论与讨论本研究讨论了DNN何时以及为什么可以应用于选择分析，重点是回答DNN面临的非过度匹配和可解释性挑战。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

大多数88

2022-6-11 00:38:03

提出了一个理论框架来描述估计误差和近似误差之间的权衡，以及预测损失和解释损失之间的平衡。通过使用三个模拟场景和NHTS数据集进一步证明了该理论，得出了这些主要结论。首先，可解释性可以通过使用选择概率函数来实现，因为DNN中自然存在效用比较和规范，选择概率函数的精确估计量^s（x）使研究人员能够提取通常从传统选择模型中获得的所有必要经济信息。我们的模型解释在某种程度上与传统方法有所不同，至少有三个原因。（1）这一过程可以称为预测驱动解释，这意味着研究人员在模型训练后从DNN中提取信息，即使DNN的设计初衷是最大限度地提高预测精度。这种预测驱动的解释是直观的，因为“当预测质量一直很高时，一定在DNN中发现了一些结构”[45]。（2）我们的解释是基于函数估计而不是参数估计。在DNN中几乎不可能评估每个单独的参数，因此，侧重于DNN中变换特征的整个空间的函数估计是一种更可行的解释方法。（3）如我们的蒙特卡罗模拟和NHTS应用程序所示，这种预测驱动的预测方法可以自动学习潜在的公用设施规格。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-6-11 00:38:06

这种方法是有效的，因为手工编制的实用程序规范很少能够捕获全部信息，相应地，自动学习实用程序规范的某些功能应始终参与选择分析。第二，非过度匹配问题至少可以通过不稳定学习理论的最新进展得到部分解决，并在我们的实验中得到证明。预测和解释损失的估计误差可由DNN的Rademacher复杂度限定。由于理论发展仍在进行中，理论表明样本大小、输入维度和规模、DNN深度和DNN中各层的规范之间存在微妙的动态关系，因此提供关于正确样本大小的明确规则仍然具有挑战性。然而，底线是，研究人员不需要计算限制估计误差的参数数量，也可以将其命名为事后解释，这意味着研究人员在模型训练后从预测驱动模型中提取信息。由于存在许多其他替代方法[22，54，41]DNN，基于VC维度的上限对于DNN应用程序来说过于宽松，因此这种方法是否是最好的，这是有争议的。虽然样本量要求不像经典统计理论预期的那么大，但相对较大的样本对于DNN的可推广结果仍然至关重要。我们的实验表明，对于典型的出行行为分析，DNN要优于BNL，样本大小至少需要达到10。样本量的要求略大于问卷调查的一般规模，但在实践中仍然可以达到。事实上，几项发现DNN优于MNL的研究的样本量与10相似【68，47】。然而，即使样本量小于，这并不意味着DNN不能工作。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

能者818

2022-6-11 00:38:09

在这种情况下，可以而且应该使用谨慎的正则化方法来提高模型性能，尽管我们在本研究中不太关注正则化。我们相信，这些见解有助于理解何时以及为什么DNN可以用于选择分析，它们具有理论和实践的重要性。该理论框架扩展了经典渐近数据区（v/N），可以作为未来选择分析研究的新基础→ 0）使用统计学习理论的最新进展，从低维统计到高维统计工具。这种扩展很重要，因为非渐近数据体系和高维统计工具在实践中越来越普遍。同时，研究人员可以使用解释思想从基于DNN的选择模型中生成经济信息，以达到至少与传统选择模型相同的解释水平，用于行为和政策分析目的。然而，许多重要的任务仍有待于今后的研究。四个象限中的每一个都比我们的讨论要深刻和复杂得多。未来的研究将需要研究小样本的有效正则化方法，研究DNN如何与具有随机系数的混合logit模型相关联，以超出传统选择模型框架的方式拓宽可解释性概念，并说明DNN的近似误差部分。鉴于机器学习模型的丰富性和个人决策的重要性，它们的交叉点无疑将成为未来的一个热门研究领域。作者的贡献。W、和J.Z.构思了所提出的想法；S、发展了该理论并回顾了以前的研究；S、 W.和Q.W。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群