全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
3934 2
2024-09-26

空间计量研究中,空间杜宾是一种较为常用的模型,其考虑两个空间性,分别是自变量的空间滞后作用,以及因变量的空间滞后作用,其数学模型公式如下:

y = βk * x + θk * Wx + ρ * Wy + µ(其中βk表示X的回归系数,Wx表示自变量X空间滞后变量,θk表示Wx的回归系数,Wy表示因变量Y空间滞后变量,ρ表示Wy的回归系数,µ为扰动项)


空间杜宾模型SDM模型案例
  • 1、背景

    当前有一份空间数据,其为美国哥伦布市49个社区的相关数据,包括犯罪率(crime)、房价(hoval)和家庭收入(income),当前希望研究房价和家庭收入对于犯罪率的影响关系,并且在研究这一影响关系时,考虑空间性,希望使用空间杜宾SDM模型进行分析,同时考虑因变量和自变量的空间作用机制。部分数据如下图所示:


    上面展示的是‘分析数据’,共有49个社区,该49个社区对应的‘空间权重矩阵’如下图所示:


    图中数字1表示两个空间点(社区)之间相邻,数字0表示两个社区不相邻。空间权重矩阵数据可点击此处下载


  • 2、理论

    空间杜宾模型SDM的自变量包括X,Wy即因变量空间滞后变量,其意义为当前Y受到空间相邻地区Y的影响作用,除此之外还有Wx即自变量空间滞后变量,其意义为当前Y受到空间相邻地区X的影响作用。其数学模式公式如下:

    y = βk * x + θk * Wx + ρ * Wy + µ(其中βk表示X的回归系数,Wx表示自变量X空间滞后变量,θk表示Wx的回归系数,Wy表示因变量Y空间滞后变量,ρ表示Wy的回归系数,µ为扰动项)

    空间杜宾SDM同时考虑自变量和因变量的空间滞后作用机制。


  • 3、操作

    本例子操作如下:


    下拉选择‘空间权重矩阵’文档即spatialweight这份数据,默认对空间权重矩阵行标准化处理,需要注意的是,空间权重矩阵通常需要进行行标准化处理。

    另需要提示的是,在使用空间计量相关的方法时,其均需要‘空间权重矩阵’和‘分析数据’两份数据,并且均需要单独上传到SPSSAU中,并且对‘分析数据’进行分析时,下拉选择对应的‘空间权重矩阵’,操作上分为以下3个步骤。

    • 第1:上传‘空间权重矩阵’文档

      此处需要注意:上传的数据需要为n*n阶格式,而且第1行为空间点的名称(比如31省市的名称)。类似下图格式:


    • 第2:上传‘分析数据’文档

      此处需要注意:比如31省市数据,‘空间权重矩阵’有着该31个空间点的顺序比如北京-》天津-》河北-》山西-》…,那么‘分析数据’的31行数据也需要按此顺序才可以。

    • 第3:针对‘分析数据’进行分析,并且选择‘空间权重矩阵’文档

      此处需要注意:进行某空间研究方法时需要下拉选择‘空间权重矩阵’,选择后,SPSSAU会自动判断其是否为‘空间权重矩阵’格式,包括是否为n*n阶结构,是否具有对称性等。如果不是则会进行信息提示,请勿必注意空间权重矩阵数据格式。



  • 4、SPSSAU输出结果

    SPSSAU共输出6个表格,分别是模型基本参数等、空间杜宾SDM模型分析结果、空间杜宾SDM模型相关检验汇总、信息准则指标结果、空间效应分析和空间杜宾SDM模型分析结果-简化格式表格,如下所述。

    表格

    说明

    模型基本参数等

    输出模型的基础参数值信息等

    空间杜宾SDM模型分析结果

    输出模型的分析结果,包括回归系数和显著性检验结果等

    空间杜宾SDM模型相关检验汇总

    输出相关的检验比如异方差检验等

    信息准则指标结果

    如果是极大似然ML法时则会输出信息准则指标等

    空间效应分析

    输出空间效应分析表格

    空间杜宾SDM模型分析结果-简化格式

    输出模型结果的简化表格格式



  • 5、文字分析

    上表格模型的基本参数信息,包括具体的空间计量模型名称,是否使用稳健标准误差,空间权重矩阵名称及是否对其进行标准化处理等,模型估计方法等,表格中仅展示模型的参数信息等无特别分析意义。需要注意的是,当前默认使用ML极大似然法进行估计,但当选中Robust稳健标准误法时,则使用GMM估计,GMM估计法时不会输出llf指标等,即其会影响到后续输出信息准则指标表格。


    上表格展示空间杜宾SDM模型回归结果,其数学模型为y = β * x + θ * Wx + ρ * Wy + μ (其中β表示X的回归系数,Wx表示自变量X空间滞后变量,θ表示Wx的回归系数,Wy表示因变量空间滞后变量,ρ表示Wy的回归系数,μ为扰动项),结合当前数据,其公式为:crime = 65.246-0.260*hoval-1.505*income-0.398*hoval_空间滞后变量+0.606*income_空间滞后变量+0.216*因变量空间滞后变量。

    具体针对各项的影响关系来看:hoval的回归系数值为-0.260,并且呈现出0.01水平显著性(p =0.005<0.01),意味着hoval会对crime产生显著的负向影响关系,即说明房价会负向影响犯罪率,房价越高犯罪率越低。income的回归系数值为-1.505,并且呈现出0.01水平显著性(p =0.000<0.01),意味着income会对crime产生显著的负向影响关系,家庭收入越高犯罪率越低。

    除此之外,两个自变量的空间滞后变量均没有呈现出显著性,比如房价的空间滞后变量,其回归系数值为-0.398,其p 值为0.073>0.05,意味着其他地区的房价并不会影响到当前地区的犯罪率。家庭收入空间滞后项也没有呈现出显著性,即说明其他地区家庭收入并不会对于本地区的犯罪率产生影响,与此同时,因变量空间滞后变量也没有呈现出显著性,说明其他地区的犯罪率对于本地区犯罪率没有影响作用关系。


    上表格展示异方差White检验和JB检验,分别用于异方差和正态性检验,空间计量模型时对于空间作用的关注力度明显最高,对于异方差和正态性关注度相对较低,从上表格可以看到,并没有异方差差问题,残差也呈现出正态性。如果有异方差问题时,可考虑使用稳健标准误法进行估计即可。


    上表格展示信息准则结果表格,包括llf值和另外两个值即AIC值和Schwarz准则值,llf值通常越大越好,但是AIC值和Schwarz准则值均是越小越好,如果希望对比模型优劣,可考虑使用上述三个指标,但需要注意的是,极大似然法估计ML法时才会输出上述指标,如果是比如GMM估计则没有输出上述指标。


    上表格展示空间效应分析结果,直接效应ADI反映自变量X对于自身区域Y的平均影响效应情况,间接(溢出)效应AII反应自变量X对其它区域Y的平均影响效应情况,总效应ATI=直接效应ADI+间接(溢出)效应AII。本案例数据时,hoval即房价对于犯罪率是负向影响关系,直接效应ADI为-0.329,间接溢出效应AII为-0.716,即房价除了对本地区犯罪率有负向影响,还会对其他地区犯罪率有着负向影响;家庭收入的作用关系类似。

    与此同时,空间杜宾模型时,其空间效应的计算公式如下:



    上表格展示模型的简化表格格式,不再重复分析。


  • 6、剖析
    • 涉及以下几个关键点,分别如下:
    • 空间杜宾模型同时考虑自变量和因变量的空间滞后作用,多数情况下仅需要考虑因变量空间滞后作用即使用空间滞后模型,具体是否应该考虑自变量空间滞后作用建议以文献为准。





疑难解惑
  • 空间杜宾模型时因变量空间滞后变量的意义?
  • 因变量空间滞后变量(通常使用符号Wy表示),其实际意义为其他相邻地区的因变量综合值,其作为X纳入到回归模型中,其分析意义为当前因变量除了受到自变量X的影响作用外,还受到其它相邻地区因变量的作用关系。




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2024-10-12 17:35:50
### 空间杜宾模型(Spatial Durbin Model, SDM)原理

#### 基础概念与公式表示
在空间计量经济学中,SDM是一种全面考虑自变量和因变量的空间溢出效应的模型。其核心在于识别并估计空间依赖性对研究现象的影响。

SDM的基本形式如下:
\[y = \beta X + \rho W y + \theta WX + u\]
其中,
- \(y\) 是n×1的因变量向量;
- \(X\) 是n×k的自变量矩阵,\(k\)为自变量数量;
- \(W\) 代表空间权重矩阵,描述了各观测点之间的空间关系(如地理位置上的邻近度);
- \(\beta\)、\(\theta\) 和 \(\rho\) 分别是对应的回归系数向量或标量;
- \(WX\) 是n×k的自变量的空间滞后项矩阵;
- \(Wy\) 表示因变量的空间滞后影响,即周围观测点对当前观测点的直接空间溢出效应;
- \(u\) 为误差项。

#### 空间权重矩阵
\(W\)是SDM中的关键元素之一。在上文提及的案例中,\(W\)通过二值(0或1)表示社区之间是否相邻,从而刻画了空间上的邻接关系。这种定义的空间权重矩阵称为“罗宾逊”类型,其中1代表两个区域是直接相邻的,而0则表示不相邻。

### 案例实操分析:美国哥伦布市犯罪率与房价、家庭收入的关系

#### 数据背景
假设我们正在研究美国哥伦布市49个社区中犯罪率(crime)、房价(hoval)和家庭收入(income)之间的关系,特别关注这些变量的空间溢出效应。

#### 分析步骤
1. **数据准备**:收集包含各社区的犯罪率、房价、家庭收入等信息的数据集。同时确保拥有描述社区间空间邻接性的矩阵\(W\)。
   
2. **模型设定**:基于SDM原理,构建模型以探索自变量(包括其空间滞后效应)对因变量(犯罪率)的影响。

3. **参数估计与解释**:
   - 利用软件包如R的`spdep`或Python的`pysal`进行模型拟合。
   - 解释回归系数\(\beta\)、\(\theta\)和\(\rho\)的意义,特别是空间溢出效应的大小。

4. **假设检验与诊断**:检查残差是否符合随机分布假定,验证模型设定的有效性。

5. **结果解读**:根据参数估计值分析房价(hoval)和家庭收入(income)对犯罪率的影响,并考虑其空间溢出效应如何在哥伦布市社区中传播。

#### 模型输出与结论
假设分析后发现\(\rho > 0\),表明高犯罪率的社区会通过某种机制影响邻近低犯罪率区域,导致其犯罪率上升。同样地,如果\(\beta\)和\(\theta\)显著负值,则说明房价和家庭收入提高对降低本地及周边地区的犯罪有积极空间溢出效应。

### 结论
SDM模型能够有效地捕捉变量间复杂的空间相关性,并为理解区域经济现象提供更全面的视角。对于哥伦布市案例,通过SDM分析可以揭示社区之间相互影响的模式,帮助政策制定者更好地设计干预策略以减少犯罪和促进社会经济福祉。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-11-14 16:15:57
挺好的材料
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群