全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2086 2
2017-12-07
悬赏 200 个论坛币 未解决
有人看过Duranton,  G.  and  Overman(2005)Testing for Localization Using Micro-geographic Data 这篇文章吗,我对于其中的核密度估计还有蒙特卡洛模拟不是很懂,如果有人知道,可否告知,如有帮助,必将重金感谢,论文急用!!!!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-12-7 21:37:51
这两个都是需要编程解决的,Matlab/R会有些可以用的函数,但还是要写点代码。你的问题是需要了解点non-parametric和Simulation的东西
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-7 22:10:01
这两个都是Stata软件可以轻易解决的
蒙特卡洛虽然知道大概什么原理,但平时用的少,就不乱说了

核密度估计真的很简单
只是种数据局部拟合技术
一般常用的OLS、2SLS、GLS、迭代法之类的,都是全局拟合,即全部样本用于估计一组“平均”参数

而所谓局部拟合,就是对每个样本点,以其一个局部邻域范围的有限样本作估计,作为对这个样本点的估计
举个例子,假设有(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4)四个样本点做拟合
OLS的全局拟合时这四个点的信息都囊括在内,估计y=a+bx 的一组参数a和b
但局部估计是这样的,就是先取一个带宽h
h一般是通过交叉核实确定的,基本思路就是对h进行迭代,以让整体残差平方和最小(交叉核实有许多衍生方法,但核心思维接近),将其作为最优带宽使用
h也可以人为指定,不过一般还是用交叉核实

然后分别以(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4)四个点为中心,半带宽h/2为半径,划一个空间邻域,利用每个空间邻域内的样本进行估计
比如对(x1,y1),落入h/2范围内的点只有(x1,y1)、(x2,y2),就用这两个样本的信息为基础估计,作为对(x1,y1)点的估计
对(x2,y2),落入h/2范围内的点有(x1,y1)、(x2,y2)、(x3,y3),于是就用这三个样本的信息为基础估计,作为对(x2,y2)点的估计
以此类推

用这种方法估计出来的,直接是每个样本点都有一个对应数值解,然后将其连起来就可以得到一个任意形状的解
由于这种估计不限定函数的具体形式,这也是局部估计的“优势”

核密度估计是局部拟合中最简单的一种
就是半带宽半径的空间局部内,所有样本点取平均值作为估计
不过由于分布假设等问题,并不是直接取算术平均值,而是加权平均值,权重是由“核”决定的(一种特定函数形式的分布函数),“核”种类很多,一般是根据实际需要选择(高斯核用的多些,但这个选取其实是有随意性的)

具体操作和简单概念,您去看看陈强那本《高级计量经济学与Stata》即可
蒙特卡洛法的内涵和操作,里面也有

客观的讲,核密度估计真正的困境是在于你用这种算法得出的那些“任意”解是否真的有经济含义
尤其是局部估计中,带宽范围内可能样本稀疏,估计值很容易会出现大波动
这时你实际上很难去解释
更多只是种数学算法而已
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群