全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2107 4
2013-06-11

Anselin Luc. Thirty yearsof spatial econometrics[J]. Papers inRegional Science, 2010, 89(1): 3-23.

最后他提到了未来发展的方向与挑战,请解释第二个挑战的意思。尤其是划绿色的部分。


谢谢


A second challenge is to deal with theconceptual questions raised by using ever larger data sets, many of whichresult from automatic data recording. Systems ofsensors, both in the natural and in the social sciences, provide everlarger streams of extremely fine grained data (on a time scale, geographicalscale and individual scale). The standard sample-population paradigm or even thespatial stochastic process paradigm are insufficient to meaningfully addressthe questions raised in the analysis of such massive data sets. Thenotions of equilibrium (like spatial stationarity) on which we rely to developand assess our models are likely to become unrealistic in this context. Also,traditional concepts such as ‘significance’ have little use in the analysis of massivedata sets, since everything tends to be significant. Other ways ofinterpreting and assessing models for such settings need to be developed.Important in this respect is the need for a better understanding of how errors(of measurement, of location, of model specification) propagate through ourinferential systems and bring into question our traditional methods for quantifyinguncertainty.


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-6-11 11:34:46
假期有时间,做一个尝试,不是翻译,而是个人理解,供参考批评:
第二个挑战来自于大数据集带来的概念问题,这些大数据集来自于自动数据记录机制。系统感知器,能够从时间维度、地理空间维度以及个人维度,感知和测量自然、社会科学中极端细致的数据流,经典的样本-总体研究范式、甚至空间随机过程研究范式已经不足以用于解释大数据集分析过程中产生的问题,在大数据集的语义背景下,利用均衡概念(类似空间稳定性/稳态)去构建和评价我们已有的模型时不适宜的。同样,经典统计概念中的“显著性”对于大数据集来说没有多少用途,因为大数据样本的统计结果均趋于显著。因此,在这种情况下,解释和评价模型的方法需要研究和发展,这其中,需要更好的理解我们推断论证过程中的误差传递过程(测量误差、定位误差、模型假定误差)在我们推断论证中的作用,以及对量化不确定性传统方法带来的问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-6-11 13:25:12
wwwujl 发表于 2013-6-11 11:34
假期有时间,做一个尝试,不是翻译,而是个人理解,供参考批评:
第二个挑战来自于大数据集带来的概念问题 ...
首先谢谢你,你写的很流畅。
我的问题是,我不理解 上面 划绿色的句子。
能举个例子,或者,阐释下什么意思。我没有看懂。
谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-6-11 13:55:55
wwwujl 的理解与阐述相当好阿!

我记得我老师曾说过,大样本的迷思阿!!!
当样本很大时,随随便便弄个模型,通常都很容易"显著",
这就是为什么,很多人都很爱执行几万个观测值的资料,因为通常没意外的话,很容易"显著",
只要估计系数的正负号很符合预期,哇! 就开始说故事,讲地跟什么一样,文章就刊登,因为显著阿!

总之,既然大样本都很容易显著,
在大样本的资料下,去追求显著是没啥意思的,而用统计的显著去谈也是没意思的。
可能更美丽,更吸引人的是,这个显著,或者这个影响关系,究竟是什么"机制"【传递过程】造成的,

只是回想起恩师的话语……
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-6-12 01:43:16
h3327156 发表于 2013-6-11 13:55
wwwujl 的理解与阐述相当好阿!

我记得我老师曾说过,大样本的迷思阿!!!
讲的好。
我明白一些了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群