全部版块 我的主页
论坛 经济学人 二区 外文文献专区
675 19
2022-05-31
英文标题:
《The Internet as Quantitative Social Science Platform: Insights from a
  Trillion Observations》
---
作者:
Klaus Ackermann, Simon D Angus, Paul A Raschky
---
最新提交年份:
2017
---
英文摘要:
  With the large-scale penetration of the internet, for the first time, humanity has become linked by a single, open, communications platform. Harnessing this fact, we report insights arising from a unified internet activity and location dataset of an unparalleled scope and accuracy drawn from over a trillion (1.5$\\times 10^{12}$) observations of end-user internet connections, with temporal resolution of just 15min over 2006-2012. We first apply this dataset to the expansion of the internet itself over 1,647 urban agglomerations globally. We find that unique IP per capita counts reach saturation at approximately one IP per three people, and take, on average, 16.1 years to achieve; eclipsing the estimated 100- and 60- year saturation times for steam-power and electrification respectively. Next, we use intra-diurnal internet activity features to up-scale traditional over-night sleep observations, producing the first global estimate of over-night sleep duration in 645 cities over 7 years. We find statistically significant variation between continental, national and regional sleep durations including some evidence of global sleep duration convergence. Finally, we estimate the relationship between internet concentration and economic outcomes in 411 OECD regions and find that the internet\'s expansion is associated with negative or positive productivity gains, depending strongly on sectoral considerations. To our knowledge, our study is the first of its kind to use online/offline activity of the entire internet to infer social science insights, demonstrating the unparalleled potential of the internet as a social data-science platform.
---
中文摘要:
随着互联网的大规模渗透,人类第一次被一个单一、开放的通信平台联系起来。利用这一事实,我们报告了一个统一的互联网活动和位置数据集所产生的见解,该数据集的范围和准确性无与伦比,来自于对最终用户互联网连接的一万多亿(1.5美元乘以10 ^{12}美元)的观察,在2006-2012年间,时间分辨率仅为15分钟。我们首先将此数据集应用于互联网本身在全球1647个城市群的扩展。我们发现,独特的人均IP数达到饱和,大约每三个人有一个IP,平均需要16.1年才能实现;使蒸汽发电和电气化的估计100年和60年饱和时间相形见绌。接下来,我们使用日间互联网活动特征来放大传统的夜间睡眠观察,得出了7年来645个城市夜间睡眠持续时间的第一个全球估计值。我们发现大陆、国家和地区的睡眠时间之间存在统计上的显著差异,包括一些全球睡眠时间趋同的证据。最后,我们估计了411个经合组织地区互联网集中度与经济成果之间的关系,并发现互联网的扩张与生产率的负增长或正增长相关,这在很大程度上取决于部门因素。据我们所知,我们的研究是首次利用整个互联网的在线/离线活动来推断社会科学见解,展示了互联网作为社会数据科学平台的无与伦比的潜力。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--
一级分类:Computer Science        计算机科学
二级分类:Computers and Society        计算机与社会
分类描述:Covers impact of computers on society, computer ethics, information technology and public policy, legal aspects of computing, computers and education. Roughly includes material in ACM Subject Classes K.0, K.2, K.3, K.4, K.5, and K.7.
涵盖计算机对社会的影响、计算机伦理、信息技术和公共政策、计算机的法律方面、计算机和教育。大致包括ACM学科类K.0、K.2、K.3、K.4、K.5和K.7中的材料。
--
一级分类:Computer Science        计算机科学
二级分类:Social and Information Networks        社会和信息网络
分类描述:Covers the design, analysis, and modeling of social and information networks, including their applications for on-line information access, communication, and interaction, and their roles as datasets in the exploration of questions in these and other domains, including connections to the social and biological sciences. Analysis and modeling of such networks includes topics in ACM Subject classes F.2, G.2, G.3, H.2, and I.2; applications in computing include topics in H.3, H.4, and H.5; and applications at the interface of computing and other disciplines include topics in J.1--J.7. Papers on computer communication systems and network protocols (e.g. TCP/IP) are generally a closer fit to the Networking and Internet Architecture (cs.NI) category.
涵盖社会和信息网络的设计、分析和建模,包括它们在联机信息访问、通信和交互方面的应用,以及它们作为数据集在这些领域和其他领域的问题探索中的作用,包括与社会和生物科学的联系。这类网络的分析和建模包括ACM学科类F.2、G.2、G.3、H.2和I.2的主题;计算应用包括H.3、H.4和H.5中的主题;计算和其他学科接口的应用程序包括J.1-J.7中的主题。关于计算机通信系统和网络协议(例如TCP/IP)的论文通常更适合网络和因特网体系结构(CS.NI)类别。
--
一级分类:Physics        物理学
二级分类:Physics and Society        物理学与社会
分类描述:Structure, dynamics and collective behavior of societies and groups (human or otherwise). Quantitative analysis of social networks and other complex networks. Physics and engineering of infrastructure and systems of broad societal impact (e.g., energy grids, transportation networks).
社会和团体(人类或其他)的结构、动态和集体行为。社会网络和其他复杂网络的定量分析。具有广泛社会影响的基础设施和系统(如能源网、运输网络)的物理和工程。
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-31 01:54:29
互联网作为定量社会科学平台:来自万亿次观测的见解克劳斯·阿克曼*Simon D Angus+Paul A Raschky+2017年1月23日摘要随着互联网的大规模渗透,人类第一次被一个单一、开放的通信平台联系起来。利用这一事实,我们报告了从2006-2012年对终端用户互联网连接进行的超过一万亿(1.5×10)次观测得出的范围和准确性无与伦比的auni fied互联网活动和位置数据集得出的见解,时间分辨率仅为15分钟。我们首先将此数据集应用于互联网本身在全球1647个城市群的扩展[1]。我们发现,独特的人均IP数达到饱和,大约每三个人一个IP,平均需要16.1年才能实现;分别超过蒸汽动力和电力的估计100年和60年饱和时间【29】。接下来,我们使用日间互联网活动特征来放大传统的夜间睡眠观察,得出了645个城市7年来夜间睡眠持续时间的第一个全球估计值【36】。我们发现大陆、国家和地区的睡眠时间之间存在显著的统计学差异,包括全球睡眠时间趋同的一些证据。最后,我们估计了411个经合组织地区互联网集中度与经济成果之间的关系,并发现互联网的扩张与生产率的负增长或正增长相关,这在很大程度上取决于部门因素。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-31 01:54:32
据我们所知,我们的研究是首次利用整个互联网的在线活动来推断社会科学见解,展示了互联网作为社会数据科学平台的无与伦比的潜力。关键词:大数据;技术差异;时间生物学;经济增长概述:IP、互联网协议;GPT,通用技术*美国芝加哥大学数据科学与公共政策中心;澳大利亚莫纳什大学经济系+澳大利亚莫纳什大学经济系简介以任何标准衡量,互联网——连接无数路由器、服务器和设备的光纤电缆的物理网络——是人类最杰出的发明,影响着包括医疗保健、政治活动在内的全方位人类行为,时间使用决策【30】,甚至是最重要的人际关系【31】。据估计,到2016年,将有35亿个人(47.1%)在线,或近10亿户家庭(52.3%),共同访问185000 Gbit/s(约101亿页/s)的全球带宽,是2008年可用带宽的十倍[26]。考虑到千年之交全世界只有不到5%的人口在线,这些数字就更加引人注目了【27】。然而,对于社会科学家来说,这些数字表明了一种不同的奇迹——在非人道的历史上,世界上有一半的人口现在与单一的通用技术(GPT)相连,这是第一次。内罗毕一家网吧里的台式电脑、墨尔本一部支持数据的手机、京都一列动车无线网络上的iPad——每个都在一个网络上分配了一个互联网协议(IP)地址。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-31 01:54:35
此外,由于互联网的彻底民主基础,每台设备都可以立即以微不足道的成本被动地查询对方的“在线”或“在线”状态(即不以任何方式干扰目标设备)。因此,互联网的全球影响力及其被动信息技术有力地将互联网作为社会数据科学平台与传统的数据收集方法区分开来。然而,在全球范围内生成internet查询数据所涉及的技术挑战是巨大的。要彻底探测互联网协议版本4(IPv4)寻址系统下的每个公共、分配的IP地址(即大约一半可能的4.3×10地址),可能需要24到70天[19],尽管代表性的活动扫描可以在几分钟内完成[35]。此外,随着时间的推移,IP地址块没有稳定的地理位置,因此,任何空间分析都必须能够从额外的、历史的IP/地理位置扫描中恢复某个时间点给定的活动或非活动IP地址的位置【25】。这些特征为希望分析全球互联网活动的社会科学家制造了巨大障碍,导致互联网订阅或互联网基础设施数据库被用作通用代理。在本报告中,我们展示了我们的团队成功加入了2006-2012年期间获得的超过万亿(1.5×10)个IP活动(“o-fregine”/“online”)观测数据,从而对人类行为产生的见解,这是一个高度准确、商用的IP地理定位库(图1)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-31 01:54:38
我们的方法产生了一个范围和粒度无与伦比的重新定义的数据集:在122个国家的1600多个城市边界[1](城市)上,有7500万行在线/在线观测,跨时间段的观测时间仅为15分钟。为了证明这些数据的科学潜力,我们首先对互联网本身的增长动态进行了正式描述,然后根据白天的互联网活动对全球人类睡眠时间进行了估计,最后探索了国家以下互联网普及率与经济成果之间的关系。据我们所知,每个应用程序都是同类应用程序中的第一个。二、差异技术的差异,包括之前的GPT【6,29】,是经济学文献持续关注的焦点【17,11,33】。之前的相关研究使用了各种不同的互联网渗透代理作为其快照或年度详细信息,每个代理都有一个或多个折衷之处,例如数据质量问题(在ITU调查的情况下【10,3】),或实际的互联网使用识别复杂性(在基于块或基于路由器的分配的情况下【32,40】)。相比之下,由于我们在定义明确的城市边界(城市)内每隔15分钟观察一次实际的最终用户IP连接,并由迄今为止使用的高精度地理位置数据库识别,因此我们能够每月提供对互联网扩展演变的首次准确估计。重要的是,考虑到我们系列的时间粒度和全球范围,我们能够确认互联网的分化确实遵循一个S形或逻辑形的过程(图2),模拟了文献中其他技术的分化研究,从混合玉米到蒸汽机、电气化和个人电脑。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-31 01:54:41
因此,我们将全球1647个城市的IP percapita、IP c的时间动态估计为一个逻辑过程IP ct=K1+e-α(t-β) ,其中K、α和β分别是渐近极限、梯度和中点参数。我们使用随机期望最大化算法(见S1)将该过程估计为非线性混合效应模型。通过这样做,该算法能够从所有国家的经验中学习,将每个国家视为广义或平均差异过程的偏差(在时间和梯度上)。我们发现,互联网的一般分化过程的渐近极限为每人0.32个IP,相当于三人家庭平均约一个IP地址的互联网“饱和”水平。此外,我们估计,一个国家内扩散过程达到饱和的平均时间仅为16.1年(1%-99%),分别超过了蒸汽动力和电力可比GPT估计的100年和60年饱和时间【29】。我们的方法还可以详细阐述各个国家互联网普及的经验(见表A,S1)。我们的估计显示,虽然一些国家已经经历了互联网渗透饱和,但其他国家在几十年内不会达到这一点。III SleepNext,我们展示了在7年的时间内,利用IP活动的日内变化来估计645个城市的睡眠时间、醒来时间和夜间总睡眠时间。最近,互联网对清醒的人类行为以及睡眠时间和质量的影响已经成为人们关注的焦点【9,30】,实验室证据现在证实了最近电子技术对人类时间生物学的影响【7】。不出所料,著名作家一直呼吁“广泛的数据收集策略”,以“改变我们对睡眠的理解”[36]。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群