全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2679 36
2022-04-26
英文标题:
《Topological data analysis and UNICEF Multiple Indicator Cluster Surveys》
---
作者:
Jun Ru Anderson, Fahrudin Memic, Ismar Volic
---
最新提交年份:
2020
---
英文摘要:
  Multiple Indicator Cluster Surveys (MICS), supported by UNICEF, are one of the most important global household survey programs that provide data on health and education of women and children. We analyze the Serbia 2014-15 MICS dataset using topological data analysis which treats the data cloud as a topological space and extracts information about its intrinsic geometric properties. In particular, our analysis uses the Mapper algorithm, a dimension-reduction and clustering method which produces a graph from the data cloud. The resulting Mapper graph provides insight into various relationships between household wealth - as expressed by the wealth index, an important indicator extracted from the MICS data - and other parameters such as urban/rural setting, ownership of items, and prioritization of possessions. Among other uses, these findings can serve to inform policy by providing a hierarchy of essential amenities. They can also potentially be used to refine the wealth index or deepen our understanding of what it captures.
---
中文摘要:
由联合国儿童基金会支持的多指标类集调查(MICS)是最重要的全球家庭调查项目之一,提供有关妇女和儿童健康和教育的数据。我们使用拓扑数据分析对塞尔维亚2014-15 MICS数据集进行分析,拓扑数据分析将数据云视为拓扑空间,并提取关于其内在几何特性的信息。特别是,我们的分析使用了Mapper算法,这是一种降维和聚类方法,可以从数据云生成图形。由此产生的映射图可以深入了解家庭财富与其他参数之间的各种关系,如城市/农村环境、物品所有权和财产优先级等。家庭财富由财富指数表示,财富指数是从多指标类集调查数据中提取的一个重要指标。在其他用途中,这些发现可以通过提供基本设施的层次结构来为政策提供信息。它们还可能被用来完善财富指数,或加深我们对它所反映的内容的理解。
---
分类信息:

一级分类:Physics        物理学
二级分类:Physics and Society        物理学与社会
分类描述:Structure, dynamics and collective behavior of societies and groups (human or otherwise). Quantitative analysis of social networks and other complex networks. Physics and engineering of infrastructure and systems of broad societal impact (e.g., energy grids, transportation networks).
社会和团体(人类或其他)的结构、动态和集体行为。社会网络和其他复杂网络的定量分析。具有广泛社会影响的基础设施和系统(如能源网、运输网络)的物理和工程。
--
一级分类:Economics        经济学
二级分类:General Economics        一般经济学
分类描述:General methodological, applied, and empirical contributions to economics.
对经济学的一般方法、应用和经验贡献。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-4-26 16:06:23
拓扑数据分析和联合国儿童基金会多指标聚类调查Jun RU ANDERSON、FAHRUDIN MEMI\'C和ISMAR VOLI\'CAbstract。由联合国儿童基金会支持的多指标类集调查(MICS)是最重要的全球家庭调查项目之一,提供有关妇女和儿童健康和教育的数据。我们使用拓扑数据分析对塞尔维亚2014-15 MICS数据集进行分析,拓扑数据分析将数据云视为拓扑空间,并提取关于其内在几何特性的信息。特别是,我们的分析使用了Mapper算法,这是一种降维和聚类方法,可以从数据云生成一个图。由此产生的映射图提供了家庭财富与其他参数(如城市/农村环境、物品所有权和财产优先顺序)之间的各种关系的洞察——如财富指数所示,财富指数是从多指标类集调查数据中提取的一个重要指标。在其他用途中,这些发现可以通过提供基本设施的层次结构来为政策提供信息。它们还可能被用于重新定义财富指数,或加深我们对其所捕获内容的理解。内容1。导言21.1。论文的组织31.2。致谢42。背景42.1。映射算法42.2。多指标聚类调查52.3。财富指数和财富得分63。方法63.1。2014-15塞尔维亚MICS数据63.2。指标83.3。过滤功能93.4。聚类104。结果114.1。基于概率的半度量124.2。欧几里得度量125。讨论145.1。将信息叠加到地图145.2上。基于概率的映射器176的图论性质。结论197。未来工作207.1。其他中等收入国家调查数据207.2。其他国家207.3。其他TDA方法涉及24个关键词和短语。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 16:06:30
多指标聚类调查、多指标类集调查、财富指数、拓扑数据分析、Mapperalgorithm、Mapper graph、联合国儿童基金会。2 JUN RU ANDERSON、FAHRUDIN MEMI\'C和ISMAR VOLI\'C1。导言多指标类集调查(MICS.unicef.org)是关于健康、教育和妇女儿童福祉的家庭数据最重要的全球来源之一。在联合国儿童基金会的支持下,自20世纪90年代中期以来,已经在100多个国家开展了这些活动。这些数据是通过对全国代表性家庭样本的面对面访谈收集的,可以以各种方式进行分类。多指标类集调查分多年进行,为政府和机构制定、告知和实施社会经济和卫生政策提供工具和指导。MICS数据和文档可在MICS网站上免费获取。更多细节可在调查文章[4]中找到。从多指标类集调查中可以计算出并归属于每个家庭的一个重要参数是其财富指数。这个数字基本上反映了基于某些物品所有权的家庭财富,是评估一个国家经济状况的重要且广泛使用的工具。通过数据的标准主成分分析(PCA)进行计算,财富指数取决于第一个主成分。本文的目的是利用拓扑数据分析(TDA)对MICS数据和财富指数进行分析。这是一种相对较新的技术,它试图从数据云的形状中提取内在信息,并将这些信息解释为数据的特征。有关TDA及其应用的概述,请参见[1,2,6]。目前有几种成功的TDA方法正在使用,本文中我们将使用的是Matper算法,这是由Singh、M’emoli和Carlsson[8]提出的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 16:06:36
Mapper是一种无监督的机器学习算法,本质上是一种降维和聚类过程。其想法是将数据简化为一个映射图,以保留数据云的各种拓扑特征。根据某种距离概念,图中的节点表示“附近”的点簇,而边表示簇的重叠。由于该算法能够保留数据的“形状”,同时保留局部(节点)和全局(边缘)信息,因此它似乎比其他降维过程(如PCA)捕捉到更多信息。同时,它是一个强大的可视化工具,因为它将高维云导出为图形。Mapper在医学、基因组分析、神经科学、化学、遥感、土壤科学、农业、体育、投票和经济学等领域发挥了巨大作用(参考文献集见[3])。然而,我们认为,利用TDA研究生活标准和财富不平等是一种新颖的方法。更详细地说,我们将Mapper算法应用于2014-15年塞尔维亚的MICS调查。该数据集的选择完全取决于作者之一(Memi\'c)密切参与创建、执行和分析塞尔维亚的多指标类集调查,因此非常熟悉该方法、现场数据收集和调查后统计分析。本文关注塞尔维亚的事实在很多方面是次要的;值得注意的是,Mapper算法对多指标类集调查数据提供了不同的观点,可用于为决策提供信息。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 16:06:43
我们的分析可以在任何多指标类集调查数据集上进行,事实上,未来的比较研究可以揭示哪些社会经济指标针对世界上特定的国家或地区,哪些更具普遍性。进入Mapper图表的数据基于34个调查问题的是/否答案(包括MICS提出的所有问题)。这些数据被赋予了一个距离函数,该函数捕捉到了这样一个想法,即“亲密”的家庭是那些拥有相似的一组距离的家庭,并且一些财产比其他财产不那么常见。这导致了一种基于概率的半度量的定义,这种定义以前似乎没有在文献中使用过。TDA和MIC3Mapper生成后,我们从中提取两组观测值。一种方法是将信息叠加到映射器上,即根据财富指数或特定项目的所有权为节点着色。该分析深入了解了财富与农村/城市生活方式、物品所有权和特定类型家庭之间的关系。这是了解如何最有效地提高生活水平的潜在有用信息;例如,它表明,对大多数人来说,家庭设施比小玩意更重要。鉴于财富分数分布的低端有一条长尾(图2),这一点很有帮助,这表明数据集包含许多家庭,这些家庭的财富——以及人们可能会因此怀疑的生活水平——低于平均水平的几个标准差。我们的分析提供了一些关于哪些财产可能最有效地提高这些家庭生活水平的见解。我们研究映射器的另一种方法是观察它的图论性质,即路径和曲面。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 16:06:48
研究这些路径可以深入了解家庭在项目所有权方面的相对优先级。Mapper的一个优点是,它可以在没有现场证据表明可能存在这种关系的情况下,拾取材料间隙之间的非单调关系。另一方面,闪光似乎以一种比仅仅基于收入和资产更微妙的方式告知我们对家庭分类的理解。由于映射器执行从局部到全局的信息提取,因此查看具有不同覆盖颜色的同一图形可以让我们清楚地看到总体趋势和与这些趋势的偏差,而不会受到噪声的影响。分析布尔数据的能力和叠加颜色的应用都让地图绘制者能够识别不同财产与财富之间的关系模式,并通过财富指数进行量化。这扩展了映射器和TDA作为假设生成方法的实用性。需要注意的是,我们的分析依赖于现有的财富衡量指标,即财富指数,因此我们不希望用我们的方法重新定义它。然而,由于Mapper是一种比PCA(计算财富指数的标准方法)更为精细的数据缩减技术,本文工作的一个收获是,Mapper或许可以作为一种更细致的方式来理解财富分数。1.1. 论文的组织。在撰写本文时,我们试图将对Mapper算法和底层拓扑的技术阐述减至最少。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群