全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 Excel
1135 1
2016-02-03
第一次发帖,请大家多多指教~

我在用人口进行抽样,使用的人口数据是10年普查数据,用上海市举例,如图
QQ图片20160203163542.jpg

在抽样时使用随机数抽样,将上海市各个行政区的人口降序(为何是降序)排列,并且计算出累积人口数,然后根据生成的随机数抽取行政区

我的问题是:

1.为什么要计算出人口间隔
2.在随机数这一块,遇到两种计算方法,其一,计算出人口间隔,用randbetween(1,人口间隔计算);其二,生成一个0-1的随机数,用总人口*随机数,得到最终随机数。我想知道两种计算方式有何差别,使用时是否有前提条件
3.在抽上海时遇到了问题,前两个随机数都包含在第一个行政区了,不知道应递推还是抽同一行政区
4.如图所示,卢湾区现在其实已经并入黄浦区了,但是因为使用10年的人口数据,还是有卢湾区。如果抽中,是否要标注情况,并抽选黄浦区
5.在抽样时往往要抽街道和居委会,每次都需要去统计局网站找到具体街道和居委会复制粘贴,再抽样,不知是否有更为省时的方法

(发帖前又用randbetween试了一下,发现这次生成的随机数不会包含在同一个行政区了,但是问题还在,还是希望大家能够帮助解答)

因之前的同事都已离职,没有准确的说法与答案,所以请求大家帮助,先在此谢过~!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-2-3 16:52:58
因为涉及到工作方面,不知贴出图里的数据和内容是否不妥,如有不妥还请大家提醒,我重新编辑
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群