全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 Excel
1777 3
2014-03-29

提问截图.png 各位大侠,在下遇到问题,盼各位不吝赐教。有个我国出口数据库,统计了每个hs编码下,我国出口到了哪些国家及其数量。每个hs编码下,也有国家中国并未出口。我想把每个hs编码下中国出口的目的国家赋值为1,没有出口的国家赋值为0。但是数据库格式只显示有出口的目的国,没有显示未出口的国家。本想自己按照一百多个国家手动添加补齐0值,但是数据库多达几十万条,无法完成。期盼各位出出主意怎样处理为好。多谢了。

表中目的国数字是国家代码。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-3-30 00:05:43
这个问题很好解决啊
调入到stata中,生成一个二值变量 output
gen outport=1 if hs!=""  // 当hs不等于空值时,赋为1
replace   outport=0  if hs==""  
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-30 19:19:55
谢谢回复。hs编码是已知的,hs=没有什么作用。例如在hs=280110时,有的国家例如代码为999的国家没有出口,则这个数据库压根不出现一行为 280110, 999, 0(出口额)。我的意思是如何让表格自动补齐这行数据。因为国家数量和hs编码总量都是固定的,似乎应该可以有个命令或者程序来不断循环搜索和赋值。希望得到高手的指点。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-30 19:45:27
我设想对每个hs编码进行所有国家配对搜索,这样数据库中能配对出现的就是有出口,赋值为1。配不上对的只有hs编码没出现国家代码的就赋值为0。例如能搜索到表中280110和国家代码8表示对国家8有出口,赋值为1;而不能搜索到280110和国家代码999,则表示对国家999没有出口,赋值为0。这样似乎只要配对搜索就可解决,但是我实在不知道怎样实现,请各位指点。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群