大家好~求教一个joinby之后进一步处理某一变量下的具体数值的问题背景如下:我将两个dta文件根据共同的product变量(hs代码)合并(joinby Product using /Users/Desktop/tradevolume.dta , update replace ),目的是将来dta2的trade value这一变量加到前一个数据样本dta1中
合并后的部分变量如下:
[CODE]
* Example generated by -dataex-. To install: ssc install dataex
clear
input str3 Ctr str4 Year str6 Product byte(AD1 AD2) double TradeValue
"ISR" "1989" "630531" 1 0 9375
"ISR" "1989" "630531" 1 0 4494
"ARG" "1989" "630531" 1 0 156.249
"COL" "1989" "630531" 1 0 249.608
"URY" "1989" "630531" 1 0 1801.025
"ZAF" "1989" "630531" 1 0 3960.018
"KOR" "1989" "630531" 1 0 7436.686
"KOR" "1989" "630531" 1 0 8914.437
"KOR" "1989" "630531" 1 0 40259.718
"UKR" "1989" "630531" 1 0 34.93
"MYS" "1989" "630531" 1 0 4.407
"RUS" "1989" "630531" 1 0 69016.637
但是发现,dta1文件中product代码中4位的变量,与dta2中的6位代码没有匹配上
Q1.如果用joinby的update replace不是会保留master中的文件中的数值吗(哪怕匹配不上)?但是我得到的合并后变量好像失去了原dta1文件中4位hs代码对应的所有数值,请问有什么解决办法吗?
Q2.在这种情况下我考虑将原dta中的4位代码梳理出来单独处理,请问要用什么指令呢?(就是将4位的与6位的分开)sort?但是我不需要按数值将其排序诶...
Q3.如果合并dta1和dta2的话,不用joinby的话用merge可以实现吗?用joinby之后出现了重复的多行变量,请问重复值是应该用哪个变量删除呢?