无有代者 发表于 2021-3-13 18:51 
补充一点,直辖市、自治区、特别行政区。其中地址还有分号和顿号。
从现在数据来看,以下命令可做到
gen province=ustrregexs(0) if ustrregexm(Regplc,".*省")
replace province=ustrregexs(0) if ustrregexm(Regplc,".*自治区")
replace province=ustrregexs(0) if ustrregexm(Regplc,"北京市|重庆市|天津市|上海市")
gen city=ustrregexs(0) if ustrregexm(Regplc,".*?市")
replace city=ustrregexra(city,province,"")