小弟stata刚入门,望各位大佬指教
现有数据:
clear
input str30 Prvn p
上海市 1
云南省 2
内蒙古自治区 3
北京市 4
吉林省 5
四川省 6
天津市 7
宁夏回族自治区 8
安徽省 9
山东省 10
山西省 11
广东省 12
广西壮族自治区 13
新疆维吾尔自治区 14
江苏省 15
江西省 16
河北省 17
河南省 18
浙江省 19
海南省 20
湖北省 21
湖南省 22
甘肃省 23
福建省 24
西藏自治区 25
贵州省 26
辽宁省 27
重庆市 28
陕西省 29
青海省 30
黑龙江省 31
end
将以上数据分为东部、中部、西部三组,具体如:
东部:海南、浙江、山东、福建、河北、辽宁、广东、上海、天津、北京、江苏;中部:安徽、湖北、黑龙江、吉林、山西、江西、河南、湖南;西部:云南、西藏、陕西、广西、四川、新疆、宁夏、重庆、甘肃、贵州、青海、内蒙古
完成分组后,生成识别变量region,取值为1代表东部;取值为2代表中部;取值为3代表西部;并在此基础上对1、2、3贴值标签:1的值标签为“东部”,2的值标签为“中部”,3的值标签为“西部”。
望大佬指教