假设你的数据集名为 poverty.dta,包含以下变量:
id:个人或家庭的唯一标识符。
indicator1, indicator2, ..., indicatorN:每个维度的贫困指标,值为 0(非贫困)或 1(贫困)。
权重向量(例如每个维度的权重 weight1, weight2, ..., weightN)。
计算步骤
1. 计算每个家庭的贫困得分
每个家庭的贫困得分为每个维度的权重与贫困指标的乘积之和。
Stata 指令:
gen poverty_score = weight1 * indicator1 + weight2 * indicator2 + ... + weightN * indicatorN
2. 确定贫困的截断线(k)
假设你选择的截断线是总贫困得分的 33%(即 1/3),创建一个贫困状态变量。
gen is_poor = poverty_score > (1/3)
3. 计算多维贫困的比例(H)
贫困比例(Headcount ratio, H)是贫困人口所占的比例。
sum is_poor
di "Headcount ratio (H): " r(mean)
4. 计算贫困强度(A)
贫困强度(Intensity of Poverty, A)是贫困人口的平均贫困得分。
gen poor_score = poverty_score if is_poor == 1
sum poor_score
di "Intensity of Poverty (A): " r(mean)
5. 计算多维贫困指数(MPI)
MPI = H × A
di "MPI: " r(mean) * (r(mean_headcount)
自动化:完整的 Stata 指令模板
以下是一个完整的 Stata 脚本,可以根据数据集自动运行:
1. 数据准备
use poverty.dta, clear
2. 计算贫困得分
gen poverty_score = weight1 * indicator1 + weight2 * indicator2 + ... + weightN * indicatorN
3. 定义贫困线 (k)
gen is_poor = poverty_score > (1/3)
4. 计算多维贫困比例 (H)
sum is_poor
local H = r(mean)
5. 计算贫困强度 (A)
gen poor_score = poverty_score if is_poor == 1
sum poor_score
local A = r(mean)
6. 计算 MPI
local MPI = `H' * `A'
di "Headcount ratio (H): " `H'
di "Intensity of Poverty (A): " `A'
di "MPI: " `MPI'
自定义注意事项
数据标准化:确保指标值统一为 0(非贫困)或 1(贫困),如果不是,需要先转换。例如:
gen indicator1 = (raw_indicator1 < threshold1)
权重设置:根据具体的研究需求,为每个指标分配权重。如果权重总和不是 1,需要标准化:
gen norm_weight1 = weight1 / total_weight
分组计算:如果需要按地区或性别等分组计算,可以使用 bysort:
bysort region: sum is_poor