本人还是菜鸟级sas学者,恳请各位大虾帮帮我!问题很棘手!这是一个关于用sas计算index of dimilarity的问题,
计算公式是这样的
(1/2)*SUM |bi /B – wi / W |
bi 表示黑人住在住宅区 i的人数
wi表示白人住在住宅区 i的人数
B表示样本中黑人的总人数
W表示样本中白人的总人数
在我的数据里,我有变量
(black=1 黑人 black=0 白人; residence=1 住宅区1 residence=2 住宅区 2.....; pref=1 地区1 pref=2 地区2.....)
数据结构是这样的:
pref residence black
1 1 1
1 1 1
1 1 0
1 1 0
1 1 0
1 1 0
1 2 1
1 2 0
1 2 0
1 2 0
2 1 1
2 1 1
2 1 1
2 1 1
2 1 1
2 1 1
2 1 1
2 1 1
2 1 0
2 1 0
2 1 0
2 1 0
2 2 1
2 2 1
2 2 1
2 2 0
2 2 0
2 2 0
.......
数据已经用proc sort,sort过了,我想在每一个地区计算一个index of disimilairty,我的地区总数为100;这样的话就可以直接得到100个index of disimilarity。我只想到一个最笨的办法就是把频数全部列出来,从excel算,但是因为每个地区,住宅区实在太多,所以这样会要算到几千遍;我实在想不出该如何计算;希望大家帮帮忙!万分感谢!