全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5523 2
2022-01-26
各位大佬,有个问题困扰我好久了,假设有个数据我已经通过倾向评分逆概率加权得到了权重W,那么加权后的数据怎么转换得到?对于连续变量我直接乘以权重就可以了,但是分类变量有是0,有些是1,权重乘以0还是0.我看了一篇文献如下
没有加权前
极速截图202201260031.png
加权后
极速截图202201260032.png
加权后分类变量职业中:农民和人工其他的数据构成(就是人数)发生了改变,数据被配平了,最后还算出了不同OR值,但是文中作者没有说怎么处理分类变量的数据。
所以想请教下各位大佬,这是怎么做到的,万分感谢!!!
附件附有原文章
附件列表

create_pdf.pdf

大小:321.42 KB

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-1-27 04:23:31
根据我的理解,对数据本身并没有影响。无论是连续变量还是离散变量,数据本身该是多少还是多少。只是你有权重以后,使得单个样本代表的有效样本数量就不同了。
举例说,某些组,一个样本代表2个样本,某些组,一个样本代表1.2个样本。
根据你那片文章的表4,他用的是逻辑回归,那实际上就变成了加了权重的逻辑回归。从形式上来说,参数估计就从b = (X'X)^{-1}X'Y变成了b = (X'WX)^{-1}X'WY,其中W就是你的那个权重组成的矩阵。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-1-27 11:10:21
owenqi 发表于 2022-1-27 04:23
根据我的理解,对数据本身并没有影响。无论是连续变量还是离散变量,数据本身该是多少还是多少。只是你有权 ...
深有启发,非常感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群