回归分析的时候需要让所有变量都不存在缺失值吗？

53438

收藏 2014-10-30

   虽然用了很多遍的stata，但是说实话基础知识没有很扎实，所以来询问。
   我之前处理数据的时候，是把关键变量（比如自变量、因变量）的缺失值都删掉，至于控制变量（比如性别、年龄），因为只缺失几个，所以我当时的处理方法就是直接把这些变量也都删掉。
   但是现在在处理chns数据，发现其中有一个控制变量，性别，一旦删掉它的缺失，样本量将减少2/3，于是我有所顾虑。如果将这一变量的缺失值删掉，整个人群的结构都将发生变化，比如之前的已婚率是65%，现在就将变成53%，感觉这样的处理个人干预过多，使得数据失真；但如果不删除这些缺失，我不知道跑回归的时候stata是怎么来处理这些缺失的，以及这些缺失会对结果造成什么影响吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

ermutuxia

2014-11-7 16:01:39

如果某一个变量的缺失值特别多建议回归方程中就不要加入这个变量了，因为回归的时候用的是所有变量都不缺失的观测值

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

keepvigil

2014-11-11 23:41:53

ermutuxia 发表于 2014-11-7 16:01
如果某一个变量的缺失值特别多建议回归方程中就不要加入这个变量了，因为回归的时候用的是所有变量都不缺失 ...

啊谢谢您~我后来问了老师，老师的意思跟您是一样的。

不过我的考虑是这样：我想分离出来两个群体A和B，然后就人群特征做一分析，以及这两人群的收入差异做以一分析。考虑到人群特征，我就不敢对数据进行大处理，特别是删掉很多缺失。不过后来我选择了其他年份后发现缺失没有特别严重。但有一项是受教育程度，大概有20个的缺失，样本总量是300+。我看了版上的一些贴，说是可以用SPSS做一个缺省值分析，判断他到底是随机丢失还是其他，然后根据情况再对缺失值进行处理。我在这里采取了这种方式~不知道有没有问题？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

礼蕊昂

2014-11-12 01:37:49

关于你这个问题，我好像在一本书上看到过，有种办法就是填充缺失值，例如你说的这个男女比例，你先统计没缺失值的，然后根据统计的男女比例去填充缺失值。我是菜鸟，只大概记得这种办法，希望能帮助你。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

礼蕊昂

2014-11-12 01:39:30

你还可以不要那个变量，先回归下，然后再取那些没缺失值得回归下，看下这个变量存在是否显著。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

keepvigil

2014-11-12 21:05:36

礼蕊昂发表于 2014-11-12 01:37
关于你这个问题，我好像在一本书上看到过，有种办法就是填充缺失值，例如你说的这个男女比例，你先统计没缺 ...

好的~超感谢你的~我去试一下~

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

企鹅8217

2014-11-13 00:09:52

用duplicates drop试试

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

longxia2013

2014-11-13 00:34:12

好好学一学

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

crystal8832

2014-11-13 12:11:42

其实楼主可以试试，如果你的变量里存在缺失值，那么在回归过程中，包含确实值的那一行是被忽略掉的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

catherinzhao

2015-3-6 22:14:45

缺失值有多少才算多？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

tony2040044

2015-3-7 14:39:25

这个问题，最好的办法就是不要删，而是把无效的replace成.

这样处理起来灵活，免了很多重复的工作

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

007kimmy

2016-6-13 17:35:57

学习了，思考思考~

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

007kimmy

2016-6-14 09:27:18

tony2040044 发表于 2015-3-7 14:39
这个问题，最好的办法就是不要删，而是把无效的replace成.

这样处理起来灵活，免了很多重复的工作

没看明白：
缺失值本来就是 . 啊，把无效的替换成 . 还是缺失值啊，回归的时候那一行观测是不纳入分析的。是这个意思吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

xiangxinziji917

2017-1-11 17:29:27

tony2040044 发表于 2015-3-7 14:39
这个问题，最好的办法就是不要删，而是把无效的replace成.

这样处理起来灵活，免了很多重复的工作

请问下处理成.是什么意思啊？stata中设置NA值就是缺失值的意思吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

jinyuguo

2017-1-11 17:40:14

有缺失值的样本点，被默认为是无效观测，不加入回归。不管是何类型数据，插补有当然是可以作的。但我不提倡（除非样本太小）。因为如果连原始数据都需要插补，后续回归还可信吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zabbyy

2017-7-11 01:27:03

jinyuguo 发表于 2017-1-11 17:40
有缺失值的样本点，被默认为是无效观测，不加入回归。不管是何类型数据，插补有当然是可以作的。但我不提倡 ...

赞同。
同样的，缺失值替换为零的，也是有问题的。比如XXX市的2013年的gdp缺失，替换为零是否太草率了点呢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

规划和健康10

2017-9-2 16:45:36

ermutuxia 发表于 2014-11-7 16:01
如果某一个变量的缺失值特别多建议回归方程中就不要加入这个变量了，因为回归的时候用的是所有变量都不缺失 ...

赞！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

胡不歸

2018-4-1 22:05:44

马克一下

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

日新少年

2018-4-1 23:39:51

ermutuxia 发表于 2014-11-7 16:01
如果某一个变量的缺失值特别多建议回归方程中就不要加入这个变量了，因为回归的时候用的是所有变量都不缺失 ...

谢谢分享

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

进击的巨人6

2019-3-8 17:05:04

谢谢分享！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

小米想吃辣

2019-8-7 09:31:03

谢谢大家的分享

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

JHFLAN

2019-11-26 16:09:13

mark一下，谢谢分享~请教下能否将主要被解释变量和主要解释变量的缺失值删除，控制变量的缺失值不处理进行回归呢？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

JHFLAN

2019-11-26 16:13:05

请教下数据集中每一个id下不同变量的缺失情况不一致，即各个变量缺失的程度不一致，这样是否会对回归结果有影响呀？还是说进行回归分析时，哪怕存在缺失值，但是各个变量数据要整齐？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

狮77

2023-2-2 10:50:18

JHFLAN 发表于 2019-11-26 16:13
请教下数据集中每一个id下不同变量的缺失情况不一致，即各个变量缺失的程度不一致，这样是否会对回归结果有 ...

蹲一蹲

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2052_1569241229

2023-12-13 14:45:25

谢谢分享

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

XUANYUAN13

2025-2-10 10:04:15

catherinzhao 发表于 2015-3-6 22:14
缺失值有多少才算多？

按年份缺就算多把，找到一个控制变量缺了前几年一点用不了，看别人论文又有这个控制变量。。。很神奇。。。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群