全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
9163 6
2019-10-05
在处理数据时遇到了一个问题:我要把企业的财务数据和我研究的自变量因变量合并起来分析,合并之后有很多回归的时候用不到的变量;这时候是应该先缩尾处理单个的数据,然后再合并,还是应该先合并删掉缺失值,再进行缩尾?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-10-5 14:36:58
我觉得可以大概考察数据的特点。 如果将要合并的样本数据组的特点各不相同差异大,那么可以分开处理异常值后再合并,来保证准确性。 如果将要合并的样本数据组的关键特点相似,那么可以考虑先合并再用统一的标准来统一处理;这样做不会丧失正确性也比较便捷。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-10-5 15:11:20
hyu9910 发表于 2019-10-5 14:36
我觉得可以大概考察数据的特点。 如果将要合并的样本数据组的特点各不相同差异大,那么可以分开处理异常值后 ...
谢谢您的建议,可以请教下“数据的特点”大概指哪些方面吗?我的数据里,控制变量是一些财务数据,和企业产权性质的虚拟变量,这样算是差异大的数据吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-10-5 17:21:45
orzA24 发表于 2019-10-5 15:11
谢谢您的建议,可以请教下“数据的特点”大概指哪些方面吗?我的数据里,控制变量是一些财务数据,和企业 ...
根据你的问题,我讨论的是你要“合并”成一个变量的几个变量。

关于“数据的特点”,我指的是你要进行“缩尾”处理的相关数据特点。 譬如,如果你要去除异常值的话,样本数据组的异常值分布,跟合并之后的异常值分布,是否大致相同?

如果觉得概念上理解有困难的话,先分组“缩尾”得到你认为统计上合适的分组数据,再合并也许是容易理解的做法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-10-5 18:30:07
hyu9910 发表于 2019-10-5 17:21
根据你的问题,我讨论的是你要“合并”成一个变量的几个变量。

关于“数据的特点”,我指的是你要进行 ...
大概明白您的意思了,不过我指的合并仅仅是指把数据合并起来;我的困惑就在于,先缩尾处理后,再进行合并,这时的样本分布与合并前可能不一样,因为有缺失值。我一开始的理解是假如先进行缩尾,得到了较原来而言正常分布的样本,那么假如有缺失值也在可接受范围内。但后来又觉得是不是应该合并后再分析…

非常感谢您的建议!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-10-6 09:33:12
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群