全部版块 我的主页
论坛 站务区 十一区 新手入门区
2424 1
2024-06-22
新手小白想问问从国泰安那些数据库下载下来的数据,一般要做哪些预处理啊?比如删除缺失值,删掉已经退市的,和未上市之前的,没有连续5年的数据,lev>1的,ST、*ST,金融行业。
这些是都需要做嘛?
还有没有其他需要处理的哇

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2024-7-7 08:41:57
为了显著提高数据分析的质量和可靠性,为后续的统计测试和模型建立打下坚实基础,可能需要考虑的其他处理
1,调整异常值,识别并处理数据中的异常值,异常值可能会扭曲统计分析结果。
2. 数据保持一致性,如货币单位、比例尺度等,所有数据在同一标准下。
3. 根据研究目的选择合适的时间窗口,选择时间窗口,如研究长期效应可能需要更长的时间序列。
4,不同的数据库可能使用不同的行业分类标准,需统一行业分类标准,保持行业比较的准确性。
5,标准化数据格式,如日期格式、数值格式等,数据格式保持一致性,便于后续的数据分析处理。
6,检查面板数据是否平衡,即所有的横截面单位是否在整个时间范围内都有观测值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群