经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
数据集中有大量变量带有0值,该如何处理?
楼主
Raneeran
3071
2
收藏
2020-06-16
悬赏
80
个论坛币
未解决
我现在有这样一个问题,有一组分类数据,共278个变量,分为两类,样本量是1388,在这些数据中,有许多变量(大约占有一半)中含有很多0值,如下图所示。
这种情况下,我想继续做分类研究,如采取LDA或者QDA等进行分类预测,该如何进行呢?
谢谢大家!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
Raneeran
2020-6-16 14:14:29
图片在这里,新人发帖,不太知道为什么没有显示。
附件列表
1592288022014.jpg
原图尺寸 173.35 KB
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
nieqiang110
2020-6-16 15:19:03
根据研究问题以及数据采集的情况,推断哪些是缺省值,哪些是0值。如果是0值,肯定不能改。如果是缺省值,采用插值法处理,具体方法比较多。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
多变量长型数据集转换成宽型数据集?
请教:如何对同一数据集中有效观测数不相同的多变量求相关系数
请教:如何将一个数据集的所有变量置为缺失?
SAS如何生成人工正态分布的二分类数据集
【疑难】如何将数据集中的空值全部变为0?
变量名更名
sas多变量数据集合并
求助,有放回抽样问题
二分类数据集中于某一类别(e.g.,95%=1;5%=0),可以设置虚拟变量吗
黑河流域中游地区土地覆被分类数据集(2018)
栏目导航
R语言论坛
会计与财务管理
真实世界经济学(含财经时事)
宏观经济学
CFA、CVA、FRM等金融考证论坛
求助成功区
热门文章
2026“课题申报”抢跑号角的已吹响!国社科 ...
Nature点赞!哈佛MIT最新作:AI科学家时代来 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
达富发投资关于中百集团行情数据操作分析与 ...
GTAP11运行扩展数据库出错,希望高手指点。
2025秋季大摩宏观团队闭门会议纪要
英文书籍
建筑的想象之整理补充笔记
超越普里瓦洛夫无穷乘积与它对解析函数的应 ...
中国移动:智能体互联网技术白皮书2025
推荐文章
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
高校老师和学生都在偷偷上的智能体课,到底 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群