经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
数据分析与数据挖掘
枚举型变量的缺失值估计
楼主
shenyingshizhe
1811
0
收藏
2014-07-08
问题很简单。有一个客户清单表,其中有“性别”变量大约有10%的纪录此字段缺失/
但性别变量和姓名变量应该是有强相关性的
所以我觉得应该可以通过姓名来估算性别
例如
李刚 --> 男
张红 --> 女
如果靠人工去筛选这些类似“刚”、“红”一类的具有明显性别特征的字大约也可以解决。但是时间和效率有限。
各位大虾看一看,能否通过一些机器学习算法(无监督)的,在已有训练样本集上,对这种 姓名-->性别 关系做一个学习,然后用于对缺失数据作预测
真心求大虾们赐教,给出思路也可以+。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
机器学习算法总汇
分享《机器学习算法原理与编程实践》电子版
机器学习算法一览
基于机器学习算法的前列腺癌诊断模型研究
机器学习算法在绿色智能化汽车发展及研究中的应用展望
大数据环境下机器学习算法趋势研究
有监督机器学习算法在计量装置电压异常诊断中的应用
基于机器学习算法的大数据处理
基于机器学习算法的人脸识别鲁棒性研究
【学习笔记】机器学习算法结束啦,还得从头梳理!!
栏目导航
数据分析与数据挖掘
能源经济学
爱问频道
真实世界经济学(含财经时事)
宏观经济学
Stata专版
热门文章
understanding climate change perceptions ...
【全美经典】离散数学
【同程商旅】中国企业出海差旅研究报告
“十四五”能源发展成就报告
2000离散数学习题精解
智算无界AIDC的超越和重构2025
当社科基础理论重大理论发现的时候
【24重磅,自用整理!】2000-2024上市公司投资 ...
2025年我国医药航空冷链发展现状与趋势展望 ...
中国数字经济规模数据、报告(2005-2023年) ...
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群