经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
数据分析与数据挖掘
文本挖掘特征选择:该用什么方法?
楼主
caisinong
1727
1
收藏
2016-05-02
我在尝试用文本挖掘来处理微博信息,在特征选择被卡住了:我试了两种,一种是词频统计后人工筛选前X百个,一种是randomforest的importance项筛选前X百个,发现前者在训练时效果更好。但二者在后面分析新数据时效果都一般,一眼扫过去分类分得乱七八糟。
后来还看到tfidf,但因为我分析微博数据,不知道总文档库该去哪找,感觉无法实行了。
求教大神们都用什么方法来做这个事情呀?十分感谢!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
吴_楚
2016-6-22 18:31:04
可以用word2vec
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
平稳与一阶单整
关于排序积分
基于双向匹配法和特征选择算法的中文分词技术研究
8个投入8个产出的15年不同部门的效率评价用什么方法(软件)好呢?
有性别、年龄等变量,该用什么方法回归?
2015年度最佳小说
文本挖掘分词
时间序列想往后得出30个左右的预测数据,用什么方法比较好
有什么方法可以减少困意
文本挖掘实操课!手把手教你用文本挖掘剖析54万首诗歌
栏目导航
数据分析与数据挖掘
求助成功区
新手入门区
商学院
论文版
行业分析报告
热门文章
表格结构数据的核心特征及具象实例解析
湖南统计年鉴2025(Excel版)
2026太空算力发展研究报告
中国提振消费的战略选择与国际经验,提振消 ...
下载到假资源如何退单
高教现代数学基础23 矩阵计算六讲 徐树方,钱 ...
【24顶刊热点!】2000-2024上市公司股价崩盘 ...
安徽全省一盘棋发力汽车产业
现代数学基础21 控制论中的矩阵计算 徐树方
求Journal of Computational and Graphical ...
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群