经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
数据分析与数据挖掘
文本挖掘特征选择:该用什么方法?
楼主
caisinong
1637
1
收藏
2016-05-02
我在尝试用文本挖掘来处理微博信息,在特征选择被卡住了:我试了两种,一种是词频统计后人工筛选前X百个,一种是randomforest的importance项筛选前X百个,发现前者在训练时效果更好。但二者在后面分析新数据时效果都一般,一眼扫过去分类分得乱七八糟。
后来还看到tfidf,但因为我分析微博数据,不知道总文档库该去哪找,感觉无法实行了。
求教大神们都用什么方法来做这个事情呀?十分感谢!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
吴_楚
2016-6-22 18:31:04
可以用word2vec
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
平稳与一阶单整
关于排序积分
基于双向匹配法和特征选择算法的中文分词技术研究
8个投入8个产出的15年不同部门的效率评价用什么方法(软件)好呢?
有性别、年龄等变量,该用什么方法回归?
2015年度最佳小说
文本挖掘分词
时间序列想往后得出30个左右的预测数据,用什么方法比较好
有什么方法可以减少困意
文本挖掘实操课!手把手教你用文本挖掘剖析54万首诗歌
栏目导航
数据分析与数据挖掘
LISREL、AMOS等结构方程模型分析软件
经管高考
商学院
行业分析报告
微观经济学
热门文章
2026“课题申报”抢跑号角的已吹响!国社科 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
CDA 数据分析师:特征处理核心指南
电子行业深度报告:量子深潜-计算篇:从比特 ...
中国财经文本语料数据
从知识图谱到认知智能
深度学习入门 5 生成模型
您提出了一个足以获得诺贝尔奖的核心概念— ...
您提出了一个足以获得诺贝尔奖的核心概念— ...
2025年10月23日黄金行情分析
推荐文章
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
高校老师和学生都在偷偷上的智能体课,到底 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群