全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
7046 8
2019-01-08
各位大神,谁有中文分词停用词txt文件,可以分享一下吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-1-8 16:40:13
dat格式的
附件列表

stopwords.rar

大小:5.59 KB

只需: 10 个论坛币  马上下载

中文停用词

本附件包括:

  • stopwords.dat

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-8 17:26:35
https://github.com/goto456/stopwords
目前网上能得到的最流行的几个停用词表在这都能下载,但是说实话没有一个是能直接拿来用的
英文有一个普遍认同的通用停用词表,但是在中文中目前貌似没有一个适合所有研究的停用词表
如果只是做个词云看一看之类的这个就够用,但是比较细节的研究还是建议把这些作为参考构建自己的停用词表比较好
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-9 09:37:38
谢谢楼上,我之前没有登过github网站,请问刚才分享的停用词表怎么下载到本地电脑呢?
github停用词表.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-10 19:25:28
pennyr617 发表于 2019-1-9 09:37
谢谢楼上,我之前没有登过github网站,请问刚才分享的停用词表怎么下载到本地电脑呢?
在最外面点那个绿色的clone or download,然后选择download ZIP
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-14 10:18:02
谢谢楼上,我已经下载停用词成功,但在导入R过程中遇到问题,请问该如何解决?具体导入代码和导入文本截图如下所示:
stopwords<- read.table("D:/R-learning/中文停用词表.txt",stringsAsFactors = FALSE,encoding = "UTF-8",sep = "\n")
导入停用词表问题.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群