全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
965 0
2017-07-31
将一篇文章进行中文分词后,得到[[1]]
[1] "沪"   "指"   "走"   "强"   "创"   "近期" "反弹" "新高" "周期" "股"  
[11] "全线" "爆发" "煤炭" "有色" "钢铁" "化工" "白酒" "石墨" "烯"   "新"  
[21] "零售" "等"   "题材" "活跃" "截止" "发稿" "沪"   "指"   "上涨" "0"   
[31] "50"   "创业" "板"   "上"   "涨"   "0"    "18"   "涨价" "概念" "龙头"
[41] "宝"   "泰"   "隆"   "继续" "涨"   "停"   "租"   "购"   "同"   "权"  
[51] "概念" "市"   "北"   "高"   "新"   "三"   "连"   "板"  

[[2]]
[1] "本"   "周"   "分析" "师"   "们"   "依然" "聚焦" "于"   "分析" "风格"
[11] "转换" "和"   "周期" "股"   "多数" "分析" "师"   "对"   "创业" "板"  
[21] "仍"   "比较" "悲观" "认为" "在"   "创业" "板"   "快速" "反弹" "背景"
[31] "下"   "风格" "切换" "仍"   "未"   "到"   "来"   "建议" "坚守" "核心"
[41] "资产" "和"   "金融" "龙头"
    ……
另外有一个词库的文本文件,内容如下(不全)
词库:爱宠 爱戴 爱抚 爱好 爱护 爱怜 爱恋 ……
想要统计该文章中有多少个词库里的词语,应该如何编写代码啊?









附件列表
QQ图片20170731204525.png

原图尺寸 38.11 KB

QQ图片20170731204525.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群