全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1353 0
2017-10-14
各位前辈好,最近刚刚开始学习R,基础不是特别好,在分词的时候有一些疑问,在论坛上搜索了一些帖子后还没能解决我的问题。希望各位前辈能多多指教。

1.使用jieba分词后能否去掉重复词,例如说文本是“他买了一个苹果和一个桔子” 但最后保留“他,买了,一个,苹果,和 桔子”

2.在学习批量分词的时候遇到了问题,比如下面批量读取一些文件
复制代码

我在work里有100个txt文件,执行上面的代码我把文件都读取到data里,下一步我想jieba分词,应该怎么弄呢?
复制代码

分词结果我想保存在list中,并且顺便一个个的输出到制定文件夹里。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群