各位前辈好,最近刚刚开始学习R,基础不是特别好,在分词的时候有一些疑问,在论坛上搜索了一些帖子后还没能解决我的问题。希望各位前辈能多多指教。
1.使用jieba分词后能否去掉重复词,例如说文本是“他买了一个苹果和一个桔子” 但最后保留“他,买了,一个,苹果,和 桔子”
2.在学习批量分词的时候遇到了问题,比如下面批量读取一些文件
我在work里有100个txt文件,执行上面的代码我把文件都读取到data里,下一步我想jieba分词,应该怎么弄呢?
分词结果我想保存在list中,并且顺便一个个的输出到制定文件夹里。