全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
3844 3
2016-10-12
在使用Rwordseg的过程中,我自定义了一些词,并加入到词库中。如下:

#否定词
negWords=c("无","不","不在")
insertWords(negWords,strtype = rep("neg",length(negWords)))



#分词
x <- segmentCN(teststring3,nature=TRUE)
x[1:7]

userDefine          q          n          v          n userDefine          v          r
  "标的车"       "溜"       "车"       "撞"       "门"   "标的车"     "受损"     "三者"


我打算查看每个词的词性,根据词性再进行处理,比如:看每个词的前后二个词的词性是否是否定词。

我的问题是,怎么单独取到每个词的词性?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-10-13 08:25:35
  q          n          v          n userDefine          v          r  这些就已经是标明它的词性了啊。。你可以对照一下这个网站关于词性的说明http://blog.csdn.net/kevin_darkelf/article/details/39520881
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-21 22:41:37
多谢!names(x[2])可以提取词性。

还有个问题,请问谁知道词性如何修改?比如:“不”,
test <- segmentCN("不",nature=TRUE) 显示如下词性。
   d
"不"

我要修改“不”的词性,比如:neg.
#否定词
negWords=c("无","不")
insertWords(negWords,strtype = rep("neg",length(negWords)),save=TRUE)

但是自定义词库后,"不"这个词的词性无法改变。

求解答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-2 17:40:55
tagseg <- worker(type="tag")
tagseg[".txt"]
对文本文件分词后,分词结果显示成“牵 v 手 n 男朋友 n 麻麻 n 送 v 衣服 n 阿姨 nr 潮 n 抽 v 抽 v”,怎么去除某一类词性的词语?因为词性和词语混合在一起了啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群