Rwordseg中如何查看分词后的词性

3929

收藏 2016-10-12

在使用Rwordseg的过程中，我自定义了一些词，并加入到词库中。如下：

#否定词
negWords=c("无","不","不在")
insertWords(negWords,strtype = rep("neg",length(negWords)))

#分词
x <- segmentCN(teststring3,nature=TRUE)
x[1:7]

userDefine q n v n userDefine v r
"标的车" "溜" "车" "撞" "门" "标的车" "受损" "三者"

我打算查看每个词的词性，根据词性再进行处理，比如：看每个词的前后二个词的词性是否是否定词。

我的问题是，怎么单独取到每个词的词性？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

baoyuzeng

2016-10-13 08:25:35

q n v n userDefine v r 这些就已经是标明它的词性了啊。。你可以对照一下这个网站关于词性的说明http://blog.csdn.net/kevin_darkelf/article/details/39520881

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

happyjavadxn

2016-10-21 22:41:37

多谢！names(x[2])可以提取词性。

还有个问题，请问谁知道词性如何修改？比如：“不”，
test <- segmentCN("不",nature=TRUE) 显示如下词性。
d
"不"

我要修改“不”的词性，比如：neg.
#否定词
negWords=c("无","不")
insertWords(negWords,strtype = rep("neg",length(negWords)),save=TRUE)

但是自定义词库后，"不"这个词的词性无法改变。

求解答。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

sette1222

2017-3-2 17:40:55

tagseg <- worker(type="tag")
tagseg[".txt"]
对文本文件分词后，分词结果显示成“牵 v 手 n 男朋友 n 麻麻 n 送 v 衣服 n 阿姨 nr 潮 n 抽 v 抽 v”，怎么去除某一类词性的词语？因为词性和词语混合在一起了啊

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群