R 提取英文方文章的关键字有什么包可以使用？

532884770

2778

收藏 2015-07-14

我想用R 提取英文方文章的关键字，请问有什么包可以使用？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

万人往LVR

2015-7-14 18:08:48

##没有包的话可以试试这个
passages <- "good good study, day day up."
words_pos <- gregexpr("[a-zA-Z]+",passages)[[1]] ##正则表达式查询单词开头位置、长度，以便后来分割出单词
words_sav <- vector("character",length=length(words_pos)) ##初始化词语表，长度为单词数
for(i in 1:length(words_pos)){
words_sav <- substr(passages,words_pos,words_pos+attr(words_pos,"match.length")-1)
} ##分割为单词
freq <- table(words_sav) ##合并重复单词
freq2 <- rev(sort(freq)) ##词频从大到小排列，除了特殊词，词频大的说明关键
> freq2
words_sav
good day up study
2 2 1 1

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

532884770

2015-7-15 12:57:48

万人往LVR 发表于 2015-7-14 18:08
##没有包的话可以试试这个
passages

这种方法不好吧，没办法找真正的关键字，有其它办法或包吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群