全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2707 2
2015-07-14


我想用R 提取英文方文章的关键字,请问有什么包可以使用?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-7-14 18:08:48
##没有包的话可以试试这个
passages <- "good good study, day day up."
words_pos <- gregexpr("[a-zA-Z]+",passages)[[1]] ##正则表达式查询单词开头位置、长度,以便后来分割出单词
words_sav <- vector("character",length=length(words_pos)) ##初始化词语表,长度为单词数
for(i in 1:length(words_pos)){
    words_sav <- substr(passages,words_pos,words_pos+attr(words_pos,"match.length")-1)
} ##分割为单词
freq <- table(words_sav) ##合并重复单词
freq2 <- rev(sort(freq)) ##词频从大到小排列,除了特殊词,词频大的说明关键
> freq2
words_sav
good   day    up study
    2     2     1     1

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-15 12:57:48
万人往LVR 发表于 2015-7-14 18:08
##没有包的话可以试试这个
passages
这种方法不好吧,没办法找真正的关键字,有其它办法或包吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群