全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1362 0
2017-09-26
我是R的初学者,刚刚尝试用 AFINN, Bing et al., NRC 来分析一个txt文件,但是结果非常奇怪。希望各位可以帮我看看问题出在哪,谢谢!!
code:
setwd("/Users/naifeipan")
news_us.v <- read_file('news_us.txt')
news_us.lines.v <- unlist(strsplit(news_us.v, split = '\n'))
news_us.lines.v = gsub("\r", "", news_us.lines.v)
news_us.lines.v
news_us.df <- data_frame(prez = 'news', lines = news_us.lines.v) %>%
  mutate(line_id = row_number()) %>%
  unite(doc_id, prez, line_id, remove = FALSE) %>%
  unnest_tokens(word, lines)
news_us.df

get_sentiments("afinn")
get_sentiments("bing")
get_sentiments("nrc")

afinn <- news_us.df %>% inner_join(get_sentiments("afinn")) %>% group_by(index = line_id) %>%
  summarise(sentiment = sum(score))%>% mutate(method = "AFINN")

bing_and_nrc <- bind_rows(news_us.df %>% inner_join(get_sentiments("bing")) %>%
                            mutate(method = "Bing et al."), news_us.df %>%
                            inner_join(get_sentiments("nrc") %>%
                                         filter(sentiment %in% c("positive","negative")))%>%
                            mutate(method = "NRC")) %>%
  count(method, index = line_id ,sentiment)%>%
  spread(sentiment,n,fill = 0)%>%mutate(sentiment = positive - negative)

bind_rows(afinn, bing_and_nrc)%>%ggplot(aes(index,sentiment, fill = method)) +
  geom_col(show.legend = FALSE) + facet_wrap (~method, ncol=1,scales = "free_y")

par(mfrow=c(1,1))

下面是图:
Screen Shot 2017-09-26 at 12.59.36 AM.png


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群