全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1010 0
2021-06-21
CDA网校致力于以优质的人工智能在线教育资源助力学员的DT职业梦想!课程内容涵盖数据分析机器学习深度学习人工智能tensorFlowPyTorch知识图谱等众多核心技术及行业案例,让每一个学员都可以在线灵活学习,快速掌握AI时代的前沿技术。PS:私信我即可获取CDA会员1个月免费试听机会
这篇文章主要为大家详细介绍了python用户评论标签匹配的解决方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下


我们观察用户评论发现:属性词往往和情感词伴随出现,原因是用户通常会在描述属性时表达情感,属性是情感表达的对象。还发现:属性词和专用情感词基本都是名词或形容词(形谓词)。

算法流程图如下:

评论数据如下:

代码如下:

代码如下:   
#encoding=utf-8

#############################
#
# 功能:给定一些中文的产品评论,希望从中找到评价对象及评价词。
#
# @author:licl
#
##############################

fdata = open('JD_DFB_comments_out.txt','r')
Output = open('Pattern_Result.txt','a')

try:
data = fdata.readlines()
   
listline = []
   
   
for line in data:
   
  listline = line.replace(" ","/")
  listline = listline.split("/")
   
  i = 1
   
  while i < len(listline):
     
   if listline != "名词":
      
    i = i+2
      
   else:
      
    new_list = ["","",""]
    new_list[0] = listline[i-1]
      
    a = i-1
    i = i+2
      
    while i < len(listline):     
      
     if listline == "标点":
        
      i = i+2
      break
      
     else:
        
      if listline[i-1]=='不' or listline[i-1]=='不怎么样' or listline[i-1]=='不怎么' or listline[i-1]=='不太':  
       new_list[1] = listline[i-1]
      if listline == "形容词" or listline == "形谓词":
       new_list[1] += listline[i-1]
         
       b = i-1   
       t = (b-a)/2  
       new_list[2] = str(t)
       for line in new_list:
         
        Output.write(line + " ")
         
       Output.write("\n")  
       break
        
      else:
      
       i = i+2
except:
print "‘文件不存在'或者‘文件无法打开'"
   
finally:
   
fdata.close()
Output.close()
以上就是本文的全部内容,希望对大家的学习有所帮助



扫码下载CDA数据分析师APP,更多免费精彩内容等你来学!题库


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

分享

扫码加好友,拉您进群