摘要:文本数据含有与文章内容高度相关的额外信息,而标准的LDA主题模型对这些信息没有加以利用,导致在很多文本的处理过程中出现对关键信息的遗漏的问题,降低了LDA模型的主题提取能力和数据降维能力。构建一种利用文档文摘信息的SLDA模型,在对文档建模时引入机械抽取的文摘信息,通过文摘信息对文档内容平滑,可以很全面地利用文档自身特征信息,从而提高了模型对文档的主题提取能力和数据降维能力。实验结果表明,在标准的LDA模型中引入文摘信息可以提高模型的文档主题提取能力。http://www.cqvip.com//QK/93273X/201619/669315957.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)