基于弱监督学习的海量网络数据关系抽取

646

收藏 2018-01-31

摘要：在大数据时代，对于海量网络数据的信息抽取与应用已成为自然语言处理和信息检索技术发展的重要主题．其中，基于弱监督的关系抽取方法，因为具有不需要过多人工参与、适应性强的特点，受到了广泛的关注．目前针对它的研究主要集中在英语资源上，主要使用传统的词法和句法特征．然而，词法特征有严重的稀疏性问题，句法特征则对一些语言分析工具的性能有较强的依赖性．提出利用n—gram特征来缓解传统词法特征稀疏性的问题．特别地，这种特征还可以弥补传统句法特征在其他语言上不可靠的情况，对于关系抽取的跨语言应用有重要作用．在此基础上，针对弱监督学中标注数据不完全可靠的情况，提出基于bootstrapping思想的协同训练方法来对弱监督关系抽取模型进行强化，并且对预测关系时的协同策略进行了详细分析．在大规模的中文和英文数据上进行实验的结果显示，把传统特征与n-gram特征相结合并进行协同训练，在中文和英文数据集上均可以提升弱监督关系抽取的效果，可以适应多语言的关系抽取需求．http://www.cqvip.com//QK/94913X/201309/46962223.html

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群