世界500强企业研究项目招募火热进行中!
——事故风险因素文本挖掘与建模
中国人民财产保险股份有限公司于2010年开始设立研究基金,每年资助科研人员及在校学生开展相关项目研究。截至2014年,该基金累计投入近千万元。其中,资助学生项目累计50余个,金额近百万元,单个项目资助金额最高达3万元,且均已顺利通过验收。通过这些项目,相关同学不但获得了可观的收入,更重要的是,有了与世界500强企业亲密接触的机会,将实践与学习结合,能力得到了极大提高!
2015年项目申请即将启动!项目指南请在我司网站查看,地址为:http://157.122.153.71/picc_web/show_ShowDetail.action?userid=&sid=119&path=灾害研究基金 (或于百度文库搜索:中国人保财险2015年度灾害研究基金项目指南)其中拟开展项目《事故风险因素文本挖掘与建模》要求如下。如有兴趣,请与相关人员联系,反馈姓名、学校、专业、电话等信息,并提供简要计划,相关人员将与感兴趣的同学联系,深入沟通,并择优给予资助。
一、项目背景
随着数据挖掘技术的发展,文本挖掘成为一个重要的方向,广泛的应用于金融投资、热点预测、文档自动生成等领域,有较高的研究价值。当前保险企业的理赔案卷中,除了常见的标准化信息之外,出险经过、事故记录中有大量的信息以文本形式(包括文本字段,也包括各种文档和扫描图片)存在于数据库中,目前此类信息几乎没有得到有效使用。通过对以上文本信息进行挖掘分析,获得更加具体详实的险因、标的和因果关系信息,将为优化费率风险因子、管控承保风险、防灾防损等业务活动提供有力的支持。
本项目拟使用文本挖掘技术对相关文本进行分析,通过使用马尔科夫链、贝叶斯网络和谓词逻辑等技术,提取事故发生的步骤关系和场景要素,从而达到提前防范风险的效果。
二、项目内容及成果
1.使用爬虫抓取网络上相关事故描述文本(如安全监管部门网站等),通过分词等技术,对各类事故要素进行提取和分类汇总。
2.对词条进行建模分析,建立场景逻辑关系模型,分析各因素间因果联系。自动识别主要险因和对应标的。
3.撰写事故分析报告,并根据网络数据的变化,自动实时更新,对灾害事故要素进行动态监测。
本项目预期成果包括:
1. 事故要素词库和文本分析报告;
2. 文本挖掘相关模型和程序;
3. 动态监测界面或相关程序。
三、项目经费范围
2-2.5万元
四、资质要求
拥有爬虫程序开发、文本挖掘建模经验者优先。
联系人:
康璐,010-85176679,kanglu@picc.com.cn