我要我的滋味sd 发表于 2020-4-10 10:39 
还有个问题,特定行业的分词库一般如何搞到?我的研究方向主要是土地制度改革。
特定行业的分词目前最可行的方式是找导师要。或者用通用的分词库自己改造。或者报网课问NLP老师要。
说一下原因你就明白了,因为人人都是调包侠,想要获得机器学习的准确率优势不在于模型,而在于输入的数据量和数据精度,你想做的这个东西市面上有公司在做并且拿来卖钱,同样的NLP公司模型都差不多,优劣就在于谁的数据质量高。另外这个提高数据精度给数据打标签的方向巨花时间,比如要给一篇新闻打标签,得把新闻看一边,而且一般是一篇新闻多人看打标签,所以一旦获取数据优势,其他公司除非花同样时间,否则难以超越,因此特定行业分词库这种东西也是公司核心,原则上是不卖的,当然也存在公司卖残次品和有员工从公司带出来的可能。
你要有时间可以认真搞一搞,全流程经历一遍,毕业能找个好工作,生活也轻松些,加油!