全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 学道会
368 2
2019-09-02
2019.09.02
1、机器翻译的发展之路:1)基于规则,依靠人来写规则并教机器如何去翻译 2)基于统计的机器翻译之法,给到机器一堆语料让机器自己去学习翻译规则,被赋予了概率 3)将整个推理过程映射到一个高维空间中,并在高维空间中进行运算。
2、在基于规则和基于统计的机器翻译方法下,词语形态分析是机器翻译首先需要解决的问题。对于中文而言,汉字的翻译效果很差,分词是必须解决的问题。中文以外的很多语言都存在形态问题,英语的形态问题比较简单,因为英语词的变化较少;法语有四五十种变化,俄语更多;以土耳其和波斯语为例的黏着语,一个词可能有上千种变化。
3、目前最好的是神经网络机器翻译框架,神经网络可以很好地捕捉句子的结构,无需进行句法分析,系统可以自动获得处理复杂结构句子翻译的能力。在神经网络机器翻译框架下,端到端训练成为标准模式,所有模块构成一个有机的整体,针对同一个目标函数同时训练,有效避免了错误传播,提高了系统性能
4、基于规则的机器翻译方法中,可以通过修改规则来纠正;基于统计的机器翻译方法,虽然改的方式绕一点,但是统计的数据都是可以解释的,可以在其中加上一个短语表来纠正,但在神经网络机器学习方法中,几乎是不能进行修改的
5、深度学习的边界:数据边界、语义边界、符号边界和因果边界
数据边界是指当前的数据不够;语义边界是指现在的自然语言处理系统大部分都无法对客观世界进行精准建模;符号边界,神经网络实际上是潜意识的行为,可以输入语言和输出语言表达,但是无法对整个推理和计算过程进行描述;因果边界,即神经网络很难理解事物之间的因果关系
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-9-2 14:26:57
学习笔记奖!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-1-27 14:08:25
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群