人工智能产业的一大趋势就是企业合并越来越频繁。具体来说主要体现为两类,一是上游芯片商整合架构平台商,从而推出差异化的人工智能处理器;二是基础应用商整合行业应用商、行业大数据商,从而迅速进入细分行业。 仅最近几个月内,就发生了数起人工智能创业公司和技术公司被收购的案例。这其中Intel希望通过收购Nervana和Movidius挑战NVIDIA在GPU界的地位,剩下的无一例外都是基础应用商的收购。
图表1: 近期人工智能公司收购案例

基础应用需要行业应用的带动,这对学术界也产生了很大影响,因为不参与应用的开发就很难获得技术上大的进步。 从2013年3月Google直接以收购公司的方式挖来深层神经网络的提出者Geoffery Hinton开始,人工智能科研人员进入业界的大潮就拉开了帷幕。很快,Hinton的同事、CNN的主要推动者Yann LeCun加入Facebook人工智能实验室。中国也是如此,比如百度首席科学家Andrew Ng(吴恩达)是斯坦福大学人工智能实验室主任,DeepID创始人汤晓鸥教授成立了商汤科技等等。2016 年,这一趋势更加明显。
学术界的人才在向产业界流动的同时,产业界也在凭借自身强大的优势资源产出高质量的学术成果。谷歌、微软、Facebook、腾讯、百度等科技巨头的人工智能研究机构发表了大量的学术论文,真正推动了人工智能的发展。就连一贯遵循保密策略的苹果也在2016年12月发布了其第一篇人工智能论文《Learning from Simulated and Unsupervised Images through Adversarial Training》。 学界与业界的壁垒正在逐渐打破,人工智能的落地速度无疑会再上一个台阶。
人工智能的传统模型是把实体数据表达成数字数据,并通过机器学习的方法,输出数字数据作为判断依据。随着深度学习的发展,更纯粹的端到端学习成为了可能。 比如传统的语音识别,需要把语音转换成数字向量,然后把这组向量通过机器学习分类到各种音节上,最后通过音节还原出语音原本要表达的单词。而现在我们可以通过深度学习自己的特征学习功能来完成从特征提取到音节表达的整个过程,将语音直接对标到最终显示出来的文本。
图表2: 语音识别的端到端模型

端到端学习需要足够大、有标注的训练集做支撑,这样才能精确的提取特征,学会复杂的功能控制。 另一个例子是智能驾驶。目前智能驾驶技术都是传统模型的:通过图片观测附近的车辆与行人,计算出路径规划,然后通过公式判断下一步行动。鉴于自动驾驶对安全的要求,纯粹的端到端学习仍然难以满足准确度。如果想直接把图片处理成最终的操作指令,还有很长的一段路要走。
目前在精确度需求较高的行业内,端到端学习还不够有效,不过其应用起来简单、方便,而且降低网络核心复杂度,简化复杂功能,是将来人工智能走向应用的趋势。
基础应用商的技术水平将逐渐趋近且增长减缓。目前来看,以深度学习为代表的监督学习难以突破这一瓶颈。真正的突破会在无监督学习与强化学习上,我们认为无监督学习与强化学习将在未来5-10年重塑人工智能,这也是基础应用商将来发展的最大机会。