AIU人工智能学院:数据科学、人工智能从业者的在线大学。
数据科学(Python/R/Julia)数据分析、机器学习、深度学习
人工智能并非万能钥匙,并非所有事情都能用人工智能解决。但同样,人工智能也并非是虚无缥缈的新技术,它的身影已出现在生活中的方方面面。

谈到人工智能,相信各位读者都不会陌生,字面意思也很容易理解。
有些人眼里,人工智能已经是一种很成熟的计算机技术,可以帮我们做很大的事情,大到预测局部地区明天的天气如何、分析金融市场的股票交易波动;也可以帮我们做很小的事情,小到拍照时的贴纸自动追随人脸,推送我感兴趣的新闻或商品,这些都可以用人工智能实现。
但是在另一些人眼里,人工智能还是待在实验室的新事物,它离我们的生活还很远,我们现在接触的人工智能最多算是个人工智障,现在炒得大热的人工智能概念只是资本游戏的噱头,其实它什么都没有改变。
在日常工作中,我发现很多身边朋友以及互联网从业者同样对人工智能存在不少误解,我尝试结合我过去的一些经验,聊一聊我的看法。在此我们先聊聊,人工智能的概念为啥突然这么火。
一、人工智能为什么突然崛起?
很多人都误认为,人工智能是近几年才被创造出来的新概念。
实际上最早提出 " 人工智能 " 这个概念是在 1956 年美国达特茅斯学院的一次学术会议上。虽然当时这个会议只进行了一个月,也没有取得什么实质性的进展,但是这个会议首次正式提出 " 人工智能 " 一词,并且沿用至今。
尽管在当时,对于人工智能的研究进展非常缓慢,但是经典的科幻电影《2001 太空漫游》还是表达了当时的人们对人工智能的美好幻想。又经过了近 50 年的发展,人工智能从电影的幻想逐渐走进了人们的日常生活,并且成为了各个领域的得力助手。
这个过程并非一帆风顺。

上世纪 80 年代前后,日本人研究了一种能够模拟人类专家决策能力的计算机系统,称为专家系统。这个专家系统实际上就是一个巨大的知识库,再通过一些推理规则让这个系统能够根据提问找到答案。
这种专家系统能够根据输入的问题,提供回答是当时人工智能技术的代表,一定程度上也是计算机 " 智能化 " 的表现。因此这个项目得到日本政府的高度重视,投入了大量的人力物力研究,希望能打造一个计算速度更快、知识储备量更高的专家系统。受到日本人的刺激,同期美国和许多欧洲国家也纷纷进入到这个赛道中。
可以预见的是,专家系统最初取得的成功是有限的,因为它无法自我学习并更新知识库,维护成本极高。就像以前没有联网的车载导航系统一样,每年都需要更新地图否则这个系统一年以后就废掉了,无法给出正确的指引。
专家系统的失败,也让人们对于人工智能的信任产生了巨大的危机,硬件市场的溃败和理论研究的迷茫,加上各国政府和机构纷纷停止向人工智能研究领域投入资金,导致了数年的低谷。
好在资本不再关注人工智能的时候,人工智能的理论研究还在缓慢进行中。1988 年,美国科学家 Judea Pearl 将概率统计方法引入人工智能的推理过程中,这对后来人工智能的发展起到了重大影响。1989 年,AT&T 贝尔实验室的 Yann LeCun 和团队使用卷积神经网络技术,实现了人工智能识别手写的邮政编码数字图像。
在此后近二十年,人工智能技术逐渐与计算机技术、互联网进行深入融合。得益于大规模并行计算、大数据、深度学习算法和人脑芯片这四大催化剂的发展,以及计算成本的降低,使得人工智能技术突飞猛进。
它利用计算机和互联网的发展机遇,化名为商业智能、数据分析、信息化、自动化等等,渗透到社会发展的每个角落。
一方面,互联网的推广为人工智能创造了很多落地应用的场景,体现出真正的价值;
另一方面,计算机软硬件的升级为人工智能提供了强大的运算力,以前在理论上才能实现的算法得以落地,让人工智能在越来越多赛事上创造奇迹,甚至超越人类。
2011 年沃森在自然语言常识问答比赛中战胜人类选手,ImageNet 挑战赛上图像识别算法准确度超越人类;2016 年,AlphaGo 战胜李世石,成为第一个战胜世界围棋冠军的 AI 机器人…
二、人工智能还是人工智障?
近两年人工智能被人们诟病最多的地方是:人工智能体现不出智能。
很多人对人工智能的认知都是分裂的。一方面媒体不断报道人工智能又取得了什么样的新成果,国外各路大咖让人们要警惕人工智能的发展,人工智能还被纳入我国发展的规划中等等。
另一方面,新闻里经常传出自动驾驶又发生事故,家里的智能家具表现地像个智障一样,资讯平台总是傻傻地推同样类型的新闻等,这些现象都让我们疑惑,人工智能到底智能在哪里?
回答这个问题之前,我们有必要搞清楚,强人工智能和弱人工智能的区别。
最初,在达特茅斯会议提出人工智能一词时并没有强与弱之分。普遍认为人工智能就是让机器拥有思想,能够像人类一样决策。当时各种算法的研究也是奔着这个目标而去,希望能够模拟人类决策的方式赋予机器真正的智能。
但很快就有人发现:在这种方式下实现的人工智能并非真正的智能,只是对人类智能的模拟。美国哲学家 John Searle 提出了一个思维实验:中文房间(Chinese Room Argument),它是这样的:

想象一位只会英语的人身处一个房间之中,这间房间除了门上有一个小窗口以外,全部都是封闭的。他随身带着一本写有中文翻译程序的书。房间里还有足够的稿纸和铅笔。
写着中文的纸片通过小窗口被送入房间中。房间中的人可以使用他的书来翻译这些文字并用中文回复。虽然他完全不会中文,Searle 认为通过这个过程,房间里的人可以让任何房间外的人以为他会说流利的中文。
值得注意的是,这本书仅仅是语法的对应,并不涉及到任何语义的说明。房间中的人,只需要按照对应的回答,拼凑出相应的中文字符递出去即可。在这个过程中,他并不理解问题和他所写的答案是什么意思。
Searle 认为,人工智能就是这样工作的。他认为计算机根本无法真正理解接收到的信息,但它们可以运行一个程序,处理信息,然后给出一个智能的印象。
例如图像识别技术,它的工作原理就是将颜色变成数字编码,再从这些数字编码中找到特征,查找字典,找到对应的解释然后显示出来。实际上计算机压根不知道自己识别的到底是飞机还是兔子,只是字典告诉它这个特征很大概率对应的是 " 飞机 " 这个单词。
绝大部分算法在本质上都是在玩概率的游戏,不同的方式只是在模型训练时需要的信息不同,以及计算出来对应 " 飞机 " 的判定方式不同。

当前所有被广泛应用的知名模型都是通过矩阵运算训练数据来获得某种概率分布。复杂模型的概率分布通常是高维的,这里又会引申出各种数学方法,但本质的思想依旧是想通过概率分布来描述训练数据的特征。有了这些,对于同类的数据,就可以使用相同的概率分布去描述,从而实现所谓的 " 识别 " 或 " 预测 "。
实际上并非模型真的像人类一样理解了什么是 " 飞机 ",只是通过这种方式,模型能够大概率把长得像飞机的图片识别出来。
后来业界也普遍认识到这一点。因此把人工智能这个概念又划分为强人工智能与弱人工智能。
强人工智能流派仍然追求让计算机拥有人类的心智与意识,具有自主选择行为。就像西部世界中从固化程序逐渐演化出自我意识的梅芙一样。但是强人工智能的研究难度较大,市面上还没有成熟的应用。

关注“AIU人工智能”公众号,回复“白皮书”获取数据分析、大数据、人工智能行业白皮书及更多精选学习资料!