狂欢观看“
人工智能的历史”
简介: 关于AI / ML最早的一段有趣的纪录片,以及我的另一篇关于我们如何真正向刚起步的人描述我们的职业发展的记录。
在当今的日冕病毒中,比疯狂地观看精彩视频更自然。Futurology近期提供了免费观看YouTube 赞助的“ 人工智能的历史 ”,这让我很感兴趣。这个长达两个半小时的视频被描述为“记录片的高潮,涵盖了基于计算的人工智能的历史和起源。”
因此,在我的WFH办公室内弯腰,手持几只红牛,我急切地想看看其他人如何描述这些开创性的事件。所介绍的“纪录片”包括将近全长的片段,其中几段分别是50年代,60年代和70年代的黑白,并接受了该领域一些真正伟人的采访,包括:
思维机-用自己的话语(AT&T贝尔实验室的Claude Shannon访谈,被称为信息论之父)52分钟。
15分钟内的思维机(来自贝尔实验室的更多内容,包括早期的OCR和NLP)。
改变世界的机器55分钟。
约翰麦卡锡访谈25分钟。
如果您不知道名字,麦卡锡和明斯基在MIT成立了第一个致力于AI研究的部门时,就被广泛认为是AI领域的奠基人。
多年来,贝尔实验室相当于整个硅谷的一家研究机构。尽管他们的真正专营权是更好,更快,更便宜的电话服务,但研究人员从早期计算机视觉和NLP创造了一系列不断的创新。
听到这些创始人的“实时”想法真是令人着迷。但是,视频的重点是,这些早期确实与我们现在归类为AGI(人工智能通用)有关。
不难理解,在AI的早期,人们对计算机是否或如何模仿人类思维给予了很多关注。在这些日子里,在学习理论上进行了大量开创性研究,导致人们广泛相信计算机无法复制人类思想的许多方面。
今天,我们将其描述为强或宽AI与窄AI之间讨论的最早阶段。在50年代,60年代和70年代,这些想法刚刚融合在一起。今天的定义实际上就是“专家系统”,这被证明是人工智能。这就是确定性瀑布程序,类似于决策树,该决策树在狭窄的专业领域内嵌入了几百条规则,实际上可以与专家的决策相抗衡,但只能在其极其狭窄的领域内进行。所有这些都是经过编程的,没有一种是未经指导的发现。
当我为努力阐明这一原始话语而称赞时,我离开时却以为,刚接触AI的年轻人很可能会被我们历史的精选版本完全误导。
替代历史提案
2001年,我与我的小型咨询公司全职进入数据科学领域,专注于相对较新的预测建模领域。多年以前,我一直是壁橱迷,并在90年代领导了我第一次基于AI / ML的咨询业务,并预测了日本领先汽车公司推出的新车型在价格和市场份额之间的权衡。所有这一切都可以说,除了纪录片中描述的最早的日子,我几乎经历了所有这些发展。
这是设计此简介的另一种建议,以及如何最好地向刚进入该领域的人描述它。尽管我们可以将其分成更小的部分,但我仅建议三个主要章节:
早期预测建模
大数据与加速变化
收养时代
早期预测建模
随着时间的流逝,我们的专业已经为人们所熟知,从KDD(从数据库中发现知识)到预测建模,再到AI / ML(人工智能/
机器学习)。而且,现代AI / ML的所有发展都是关于使用未经明确编程的算法发现数据中的信号或模式。
这不是AGI。到了现代AI / ML的早期,我们的主流运动已经绕开了试图模仿人脑中的学习以获得更实用和商业上有价值的模式识别的问题。他们为什么来,为什么他们留下,为什么他们去,他们接下来会买什么。
早期预测建模的时代源于采用关系数据库,尤其是商业智能。当然,今天我们将BI视为倒退描述发生的事情。但是,为建立BI数据库而进行的大量工作和金钱投入,以及它们早期的单一版本真相,为将来的预测性建模铺平了道路。
预测技术主要由相对简单的回归和决策树统计程序主导,这些程序主要来自SAS和SPSS。人们对神经网络的兴趣日益浓厚,
神经网络后来成为浅薄的感知器。他们对更大的计算能力的要求被视为不利,因为他们的黑匣子性质以及设置和培训的困难。人们对用于回归和分类的遗传程序产生了新的兴趣,而不仅仅是优化。
从业务角度来看,这些日子里每次客户会议都必须以冗长的“那是什么”介绍开始,而不是今天已经准备好并急切地接受。采用肯定是一场艰苦的战斗,但直接营销中的人们是重要的用户。
本质上,功能仅限于可以从BI和关系数据库中提取的内容,所有这些都需要转换为数字或高度规范化的文本。
大数据与加速变化
为了我的钱,大数据的引入拉开了我们行业最激动人心的时期。种子是由Google于2002年种植的,但由道格·切特(Doug Cutting)和他在Yahoo的合作者带来了满满的花,后者释放了开源Hadoop。
仍然需要提醒我们该领域的初学者,大数据不只是大量数据。在2000年代初期,数TB的数据是巨大的。今天,我已经在笔记本电脑上找到了。大数据价值的真正关键是开放文本和图像数据类型,无需在存储前使用架构,并为流式传输成为边缘计算和物联网的数据开辟道路。
这些都不是立即的。第一次Hadoop开发者大会直到2008年才开始,直到2010年代初才真正开始。最终,Spark取代了Hadoop,它具有更广泛的功能并且对开发人员更友好。
大数据是关于一件事如何导致另一件事的案例研究。大数据需要更多的计算量。这既加强了云又提高了MPP(多个并行处理)的速度。随之而来的是,随着芯片架构的稳步改进以及游戏GPU在这种环境下比CPU更好的发现,使DNN(深度神经网络)走在了前列。DNN为我们提供了现代语音和文本NLP,以及基于Hadoop和Spark基本功能构建的图像识别和计算机视觉。
云计算和越来越便宜的计算也为继续开发强化学习(Reinforcement Learning)提供了开端,这是游戏和自动驾驶汽车背后的另一端。这些相同的功能还导致了回归和树算法的快速发展,最终达到了诸如XGBoost之类的现代集成技术,以及将DNN用于回归和分类问题。
收养时代
大数据和加速变化的时代是令人欣喜的时刻,每年都会引入新的令人兴奋的技术和功能。这种情况在2017年底停止了。
包括从2018年开始参加主要会议的所有人在内的每个人都指出,技术和性能的提升突然变得越来越多。DNN和Reinforcement Learning在游戏,语音识别和翻译,图像分类和计算机视觉方面达到了与人类水平相称的出色成绩。
最初,这令人失望。但是,事实是它标志着一个转折点,现在人们认为它是安全的,并且对于企业采用而言是合乎需要的。这个领养时代将持续一段时间。AI / ML的新语言在业务对话中正变得司空见惯。与早期引入计算机一样,由于AI / ML,我们正处于人类和企业生产力急剧增长的风口浪尖。
在我看来,这是新进入者应该吸收的AI / ML历史的跨度和范围。同时,如果您想观看原始纪录片,我建议您像以前一样以2倍的速度观看,并随身携带Red Bull。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!