全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1213 0
2020-07-29
著名的AI图灵测试可倒置和倒置,以及对自动驾驶汽车的启示
我们怎么知道世界何时到达了人工智能
需要澄清的是,如今有很多关于体现AI的计算机的主张,这意味着该机器等同于人类的智能,但是您需要警惕那些相当粗鲁而直接的虚假断言。
开发AI的人的目标在于,有一天能够拥有一个能够展示人类智能的基于计算机的系统,从而以人类智能存在和展示自身的最广泛,最深入的方式来做到这一点。
尚未设计出任何此类AI。
关于这个问题的困惑已经变得一发不可收拾,以至于AI领域被迫提出一个新的绰号来表达AI的崇高目标,现在宣布该目标是实现人工智能( AGI)。
这样做是为了向非专业人士和广大公众强调,自负的和期望的AI将包括常识性推理和人类具有的其他许多类似情报的能力(有关强AI的概念的详细信息)以及弱AI和窄AI,请在此链接中查看我的解释)。
既然关于AI的构成和不构成的东西有很多困惑,您可能想知道我们最终将如何确定AI是否得到了明确的认可。
我们理应坚持不仅仅具有挑衅性的声明,而且我们应该对持有其宣称是真正的AI系统的任何人保持怀疑。
既然关于AI的构成和不构成的东西有很多困惑,您可能想知道我们最终将如何确定AI是否得到了明确的认可。
我们理应坚持不仅仅具有挑衅性的声明,而且我们应该对持有其宣称是真正的AI系统的任何人保持怀疑。
光是外观不足以证明到货。
AI技巧包中有许多客厅特技,可以使很多人以为他们以为自己目睹了AI具有令人赞叹的类人特质(请参阅我在此链接上对这种骗术的报道)。
不,仅凭别人的话就可以说人工智能已经成就,或者仅仅踢着人工智能的疲倦来无能为力地评估其优点是不充分的,而且毫无疑问不会这样做。
肯定有更好的办法。
AI领域的技术人员倾向于将一种称为Turing Test的测试视为寻求将AI认证为尊敬的AI或从语义上讲是AGI的黄金标准。
正如其作者艾伦·图灵(Alan Turing)的名字一样,该图灵测试是在1950年设计的,至今仍与今天相关(这是原始论文的链接),该科学家是著名的数学家和计算机科学的早期先驱。
简而言之,图灵测试相对容易描述,并且可以想象的非常简单(有关此方面的深入分析,请参见此处的链接)。
这是关于图灵测试性质的简要介绍。
想象一下,我们有一个隐藏在窗帘后面的人,还有一个藏在第二个窗帘后面的计算机,这样一来您就无法一眼就能看出这两个窗帘后面是谁,或者是谁。
在竞赛中,人和计算机被视为参赛者,这些竞赛将用于尝试确定是否达到了AI。
有些人更喜欢称它们为“主题”,而不是竞赛者,因为这样的想法可能是更多的实验,而不是游戏节目,但重点是,他们以挑战或涉及机智的竞赛形式成为“参与者”。和情报。
没有手臂摔跤,也没有任何其他身体动作。
测试过程完全是关于智力的。
主持人充当审问者(由于在该事件中具有指定的决定角色,因此也被称为“法官”),并继续向隐藏在幕后的两个参与者提问。
基于提供给问题的答案,主持人将尝试指示哪个窗帘遮住了人,哪个窗帘遮住了计算机。这是一个至关重要的判断方面。简而言之,如果主持人无法区分两个参赛者是哪个人,哪个是计算机,那么大概是计算机已经“充分证明”它等同于人类智能。
图灵最初将其称为“模仿游戏”,因为它涉及AI试图模仿人类智慧的游戏。注意,AI不一定必须以与人类相同的方式制作,因此,不要求AI具有大脑或使用神经元等。因此,欢迎那些设计AI的人使用乐高积木和胶带,如果这样做能达到与人类智能等效的作用。
为了成功通过图灵测试,包含AI的计算机必须以与人类相同的智能来回答所提出的问题。如果主持人能够宣布计算机装有哪个窗帘,则图灵测试将不成功通过,从而暗示存在某种讲故事的线索会泄露AI。
总的来说,这似乎是找出很有希望的AGI的AI而不是不太理想的AI的相当有用和有效的方法。
当然,就像生活中的大多数事物一样,此问题也有一些潜在的陷阱和曲折。
想象一下,我们为主持人设置了一个带有两个窗帘和一个讲台的舞台。参赛者完全看不见。
主持人走上领奖台,问一位选手如何制作豆煎饼,然后问另一位选手如何制作博洛尼亚三明治。让我们假设答案是恰当的,并且分别正确地描述了制作豆卷饼和博洛尼亚三明治的过程。
主持人决定停止提出任何其他问题。
主持人Voila宣布,该AI与人类的智能是无法区分的,因此该AI被宣布已达到AI的顶峰,这是AGI长期以来追求的目标。
我们应该接受这项法令吗?
我不这么认为。
这突出了图灵测试的一个重要元素,即主持人需要提出足够的范围和深度的问题,这将有助于根除智力的体现。当问题肤浅或不足时,得出的任何结论充其量都是虚假的。
也请知道,在图灵测试期间,没有经过审查和同意的特定问题集是“正确的”问题。当然,一些研究人员试图提出应该提出的问题类型,但这是一个持续不断的辩论,并且在某种程度上说明了我们仍然不确定情报本身包括什么(很难确定。相对不确定且本体上较为糊涂的指标和度量)。
关于参赛者及其行为存在另一个问题。
例如,假设主持人询问每个参赛者是否是人类。
假设人类可以诚实地回答是。AI可能会说自己不是一个人类,选择说实话,但是这无疑会破坏测试并似乎破坏图灵测试的精神。
也许人工智能应该撒谎并说它是人类。尽管有伦理学家会否定这样的回应,并争辩说我们不希望AI成为骗子,所以绝不应该允许AI说谎。  
当然,人类可能会撒谎,并否认自己是这场比赛中的人类。如果我们正在寻求制造与人类智力相当的人工智能,并且如果人类撒谎,而我们都知道人类肯定会时不时地撒谎,那么难道不应该允许人工智能撒谎吗?
无论如何,关键是参赛者可以努力帮助图灵测验,也可以尝试破坏或扭曲图灵测验,有些人说这很好,主持人必须弄清楚该怎么做。
正如他们所说,在爱情和战争中一切都公平。
我们希望主持人变得多么棘手?
假设主持人要求每个参赛者计算一个复杂的数学方程式的答案。AI可以迅速得出精确的答案8.27689459,而人类却在努力手工进行数学运算,并得出错误的答案9。
主持人阿哈(Aha)欺骗了AI来揭露自己,而人类也同样地欺骗了他们,让他们揭露他们是人类,这是通过提出一个问题,即基于计算机的AI可以轻易回答,而人类将很难回答这一问题。
信不信由你,基于这个原因,人工智能研究人员提出了一些所谓的“ 人工愚蠢”的介绍(有关此主题的详细信息,请参见我的报道)。这个想法是,人工智能将有意通过共享答案(就像是由人准备的那样)来变得“愚蠢”。在这种情况下,AI可能会报告答案为8,因此响应非常类似于人类的响应。
您可以想象让AI故意尝试犯错或步履蹒跚(这是AI创造的“ Dimwit”策略,请参阅此处的链接),似乎令人讨厌,令人不安,并且并非每个人都一定会同意这是一件好事事情。
我们的确允许人类制作服装,但是拥有AI可以做到,特别是当它“知道得更好”时,这似乎是危险且令人不快的滑坡。
反向图灵测试抬起头
现在,我为您介绍了图灵测试的整体外观。
接下来,让我们考虑一种有人喜欢称之为反向图灵测试的变体。
这是这样的。
人类竞赛者决定他们要假装自己是AI。因此,他们将尝试提供与AI的答案类型没有区别的答案。
回想一下,传统的图灵测试中的AI试图与人类似乎无法区分。在反向图灵测试中,人类参赛者试图“反转”这一概念,并像他们是AI一样行动,因此与AI并无区别。
好吧,这似乎有点有趣,但是人类为什么要这样做呢?
这样做可能是很有趣的,对于喜欢开发AI系统的人来说是一种笑。这也可能是一个挑战,试图模仿或模仿一个AI系统,并押注您能否成功完成。
另一个原因,似乎还有更多的印章或优点,在于做所谓的绿野仙踪。
当程序员在开发软件时,他们有时会假装自己是程序,并使用立面前端或界面让人们与萌芽的系统进行交互,尽管这些用户不知道程序员正在观察他们的交互并愿意也可以进行互动(从屏幕后面秘密进行,并且不显示它们的存在)。
进行这种类型的开发可以揭示最终用户在使用该软件时遇到的困难,与此同时,由于程序员悄悄地进行干预以克服可能存在的任何计算机系统缺陷,他们仍然留在软件流程中破坏了工作。
也许这清楚了为什么它通常被称为“绿野仙踪”,涉及人类停留在回路中并秘密扮演Oz的角色。
回到反向图灵测试,人类竞赛者可能会假装是AI,以找出缺少的AI,从而更好地增强AI并继续寻求AGI。
以这种方式,反向图灵测试可以用于娱乐和获利。
图灵测试上下颠倒,右侧向上颠倒
有些人认为,我们最终可能会走向有时称为“ 颠倒的图灵测试”的领域。
是的,没错,这是另一个变体。
在“颠倒图灵测试”中,将主持人替换为AI。
说什么?
这个讨论较少的变体涉及让AI担任法官或审问者,而不是由人类担任。AI询问仍然由AI和人类组成的两个参赛者的问题,然后提出关于哪个是哪个的意见。
您首先要担心的是,AI在游戏中似乎有两个席位,因此,它要么是作弊,要么只是一种荒谬的安排。那些假定这种变体的人很快指出,原始的图灵测验有一个人作为主持人,一个人作为竞赛者,因此,为什么不让AI做同样的事情。
即时的反驳是人与人之间是不同的,而AI大概是同一件事,没有区别。
那些对颠倒图灵测试感兴趣的人会说,您在这种假设中是错误的。他们认为,我们将拥有大量的AI,每个AI都是其自己的可区分实例,并且类似于人类如何成为独特的实例(总而言之,争论是AI将是多元的,异构的,而不是整体的)。或同质)。
反对意见是,AI可能只是某种软件和机器,所有这些都可以很容易地组合到其他软件和机器中,但是您不能轻易地将人与他们的大脑结合在一起。我们每个人的大脑都完好无损,没有已知的方法可以直接将它们组合或与其他物体啮合。
无论如何,这种反复不断地进行,每次都提供重新连接,并且不容易明显地发现倒立变体可以作为一种有价值的可能性而被丢弃。
您可能会想到,有一个上下颠倒的图灵测试和一个上下颠倒的反向图灵测试,反映了传统图灵测试和反向反向图灵测试的特点(顺便说一句,有些人不喜欢使用并坚持认为此添加的变体仅仅是反向图灵测试的另一种形式。
您可能会勉强同意将AI一次放在两个地方,并让一个AI作为审问者,而一个AI作为竞争者。
无论如何,这有什么好处?
一种想法是,它有助于潜在地进一步展示AI是否是智能的,这可能在AI的疑问和性质上很明显,AI能够消化所提供的答案,从而说明了AI的能力相当于人类的判断者或审问者。
这就是平庸或单调的解释。
您准备好使用恐怖版本了吗?
正如我将在下面描述的,它与智能有关。
有人认为,人工智能最终将超越人类智能,从而达到人工智能(ASI)。
“超级”一词并不意味着暗含超人或女超人的力量,相反,人工智能的智慧超出了我们的人类智慧,尽管不一定能跳高的建筑物或比飞速的子弹更快地移动。
没有人能说出这种ASI或超级智能可能想到的东西,也许我们作为人类的智力是如此有限,以至于我们无法超越界限。因此,ASI可能会以我们无法预见的方式变得智能。
That’s why some are considering AI or AGI to potentially be an existential threat to humanity (this is something that for example Elon Musk has continued to evoke
If you are interested in this existential threat argument
That being said
回到颠倒的图灵测试,这可能是ASI坐在主持人的座位上,正在判断“常规” AI是否已经达到AI的理想水平,从而使其能够通过Turing测试并被认为是无法区分的来自人类的智慧。
根据您要继续进行的兔子洞的深度,图灵测试有时会为ASI提供两个席位,为AI提供一个席位。这意味着主持人将是ASI,而传统的AI是参赛者,另一个ASI是其他参赛者。
请注意,根本没有人参与。
也许我们应该将此称为接管图灵测试。
不需要人类;没有人类。
结论
仅仅为了制造AI而制造AI的可能性不大,取而代之的是,对于人类为何选择创建AI会有一种目标驱动的理由。
一种这样的目的涉及拥有自动驾驶汽车的愿望。
真正的自动驾驶汽车是由AI驾驶汽车,不需要人工驾驶的汽车。人的唯一作用是作为乘客,而不是作为驾驶员。
现在一个令人困扰的问题是,要实现自动驾驶汽车需要多少级的AI。
有人认为,除非AI到达了理想的AGI,否则我们将没有真正的自动驾驶汽车。确实,有这样观点的人可能会说,人工智能必须实现感知力,也许是在从自动化转变为存在的火花的那一刻做到这一点,这被称为奇异的一刻(有关更多信息,请参阅我的分析,网址为:此链接)。
霍格沃什(Hogwash),一些反对者坚持认为,我们可以获得的AI不一定值得图灵测试(Turing Test),但仍然可以安全正确地驾驶汽车。
需要明确的是,目前还没有任何一种AI自动驾驶汽车能够接近AGI,因此目前,我们面临着试图确定“普通香草” AI是否足以驾驶汽车的挑战。简而言之,对于那些对AI感兴趣的人,有人称其为AI的任何象征性方法称为GOFAI或优良的老式人工智能,它们既有趣又在某种程度上是反手的,都在同一时间(请参阅我的说明中的更多内容)在这里)。
从一种观点来看,当您思考这种情况时,您可以说我们正在今天的街道上进行图灵测试,允许无人驾驶汽车在人类驾驶的汽车中在我们的街道上巡航,并且如果AI驾驶的汽车是无法区分的在正确驾驶方面,它正在通过面向驾驶员的图灵测试。
评论家担心我们允许图灵测试在我们眼前进行,有可能危害我们其他人,不由自主地拖入了一个比较琐碎的实验中,而其他人则认为在车??辆中使用后备驾驶员我们大概还可以(有关此方面的更多信息,请参阅此处的讨论)。
无论如何,图灵测试是迈向AI的工具箱中的重要工具,无论您使用的是传统的图灵测试,反向图灵测试还是上下颠倒的图灵测试,我们的目标都是创建想要成为朋友,而不是我们的失败。
那可能是最重要的考验。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群