人大经济论坛经管爱问微信好号“jgasker”好文共享与推荐,实时答疑服务,欢迎关注!
3月9日下午,人机世纪大战首局落定:李世石九段投子认输,Google人工智能程序AlphaGo取得首回合胜利!
……
3月12日人机围棋大战第三回合较量中,Google人工智能程序AlphaGo第三次击败韩国“第一人”李世石九段,并以3:0的赛果提前锁定了本世代人机巅峰对决的最终胜利。
第三回合较量中,人类围棋手代表李世石九段执黑对战人工智能界代表 AlphaGo。本场比赛是人机围棋大战的“赛点”,但从一开始起 AlphaGo 就牢牢掌控着局面,李世石下子的用时也远超 AlphaGo。比赛后半段,李世石顽强抵抗,而且使出了不少“非常规”的走法。无奈大势已去,李世石终以投子认输。

▲ AlphaGo VS 李世石九段第三回合对战棋谱( 李世石执黑 )
本场比赛中,AlphaGo 首次实施了主动“打劫”和“提劫”,坊间关于对弈双方“不能打劫”的流言不攻自破。
十九年前,在与国际象棋冠军卡斯帕罗夫的 5 盘比赛中,IBM 超级计算机“深蓝”3比2取胜。而Google程序AlphaGo对李世石九段取得的三连胜,更宣告了拥有人工智能的新一代机器棋手终于攻下了围棋这座曾经不可逾越的大山。
AlphaGo 什么来头?
AlphaGo是一款围棋人工智能程序,由位于英国伦敦的 DeepMind(Google旗下公司)团队历时两年开发而成。相比于二十年前战胜国际象棋冠军的IBM 超级计算机“深蓝”,AlphaGo 现在想要打败围棋选手依然困难得多。
国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;而围棋每回合有250种可能,一盘棋可以长达150回合。所以围棋最大有3^361种局面,换算一下大致是10^170。国际象棋最大只有2^155种局面,大致是10^47,而已知宇宙中原子的数量为10^80。
面对围棋中如此巨大的运算量( 10^170 ),靠电脑机械列出所有可能方案,再形成树形地图的传统做法,不仅效率低而且无法延续下去。
直到Google下属的DeepMind团队找到了“深度学习(Deep Learning)”的终极杀器。“深度学习”是人工智能(AI)领域当下最为热门的研究领域。
具体到AlphaGo上,“深度学习”的能力就是利用“价值网络(value network)”去计算局面,然后再用“策略网络(policy network)”去选择下子。“价值网络”和“策略网络”是两种不同的深度神经网络,并且共同构成了AlphaGo的“脑”。

▲ AlphaGo 的两种深度神经网络结构示意图
围棋过程中,AlphaGo的“大脑”可以模拟人脑先“筛选”出那些有利的棋局,并“抛弃”掉明显的差棋,从而将计算量控制在AlphaGo“大脑”可以完成的范围内。具体来看:
1.“价值网络”负责减少搜索的深度:AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑。
2.“策略网络”负责减少搜索的宽度:面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。
3.利用蒙特卡洛拟合,将这些信息放入一个概率函数,AI 就不用给每一步以同样的重视程度,而可以重点分析那些能赢的棋步。
需要说明的是,人脑不可能像电脑一样无时不刻地接受“深度学习”,所以理论上来说只要AlphaGo经历了足够的训练,就能击败所有的人类围棋选手。
李世石有多厉害?
李世石是韩国围棋九段棋手,这一段位已是专业围棋棋手中的最高级别。
李世石 1995 年入段,1998 年升为二段,1999 年升为三段。2003 年初因获得 LG 杯冠军,直接升为六段;同年4月获得韩国KT杯亚军,升为七段;当年7月再夺富士通杯冠军,直接升为九段。
自2002年首次加冕富士通杯以来,李世石在最近十多年时间中共获得了14个世界冠军,是世界棋坛最近十年获得世界第一头衔最多的职业棋手。
据悉,李世石属于典型的力战型棋风,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手,他的攻击可以用“稳、准、狠”来形容,经常能在劣势下完成逆转。
需要说明的是,李世石九段刚刚在农心杯三国围棋擂台赛上败给来自中国的小将柯洁九段,后者对其战绩为8胜2负。Google方面表示,如果李世石最初不同意参加与AlphaGo的人机大战,就会考虑让柯洁顶替。
微信原文:http://mp.weixin.qq.com/s?__biz=MzA3NDkyNTc4Ng==&mid=403204974&idx=1&sn=50cfa3d2a15c2ce0d7f67763d6b70ff9&scene=4
