阿尔法狗能学数学吗(地球最聪明的人说)

伦敦当地时间10月18日傍晚,阿法狗(AlphaGo)再次登上世界顶级科学杂志——《自然》。谷歌人工智能团队以《脱离人类认知,精通围棋游戏》为题,用整整5页的篇幅,隆重介绍了阿法狗的新版本AlphaGo Zero。

阿尔法狗能学数学吗(地球最聪明的人说)(1)

▲《自然》杂志官方网站公布AlphaGo Zero

一年多前,阿法狗便是2016年1月28日当期的封面文章,一篇题为《用人工神经网络和树状研究,精通围棋》的重磅论文,介绍了这个击败欧洲围棋冠军樊麾的人工智能程序。2个月之后,阿法狗在人机大战中击败世界顶级围棋棋手李世石,从此开始征服世界之旅。

阿尔法狗能学数学吗(地球最聪明的人说)(2)

▲历代AlphaGo 所需的算力对比,图片来源:DeepMind

阿尔法狗能学数学吗(地球最聪明的人说)(3)

▲AlphaGo Zero 成长曲线说明:第0天,AlphaGo Zero此前没有储备任何关于围棋比赛的知识,只输入了围棋比赛的基本规则;第3天,AlphaGo Zero已超过了AlphaGo Lee的水平,AlphaGo Lee在2015年与世界冠军李世石的5局对弈中赢得其中4局;第21天,AlphaGo Zero已达到此前AlphaGo Master的水平,而此前这个版本的AlphaGo在网络上打败了全球范围内的60名高手,并且在2017年以3:0全胜世界冠军柯洁;第40天,AlphaGo Zero已超过此前所有AlphaGo的版本,无可争议地成为了目前全世界最强围棋玩家。而这一成果的取得全部源于其自学,没有任何人类介入,没有使用任何历史数据。图片来源:DeepMind

红星新闻记者将是否自食其言的问题抛给Deepmind团队,哈萨比斯对此解释道,“新版阿法狗‘零’的得名正是解释了新狗与老狗的区别所在——零(Zero),即完全不依靠人类数据和任何历史经验,完全依靠人工智能自身的独立思考和学习能力。”

这也解释了,乌镇人机大战以后,谷歌就宣布阿法狗退役,实际是在研究完全不同的新狗。

对于阿法狗名字的由来,团队表示颇有深意。在今年年初接受红星新闻记者专访时,阿法狗团队就曾解释过,alpha是希腊字母表的第一个字母。第一个,即开端,最初的含意。而后来横扫世界网络的Master(大师)的本名Magister,是德国作家赫尔曼·黑塞晚年作品《The Glass Bead Game(玻璃球游戏)》里的一个词。

而这一次的“零”,无疑是一个颠覆性的成果。

重大突破

没有人类知识输入

靠自我博弈而自学成才

“此前的阿法狗是通过大量吸收传统围棋对战路数、学习人类的围棋招式、数据实现的,而人类知识具有昂贵、不可靠、难以获取的特点。因此,对于AI长远发展而言,必须跳过这一步,在没有人类知识输入的前提下,创造出超人类(superhuman)的计算程式。”哈萨比斯解释道。

如果说此前版本的阿法狗需要被成千上万的人类棋手训练的话,新一代的阿法狗则跳跃了这一步、完全自学成才,“它自己就是自己的老师”。

阿尔法狗能学数学吗(地球最聪明的人说)(4)

▲图a展示了程序的自我对弈过程。程序在从S1到ST的棋局中进行自我对弈。在任意位置ST,程序会用最新的神经网络程序执行计算,然后,根据计算出的搜索概率at~ πt选择落子位置,根据游戏规则来决定最终位置ST,并计算出胜者z。图b展示了AlphaGo Zero中 的神经网络训练过程。神经网络以棋盘位置St输入,将它和参数θ通过多层传递,输出向量Pt和张量值 Vt(Pt表示几步之后可能的局面,Vt 表示 St 位置上当前玩家的胜率)。为了将Pt和搜索概率πt的相似度最大化,并最小化Vt和游戏实际胜者z之间的误差,神经网络的 参数θ会不断更新,更新后的参数会用到如图 a 所示的下一次自我对弈迭代中。

哈萨比斯向记者表示,“零”是目前最强版本的阿法狗,“阿法狗在短短两年时间就达到如此成就,我们也相当惊喜”。

它是从一张白纸开始,零基础学习,没有使用任何人类数据,而是直接与目前世界围棋最高水平的阿法狗自身学习,“每一次的自我博弈都取得了一定程度的提升”,就这样,在短短3天内,“零”成为顶级高手。

因此,这一次,新版阿法狗并没有和任何人类高手进行人机大战,而是直接通过“自我博弈”而“自学成才”。在对阵曾赢下李世石那版阿法狗时,“零”取得了100:0的压倒性战绩。

哈萨比斯评价道,人工智能极少地使用电脑的力量并完全抛弃了人类的数据经验,这是一个里程碑式的事件。

探索未知

若服务于医疗行业研究

阿法狗的算法将带去新的曙光

“这两年频繁地进行人机大战和线上对垒,最终目标是什么?”上次专访阿法狗团队时,红星新闻记者就曾向他们提出过这样的问题。

当时团队解释,“最终希望能将技术应用于解决现实世界的难题。在这些测试赛之外,我们更想人类的专业棋手和阿法狗一起,共同探索更多围棋的未知领域。”

而这次的阿法狗新版“零”干脆“抛弃”人类,通过自己输入,而摘得世界围棋最顶级的那个皇冠。

那么他们如此做的目的又是什么呢?这次哈萨比斯给出了更精确的答案和目标产业,“使用这种历史性的突破,来解决现实生活中目前无法解决的问题,比如在医疗行业的蛋白质折叠问题,还有就是新材料的发明。”

这一点与哈萨比斯自身的生活息息相关。生物学研究的一个重要课题就是蛋白质如何折叠成3D结构,因为3D结构将决定蛋白质在体内如何工作和反应,患阿尔海默氏(老年痴呆)症的病人或许就是因为蛋白质的折叠方式错误。而哈萨比斯的妻子是一名意大利的分子生物学家,多年一直专注于阿兹海默症的研究。

夫妻二人会一起工作、研究,他们经常讨论怎样加速科学发现的过程,AI在其中扮演怎样的角色。妻子一直希望能取出一个氨基酸序列,然后根据其中的基因序列判断3D结构会是什么样子,这样就可以令药物研发加速5到10年,而实验室通常都要几年的时间才能搞清楚这些结构。

而阿法狗的算法恰恰给了模拟这些蛋白质的折叠一丝曙光。

哈萨比斯最喜欢的音乐是电影《星际穿越》的插曲,而导演克里斯托弗·诺兰是正是他的好朋友,他常和《机械姬》导演埃里克斯·加兰德一起讨论宇宙、人类和人工智能的话题。哈萨比斯曾表示,《星际穿越》和他的最终目标关联紧密,“我想理解我们周围的整个宇宙:理解时间、黑洞、我们在整个宇宙中的真正地位。”

也正是如此,哈萨比斯不停地推动着对阿法狗的研究,“如果在这些实用性领域也能带入阿法狗的成就,将会极大地造福人类的生活。”哈萨比斯对红星新闻记者表示。

END

红星新闻记者丨胡敏娟

编辑丨王睿

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。