更开放,更共享,比利时围棋AI“丽拉·元”重塑“阿尔法元”

新华社
2018-04-08 11:08
活跃的人工智能(AI)软件战胜职业围棋强手如今已不是什么新鲜事,但和其他AI有所区别的是,这个“背景单薄”但却极富互联网精神的围棋AI正走在一条公众参与、开放共享的新路上。

  新华社布鲁塞尔4月7日电 题:更开放,更共享——比利时围棋AI“丽拉·元”重塑“阿尔法元”

  新华社记者王子辰

  她可以战胜2017年CCTV电视快棋赛冠军张涛、 2007年全国个人赛冠军张立等职业强手;同时,她也会在征子这种初学者都驾轻就熟的局面里犯下低级错误。

  她就是比利时围棋AI“丽拉·元”。

  活跃的人工智能(AI)软件战胜职业围棋强手如今已不是什么新鲜事,但和其他AI有所区别的是,这个“背景单薄”但却极富互联网精神的围棋AI正走在一条公众参与、开放共享的新路上。

  一人之力重塑“阿尔法元”

  《自然》杂志于2017年10月刊登的论文《无须人类知识掌握围棋》是“丽拉·元”最为雄厚的“后台”。除此之外,比利时程序员吉安·卡洛·帕斯库托几乎是“单枪匹马”地在围棋界之外开疆拓土。

  这篇揭示了“阿尔法狗”的“后辈”“阿尔法元”如何“自学成才”的论文指导了帕斯库托的编程。他说:“丽拉·元是对论文里介绍的系统的忠实‘重现’。”

  现年35岁的帕斯库托上次认真下围棋还是在19岁时。而即使是在当时的棋力巅峰期,水平也十分业余。

  尽管一直生活在围棋氛围淡薄的西欧,也没有任何利益驱动,他却花了大量时间在围棋AI上:在“丽拉·元”之前,他在两年时间里每晚花费约一个半小时开发了被认为接近职业围棋水准的“丽拉”——在答复记者询问时,帕斯库托表示,“丽拉”是个女性名字,所以应该用“她”的称呼。

  尽管只能利用工作和照顾两个孩子之外的业余时间,帕斯库托仍然在“丽拉·元”里实现了“阿尔法元”最大的特色:从一个对围棋完全没有任何了解的“神经网络”开始,通过与一种强大的搜索算法的结合,她可以通过自我对弈而不断学习提高。

  网络对弈平台弈客围棋的创始人兼首席执行官傅奇轩说:“丽拉·元”每天都在进步,目前达到职业水准没有问题。

  分布式参与超过预期

  为了较快地提升棋力,“丽拉·元”必须经过大量的自我对弈训练。

  帕斯库托能学习、借鉴的是谷歌“深度思维”团队在论文中提出的原理,但他却远没有后者所掌握的人财物资源,而这使得重塑“阿尔法元”的任务面临了一个极大障碍。

  自我对弈训练的一个前提是须要有很强的计算能力供AI调用,而帕斯库托在这一方面则比谷歌“深度思维”差得太远。据他自己估算,如果想计算出“阿尔法元”使用的关键参数,凭市面上常见的电脑硬件大概需要1700年。

  为此,帕斯库托采取了“分布式计算”的解决方法:任何人都可以下载“丽拉·元”到自己的电脑上,利用闲置的计算能力——尤其是显卡——让她自我对弈训练以提高水平。

  自2017年11月10日以来,“丽拉·元”已自我对弈了570多万盘,来自全球的参与和支持也超乎帕斯库托的想象。2017年10月20日,他曾写下这样的预测:“现实地看,大概会有十个人参与,如果非常幸运的话,大概能有八十人参与。”但2018年3月底,他则告诉记者,平均每天参与分布式计算的人数大约有500,而任何时候联机参与的人数都没有低于200。

  “彻底开放”写下浓墨重彩

  帕斯库托并不太了解“绝艺”、“深禅”等其他知名围棋AI,但他的“丽拉·元”有两个与众不同的特征。

  首先,“丽拉·元”坚持不加入任何人类的围棋知识,完全做到从零开始。这不仅是为了对标“阿尔法元”。他解释说:“如此就可以对比没有人类知识的招数,与人类最高水平的招数,在哪些地方是重合的。而两者间的差异,对于人类围棋选手来说也将很有意思。如果一旦加入人类知识的话,可能就没有这个(比较的)机会了。”

  其次,“丽拉·元”的源代码是完全开放的。帕斯库托说,一些AI团队并不把他们的工作公开发布出来,所以大家并不知道他们采用了哪些方法,而长此以往下去,(这对大家)又有多大意义呢?谷歌“深度思维”开发出的程序击败了人类世界冠军,但对于人类围棋选手来说,他们能研究到的这款AI的棋谱是十分有限的,那么这对他们来说又有多大意义呢?

  “我已经把(‘丽拉·元’的)一切都开放了,所以其他人是可以继续这份工作的。”帕斯库托说。

  “谷歌论文的出现,推动了整个围棋AI行业的大变革,但是‘丽拉·元’这个项目的意义仍然是非常特殊的,它的开源精神和全民参与性注定成为围棋史上浓墨重彩的一笔。”傅奇轩说。

责任编辑:陈艳妮
010030101030000000000000011100001122648768