Alphago 之父:我从来没有工作与生活对立的问题,因为这

2020-06-06

Alphago 之父:我从来没有工作与生活对立的问题,因为这

Demis Hassabis 有着谦逊低调的风度和平易近人的神情,但是当他告诉我他正在为「解开智力的谜团,随后将之用于解决其他一切问题」的使命而努力时,他看上去无比严肃。如果从其他人—几乎任何人—口中听到这句话,可能都会让人发笑,但是从他口中听到就没那幺让人想笑了。

39 岁的 Hassabis,他的人工智慧研究新创公司 DeepMind 于 2014 年,被 Google 以 6.25 亿美元收购。父母都是移民,他在 Finchley 读一所州立综合学校,再从剑桥大学和伦敦大学学院(UCL)获得电脑科学和认知科学的学位。一位「空想家」,与他一起工作的人们如此评价他。他是那种你在街上看到也不会留下印象的家伙,但是 Tim Berners-Lee 曾说,他是地球上最聪明的人之一。

他做的不只是人工智慧,而是可以从 0 开始的人工「通用」智慧

人工智慧已经到来,每当我们询问 Siri 或是从 Android 上看到推荐资讯时,背后都有人工智慧的影子。短期内 Google 产品肯定会从 Hassabis 的研究中获益,即使个人化、搜索、YouTube、语音和脸部辨识看起来都没有「AI」这个词(「于是这只是软体,对吧?」他笑,「这只是某种能派上用场的东西。」)。

不过,从长远来看,他正在研发的技术所具有的意义,不会仅止于有情感的机器人、更智慧的手机、甚至不会止步于 Google、Facebook、微软、苹果、以及其他正在搜刮 AI 相关技术,以在接下来的科技军备竞赛中砸重本投资的硅谷巨头们。它关係着我们能想像得到的一切,以及更多我们想像不到的东西。

大多数 AI 系统都是狭隘的,从训练事前编写好程式的代理(agent)掌握某种特定的任务,此外并没有太多其他的能力了。所以 DeepBlue 可以在西洋棋上击败 Gary Kasparov,却无法和一个三岁小孩对战井字游戏。Hassabis 站在另一边: 他从人类大脑中获取灵感,试图创造第一台「通用的学习机器」,一组灵活的、适应能力强的演算法,就像生物系统那样,用原始资料学习,如何从头开始掌握任何一种任务。

这就是人工通用智慧(AGI),重点在于「通用」。在 Hassabis 憧憬的未来中,超级智慧的机器将会与人类专家共同协作,差不多能解决任何问题。「癌症、气候变化、能源、基因科技、总体经济、金融系统、物理学,我们想要掌握的系统中有许多都在变得日益複杂,」他说,「资讯太过氾滥,即使是对于最聪明的人类来说,要在有限的生命中掌握这些也正变得越来越艰难。我们要如何筛选这些铺天盖地的资料、从中找到正确的洞见?人工通用智慧可以被当作某种自动将非结构资讯转化为有行动意义(actionable)的知识的过程。」

解决方案可能仍然有数十年的路要走,但是它似乎正在不可避免地渐渐来临。2015 年 2 月,全球顶尖的科学杂誌《Nature》在封面上刊登了 8-bit 游戏《Space Invaders》的图片,在文字说明写着「自我学习的 AI 软体」、「人类级别的影音游戏表现」,杂誌内来自 DeepMind 的论文描述了第一个成功的通用「端对端」(End-to-End)学习系统,,其中他们的人工代理(agent),一个被称作 Deep-Q 网路的演算法学会如何处理萤幕上的输入,理解输入的意义,然后做出决策来达到希望的结果。这个突破在科技界引起轰动。

今年初,DeepMind 第二次登上了《Nature》封面,这次它略过 70 年代和 80 年代的复古街机游戏,回溯到更久以前选择游戏,围棋。围棋的分支因数非常庞大,它可能的行动步数超过宇宙原子数量。与象棋不同,它无法通过暴力计算来破解,也不可能为它写出一个评估函数。取而代之的是,围棋需要旗手具备某种类似「直觉」的东西:当被问起为何做出某个落子的决定时,专业棋手们往往说出类似的话:「这样做感觉比较对。」

为什幺是围棋?人工智慧的超级挑战:直觉

显然电脑一直以来在做这种判断方面都不太在行。因此,对于 AI 来说,围棋始终被视为伟大挑战之一,大部分研究者预期至少还需要 10 年才能看到机器破解围棋的希望。

但是经过严格的同行评审的证据就摆在面前:DeepMind 的最新人工智慧演算法,AlphaGo,不仅完胜蝉联三届欧洲围棋冠军的樊麾,在与围棋九段棋士李世石的对战,最终也取得 4 比 1 的胜绩。帝国理工学院认知机器人学教授 Murray Shanahan 描述,「一个重要的里程碑」,超人类主义哲学家 Nick Bostrom 表示赞同。在 Bostrom 位于牛津大学人类未来研究所的办公室中,Google 工程主管 Ray Kurzweil 说,AlphaGo 的出现让过去几年间机器学习领域的进展一下子变得引人注目起来。

当时我们约在 Hassabis 的办公室见面,讨论与樊辉对弈的胜利。像往常一样,他穿着不伦不类的黑色上衣、裤子、以及鞋子:你觉得他是一个实习生也无像,但传言 Google 的收购让他个人获益 8000 万欧元。「围棋就是终极:它是所有游戏的顶峰,需要的智力深度(intellectual depth)也最高。它让人目眩神迷,而令我们感到激动的,不只是我们掌握了这个游戏,还有我们在其中使用的神奇有趣的演算法。」

比起科学,下围棋更像一种艺术,他坚持道,「而 AlphaGo 的下棋方法与人类非常像,因为它是像人类一样学习围棋、接着通过不断下棋变得日益强大的,就像你我会做的那样。」Hassabis 看上去还像个学生,但是他现在笑得像是为孩子感到自豪的家长。AlphaGo 是他在职业生涯中获得的最让人兴奋的成就。「这个量级超出了任何人的想像,」他津津乐道,「对于我们来说,这不是一个使用手工写下规则的专家系统。使用通用用途的机器学习技术,它可以自己学习并精通这个游戏。最终,我们希望将这些技术应用于现实世界的问题,比如气候建模或是複杂病症分析,对吧?开始想像它可能下一步会解决什幺问题是非常激动人心的。」

「我很容易感到厌倦,而这个世界是那幺有趣,有那幺多很棒的事情可以做,」Hassabis 保持着蝉联 5 届脑力奥林匹克运动会全能脑力王(Pentamind)称号,「如果我是一个体育运动员,我一定会想要成为一个十项全能选手。」Hassabis 从 4 岁开始下象棋,仅用一年就在国内立于不败之地,并在不久之后世界无敌。想必这很明显地预示了他日后的生命将以脑力为重心。

1976 年的伦敦北部,他诞生在一个有希腊 – 赛普勒斯混血的父亲和新加坡 – 中国混血的母亲的家庭中,是 3 个孩子中的老大。他的父母都是教师,曾经开过玩具店。他的妹妹是一位作曲家和钢琴家;他的弟弟研究的是创造性写作。对科技的热情并没有盘踞在这个家庭中。

「在我家,我绝对是一头奇怪的黑羊,」他开了一个玩笑,回忆起小时候如何将西洋棋赛的奖金花在当时的个人电脑 ZX Spectrum 48K 和 Commodore Amiga 上。「我的父母都是不喜欢新科技的人。他们不怎幺喜欢电脑。他们有一些像波西米亚人。我的妹妹和弟弟也都走了艺术家的路线。他们没有一个人真的对数学或是科学有兴趣,」他耸了耸肩,有些抱歉的意思,「所以,好吧,这有些怪异,我不太确定这一切是从哪儿来的。」

离职率 0%,地球上最聪明的人都想在这工作:DeepMind

他的公司在 Google 收购时只有 50 名员工,现在已经雇了接近 200 人;他们来自超过 45 个国家,将位于伦敦国王十字地区一角的大楼的 6 个楼层都坐满。Hassabis 下定决心要让他的公司接近他的根源,无论受到何种搬迁的压力。

「伦敦北部生养了我,我绝对热爱这座城市,这就是为什幺我坚持留在这里:我不觉得有什幺理由说伦敦不能拥有一个世界顶级 AI 研究所。而且我对于我们所在的地方感到非常自豪。」所有的房间都以智力上的巨人命名:特斯拉、柏拉图、费曼、亚里斯多德。

儘管有许多 Google 的对手们都越来越多地重视起 AI,更不用说全球的一流大学了,但是毫无疑问,地球上最聪明的人们都在排着队想进入这里工作,到现在为止离职率还是漂亮的 0%。

「我们真的很幸运,」Hassabis 说,「毫不夸张地说,我们都能够从每个国家获得最好的科学家。所以我们将会有,比如说,波兰的奥林匹克物理冠军,法国的顶尖数学博士。

我们已经有的想法比我们已经有的研究人员还要多,不过与此同时,青睐我们的优秀人才数量也比我们能接收的还要多。所以我们正处在一个非常幸运的位置。唯一的局限是,在不伤害公司文化的前提下,我们能吸收的人员数量。」

Hassabis 坚持不让 Google 的收购以任何方式影响他自己的研究路径,他估计自己花费「至少和思考演算法一样多的时间来思考 DeepMind 的运转效率」,并将这家公司描述为「调和了最好的学术圈与最激动人心的初创企业,拥有令人难以置信的能量来为创造力和成就助力。」

他好几次提到「创造力」。虽然他接受的正式训练都来自于科学领域,但是他本能地站在创造力或是直觉的一侧。对于 DeepMind 的构造来说至关重要的,是被他称作「胶水大脑(glue minds)」的人才:能够在相当程度上理解无数科学领域、并用特别的方式找到不同领域间的连接点、再迅速鑒别出有前途的交叉领域连接可能是什幺,这样的博学者。

符合标準以后,这些像胶水一样的人才可以每隔几周在工作中的小组中登记资讯,随后快速灵活地在需要时调用资源和工程师。「如果你有一个让人吃惊的天才研究员,那幺几乎立刻会有三四个来自其他领域的人可以接过他的指挥棒、将自己的智慧添加进去,这会导致令人震惊的结果的产出速度非常迅速。」启动于仅仅 18 个月前的 AlphaGo 项目,就是对这一点的完美阐释。

「也许连在梦里,我也还在思考这些东西,因为它是如此令人兴奋」

每天晚上,Hassabis 都要登上北线列车,及时回家与家人团聚、享用晚餐。他们居住在 Higate,离他长大的地方不远。他的妻子是一位义大利分子生物学家,研究的是阿兹海默。他们的两个儿子一个 7 岁,一个 9 岁。Hassabis 会与他们一起玩游戏、读书,或是帮他们一起做作业,「他们都以自己的方式发挥着聪明才智,但是他们几乎就像我对立的两面,一面是科学,一面是创造」。

他会带他们上床睡觉,就像任何一个普通的父亲。到了晚上 11 点,当大部分人即将就寝,他会开始他自己说的「第二天」,与美国方面的常规 Skype 通话将会持续到淩晨 1 点,之后是纯粹思考的时间。「直到淩晨 3 点或是 4 点之前,那是我用来思考的时间:思考研究,思考我们的下一个挑战,或是写演算法设计文件」。

并没有太多真正的 AI 代码,他承认,「因为我的数学现在已经不行了。这更像是直觉性的思考。或者可能是对公司的策略性思考:如何扩张它,如何管理好它。或者可能只是我从一篇文章里读到的东西、或是那一天从新闻里看到的东西,我会思考我们的研究能如何与它相连。」

这让我想起了 AlphaGo,它就在 Google 强大到难以想像的计算云中,不停地下棋、下棋、下棋,每一天的每一分每一秒都在自我提升,因为它学习的唯一方式就是继续不停地做下去…

Hassabis 自己呢?「绝对是超人,」他的一位同事顺口告诉过我。他关机休息过吗?他能够让自己关机休息吗?「这很难,」他承认,「我从来没有真的感到过工作与生活对立的问题;它们像是在同一张画布。我的确喜欢读书、看电影、听音乐,但这些都倾向于和我做的事有所关联。我的大脑就是为它而运转的。」

那孩子、朋友、还有日常生活呢?「当然,我在试图保持脚踏实地,否则我会变得有点疯狂。关于孩子,最神奇的一点是,他们是唯一能让你以类似的方式度过时间的存在。」

他和自己的朋友们保持着亲密的关係:他在 UCL 读博士的时候遇到了 DeepMind 的联合创始人之 Shane Legg,另一位 Muatafa Suleyman 则是他的从小到大的朋友。他在剑桥大学时与本科同学 Dave Silver 成为朋友,随后在空闲时教他如何下棋,包括某种古老的中国游戏。

二十年后,David Silver 是 DeepMind 里围棋项目的主要工程师,也是最近这篇《Nature》论文的第一作者。「是的,Dave 和我认识很久了,」Hassabis 笑着说,「我们曾经梦想在未来做这件事情,所以 19 岁的我们可能对于现在取得的这个成就感到非常欣慰。」

他沉思了一下,补充道「虽然如此,但我真的没有多少日常生活。在所有醒着的时刻,我都在思考这些东西,也许在我梦里也是这样。因为它是如此让人兴奋,如此重要,也是我最有热情的事情。」他的眼里有一种神采,像个孩子一样天真。「我觉得太幸运了。我想不出比我正在研究的更有趣的问题,而且我也可以每天思考这些问题。时时刻刻,我都在致力于做那些我有信心的事。否则的话,生命如此短暂,为何还要做这些不确定的事呢?」

Hassabis 看反 AI 阵营 的恐惧想像:人工智慧需要负责而合乎伦理的使用

「好吧,我希望不会这样,」Hassabis 面不改色地说。在他看来,大众对人工通用智慧危言耸听的态度,模糊了它近期巨大的潜力和价值,而且在根本上就错位,尤其是在时间上。「我们距离任何类似人类水準的通用智慧的东西都还有几十年的时间,」他提醒我,「我们还踩在梯子的第一格。我们不过是在游戏。」他承认有些「应该现在就考虑起来的法律风险」,但是他坚定地认为,至少那不会是科幻小说中,人类被人工智慧无情消灭的反乌托邦场景。

我让 Hassabis 列出他认为的未来主要的长期挑战。「随着这些系统变得越来越複杂,我们需要开始思考它们能怎样做出优化、能对什幺做出优化,」他回答,「技术本身是中性的,但它是一个学习系统,所以,不可避免地,它们会带有一些设计者的价值体系和文化背景的印记,所以我们对于价值观的思考必须非常谨慎小心。」

关于超级智慧,他说:「我们需要确保设定的目标是正确指明,且其中没有任何模棱两可的东西,即使时间推移也依旧稳定。在我们所有的系统中,最高级的目标仍然要由它的设计者们指定。系统会已自己的方法实现目标,但是它自己是不会创造一个自己的目标。」

他用毫无动摇的语调宽慰我。「看,这些都是既有趣又困难的挑战。随着配备上所有新颖强大的技术,人工智慧需要被负责地、符合伦理地使用,而这就是为什幺我们现在正积极地呼吁对这个问题展开辩论和研究,那幺当时候到来时,我们才会準备充足。」

什幺时候到来?机器变得超级智慧的时候,还是它们超越人类的时候?他笑了起来,「不,不,不,我指的是还要在那些之前!」Hassabis 澄清,「我的意思是,当这些系统强大到不只是会玩游戏时,我们放任它们处理更现实、更重要的事,比如医疗。然后我们需要确保我们知道它们将会有怎样的能力。」他笑,「那将会阻止机器掌管世界的情景成真。」

「总体来说,我发现了那些不真正在 AI 领域工作的人,对于 AI 的理解都是不完全的。他们通常都没有与许多 AI 专家交谈过,所以他们脑袋里的思想实验总是把他们带偏,因为这些想法都是基于一些我认为即将被证明是错误的假设。」Hassabis 再一次提到,他组织的内部伦理委员会和谘询委员会,将会管理未来任何的人工通用智慧技术的应用。

他毫不动摇地坚持现阶段不公开进程的决定。「之前没有任何人尝试做过类似的东西,所以在我们对于公众揣测我们在 Twitter 或者其他什幺东西上做了什幺能有额外的审查之前,我们还有许多事情需要探索,从第一天就要开始。」

这个初始阶段,他说,是关于「提供最新的消息,这样我们才能準备好讨论实际的演算法和应用。对于许多参与其中的人来说,这不是他们的核心领域。我们需要他们的专业知识,但是他们必须弄清楚将会发生什幺事。」

Hawking 作为一个「得到最新消息」意味着什幺的榜样,被引以为鑒。Hassabis 最近邀请 Hawking 进行私人会谈。「我们本来只安排 1 个小时,但是他提出了那幺多的问题,以至于我们最后谈了 4 个小时。他错过了午餐,所以他的陪同人员不大喜欢我。」

Hassabis 指出,霍金在会面后便不曾在媒体报导时提及任何关于 AI 的有煽动性的言论,在他上个月的 BBC Reith 讲座上,他列出会对人类产生威胁的列表,上面没有 AI 技术。「听到更多关于实用性、更多关于我们可能建立的真实的系统,以及我们对这些系统能够有的监察和控制的讨论,的确起到了作用。」Hassabis 大胆地猜想道。

他真的相信霍金转变了思想吗?「我想,在谈话的最后,是的,他宽慰了不少。他拥有这种好笑的、乾巴巴的幽默感,在我离开之前,我问『所以你怎幺想呢?』,然后他打出这样的字,『我祝你好运』。随后,他眼里闪烁着光芒,又补充,『但是不要太多。』」Hassabis 给了我一个胜利的微笑,说:「我当时想,『我会把这当做是胜利的宣告』。」

延伸阅读:

取得围棋九段成就的强大人工智慧 AlphaGo,下一步还打算怎幺发挥?
未雨绸缪先定规矩,科技公司将开圆桌会议研讨 AI 伦理
开创台湾人工智慧产业发展需要三种人才,我们準备好了吗?