*本文译自权威科技媒体Wired 2020年2月13日的报道。
1997年,在风景如画的日本名古屋市,索尼的一位研究科学家北野宏明(Hiroaki Kitano)协助组织了第一届机器人世界杯(Robocup),吸引了数支致力于机器人和人工智能的研究团队前来参赛。
赛事第一天,两支机器人队伍进行PK。但见那些机器抽动着观察它们周围的环境时,一名记者问北野,比赛什么时候开始。他笑着说:“我告诉他比赛五分钟前就开始了!”
这便是当时AI和机器人的状况。机器需要花费数分钟来解读自己的处境,然后再去履行下一步的任务。但今非昔比,随着AI对机器的辅助越来越强,从自动驾驶汽车到监控摄像头,机器的感知和行动都更加智慧。
据11月公布的信息,北野如今在索尼负责牵头一个新任务,要将尖端AI技术注入整个公司。这家日本巨头相信AI将会创造更智能的相机、更灵气的视屏游戏角色,甚至是更能干的索尼首款厨房机器人。北野说索尼相信AI正在快速发展,公司需要将这项技术作为其发展战略的核心。
“在索尼我们有优秀的AI研究者和工程师,并且我们对正在发生的事情有很好的判断力”,这个星期在纽约参加人工智能发展协会(Association for the Advancement of Artificial Intelligence,缩写AAAI)会议的北野说道,“我们认为现在正是我们应该推进的时候”。
在诸多谋求发展AI的大公司中,索尼的动向独树一帜,虽然研究和利用AI方面滞后于硅谷巨头,却与其目标不同:相比与谷歌、脸书或者苹果等公司,索尼更专注于内容创作和娱乐。这家日本巨头现在正寻求通过大举押注于一种名为强化学习的强大但仍相对实验性的人工智能方法,以与美国的人工智能巨头相匹敌。谷歌母公司Alphabet和亚马逊也对这项技术进行了引人注目的投资。
Alphabet的DeepMind,因其利用强化学习创建了一个在2016年打败世界上最优秀的围棋手之一的程序,而名声大噪。受动物行为的启发,它涉及到一种算法,以响应积极或消极的反馈来改进自身行为。
“我们认为强化学习,与迄今为止在AI方面取得最多进展的技术一样重要,甚至是更重要”,北野说,“它将会成为核心技术”。
除了研究以做演示,强化学习还在从金融到物流的各个领域进行测试。它也正在成为机器人学习处理真实世界和训练软件代理在模拟环境中智能行为的一种强有力的方式。因此,它可能有巨大的潜力产生出引人注目的视频游戏角色和剧情。
强化学习几十年来一直是人工智能的一部分,它的前景已经变得更加明朗,这要归功于强大的神经网络算法(大致模拟大脑中学习的方式),以及功能更强大的计算机和大量训练数据。即便如此,它目前仍处于试验阶段,而且是出了名的很难做到正确。例如,研究表明,强化学习算法有时带来的成果就是建议进行重复和无用行为。
北野表示,索尼将专注于三个领域的人工智能:游戏、传感器,以及更有趣的,烹饪艺术。这些领域反映了公司目前的业务重点和未来的远景抱负。
索尼以生产PlayStation和游戏而闻名,但其收入的很大一部分也来自数字传感器和影像技术。不难看出人工智能将如何促进这些领域的发展,比如让游戏更吸引人、更生动,或者帮助摄像头更智能地感知世界。
将人工智能应用于烹饪,是为了推动发展机器人技术。目前,索尼已经展示了一款机器人,能够以一种艺术性但事先计划好的方式将食物摆放在盘子上。未来的系统可能不需要仔细编码就能识别和抓取食材。对机器人来说,食物的处理尤其具有挑战性,因为食材的形状和摆放常常是不规则的,并且需要小心操作。
当然,索尼对机器人并不陌生。在首届机器人世界杯举办的几年后,该公司发布了一款狗狗形状的玩具Aibo,揽入无数狂热的追随者,但在2006年因公司精简业务而停产。2018年发布的新版Aibo包括一些人工智能功能,如对象和语音识别。不过它还是有些许笨拙。当我在AAAI会议上与北野先生会面时,其中一只由索尼代表带来的机器狗在房间里摸索着,并在他身后发出了叫声。
一些外部人士看到了索尼投资强化学习的巨大潜力。加州大学伯克利分校(UC Berkeley)教授、Covariant.ai联合创始人皮特·阿贝尔(Pieter Abbeel)说:“这很有意义。”Covariant.ai是一家利用强化学习制造适应性更强的仓库机器人的公司。
阿贝尔指出,创作视频游戏既昂贵又耗时,他还指出强化学习已经显示出了承担大量繁重工作的潜力。他提到了一个名为DeepMimic的项目,该项目展示了通过强化学习训练的虚拟人物如何表现出栩栩如生的行为。一个角色被放置在一个物理精确的环境中,并给出了一个特定的目标,比如爬过障碍,最终会想出如何跳过去的方法。这可能会使视频游戏角色的编程过程自动化,甚至可以让游戏中的行为在运行过程中出现。“它有潜力促进更快的内容创建,”阿贝尔说。
阿贝尔说,实现机器人烹饪可能还有一段距离,但他希望强化学习能改变这些机器的编程方式。他表示:“看到在这方面的进展,真的很令人兴奋。”
为了推动其人工智能的发展,索尼去年收购了Cogitai,这是一家由德克萨斯大学奥斯汀分校(University Of Texas At Austin)教授彼得·斯通(Peter Stone)参与创立的公司。斯通已经成功地在虚拟版的Robocup比赛中率先使用了强化学习,并赢得了比赛的胜利。斯通目前领导着索尼在美国的人工智能业务。
在被收购之前,Cogitai推出了一个旨在让强化学习更容易使用的平台。斯通说,整个索尼的研究人员和工程师们现在可以使用这个平台和其他的工具。游戏开发人员或硬件设计人员能够使用这些工具来探索新的想法和创新。他表示,对强化学习的关注,反映出索尼希望走在人工智能领域前端的愿望——通过押注下一个可能出现的大事件。
如今Robocup赛事展现出事物是如何迅猛发展的。参赛者(机器人们)以惊人的速度和技巧传球、移动和射门。
斯通表示,这也预示着人工智能的下一个发展阶段。“在感知和监督学习领域发生了一场革命。”他说,“索尼人工智能的整个前提是:在人工智能领域,自动化决策也有巨大的机会。它真的无处不在,从某种意义上说,它还没有被开发。”