DeepMind 最新研究:让 AI 像婴儿一样思考

  • 发表时间:
    , 文章来源:MyZaker, 新闻取自各大新闻媒体,新闻内容并不代表本网立场

    *(photo:MyZaker)

    图片来源 @视觉中国

    文 | 学术头条

    计算机能像一个婴儿一样思考吗?

    1950 年,理论计算机科学家、人工智能之父艾伦 · 图灵(Alan Turing)曾说道:" 与其尝试制作一个模拟成人思维的程序,为何不尝试制作一个模拟儿童思维的程序呢?"

    按照图灵的说法,如果从学些儿童的思维开始,并接受适当的经验,计算机就可以像成年人一样思考。

    尽管当前人工智能(AI)行业已经取得了惊人的进步,完成了越来越多的、难以置信的任务,比如 Atari 电子游戏,国际象棋和围棋等棋类游戏,以及蛋白质折叠和语言建模等科学问题。

    但是,人工智能在这些细分领域内取得的成功,也清晰地表明,一些根本的东西依然缺失——人工智能系统在理解物理世界的常识性规律方面,表现得并不尽如人意。

    特别是,即使是最先进的人工智能系统也仍然难以掌握 " 常识 " 知识。

    然而,即使只有 5 个月大的婴儿也懂得世界运作的常识性规则,当他们看到不符合物理规律的场景时,比如玩具突然不见了,也会感到惊讶。

    对人类来说,这种知识似乎无处不在。只有人工智能系统具备如人类一般的推理能力,才能实现真正的智能。

    如今,一项来自英国人工智能公司 DeepMind 的最新研究指出,受婴儿视觉认知研究的启发,他们的人工智能系统能够以类似婴儿的方式学习物理世界的基本常识性规则。

    相关研究论文以 "Intuitive physics learning in a deep-learning model inspired by developmental psychology" 为题,已发表在科学期刊 Nature Human Behaviour 上。

    *(photo:MyZaker)

    ( 来源:Nature Human Behaviour)

    该人工智能系统名为 PLATO,是一个能学习直观物理(Intuitive physics)的深度学习系统,遵循认为物体在我们周围物理世界的表示和预测中扮演核心作用的理论。

    直观物理是一种常识性知识,用来理解物体的行为和相互作用。例如,如果你在半空中摇晃你的钥匙,并宣布让它掉落,每个人都知道,不受其他物体支撑的物体(也就是你的钥匙)不会漂浮在半空中,两个物体(钥匙和桌子)不会相互穿过。因此,你会期望你的钥匙会下落,直到它与桌子相遇。这种认知并不仅仅存在于成年人身上——即使是 3 个月大的婴儿也有,如果人们遇到一个似乎违反预期的 " 神奇 ",就会做出 " 惊讶的 " 反应。

    在此次工作中,研究团队通过给 PLATO 观看许多描绘简单场景的视频来训练它,比如球落到地上,球滚到其他物体后面又再次出现,很多球之间弹来弹去等。

    *(photo:MyZaker)

    图|来自 "freeform" 数据集的视频,用于训练模型。(来源:该论文)

    据论文描述,PLATO 由感知模块(左)和动态预测器(右)两部分组成,感知模块用于将视觉输入转换为一组目标代码,动态预测器则使用这些目标代码来预测未来的帧。

    *(photo:MyZaker)

    图|PLATO 使用感知模型和动态模型对每个物体进行预测。(来源:该论文)

    PLATO 将每一段视频帧通过感知模块分解为一组目标代码,实现了从视觉输入到个性化对象的映射;随后,目标代码在对象缓冲区中通过帧进行累积和跟踪;最后,系统会动态地处理物体的表征,产生新的表征,这些表征会受到物体与其他物体之间的关系和互动的影响。

    此外,他们也通过一系列实验来验证人工智能系统是否可以学习一系列不同的物理概念——特别是那些年幼的婴儿可以理解的概念,比如固体性(两个物体不会相互穿过)和连续性(物体不会瞬时性地存在)。

    训练之后,研究人员给 PLATO 观看了有时包含不可能场景的视频,以此作为测试。

    和年幼的小孩一样,PLATO 在看到没有意义的场景(比如物体互相穿过却没有发生相互作用)时表现出了 " 惊讶 "。

    *(photo:MyZaker)

    图|PLATO 展示了在没有任何再训练的情况下对未见过的物体和动力学具有鲁棒性。(来源:该论文)

    最重要的是,PLATO 只观看了 28 小时的视频就获得了以上学习效果。

    此外,此次研究还有两个令人惊讶的发现。

    其一,该模型能够将期望概括为一组新的对象和事件,这些对象和事件与训练集中呈现的不同;

    第二,该模型能够成功地演示学习,尽管已经在一个相对较小的视觉动画集上训练。

    而这些发现,与科学家此前在婴儿研究中看到的特征相似。

    对此,美国西北大学教授 Susan Hespos 评价道," 与许多关键的研究发现一样,该研究可以成为人工智能和发展科学之间的协同机会。他们的工作正在突破日常经验可以和不可以解释智能的界限。"" 这篇论文的结果表明,图灵可能是对的。"

    在她看来,该研究在关于婴儿和成人看待世界的方式是否基本相似的先天 - 后天(nature – nurture)辩论中建立了一个有趣的中间立场。

    在以往的研究中," 先天 " 的观点被当代许多发展科学家所接受,但这并不是唯一的可能性,而其他学者支持从零开始学习的 " 后天 " 理论,并坚持认为发展真正智能的关键在于通过处理大量经验或大量数据来发现输入的模式。如果后者是正确的,那么大脑可以被视为一种通用设备,它能适应环境提供的任何结构和挑战。

    "Piloto 等人的结果表明,视觉动画的经验是学习过程的重要贡献,但它不是全部。完整的故事需要一些内在的知识。"

    基于以上研究,研究团队表示,模仿婴儿认知的深度学习系统 PLATO 胜过更传统的 " 从零开始学习 " 系统。

    PLATO 可以作为研究人类如何学习直观物理的一个有力工具,同时也表明了物体表征对于我们理解周围世界具有重要作用。

    参考资料:

    https://www.nature.com/articles/s41562-022-01394-8

    https://www.nature.com/articles/s41562-022-01395-7

    更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App