装了 4 亿篇档案的 AI 和人辩论谁赢了?IBM 最强 AI 辩手首次登上《自然》封面

  • 发表时间:
    , 文章来源:MyZaker, 新闻取自各大新闻媒体,新闻内容并不代表本网立场

    *(photo:MyZaker)

    2018 年,IBM 研究院在美国旧金山展示首个能与人类进行复杂辩论的 AI 系统 Project Debater,右侧是以色列国际辩论协会主席 Dan Zafrir.(来源:IBM)

    钛媒体 3 月 18 日消息,

    IBM 研究院杰出工程师、Project Debater 首席调研专家、人工智能专家 Noam Slonim 和团队发表了最新研究成果:一个名为 Project Debater(意为 " 辩手项目 ")的自主系统,已可以与人类专家选手进行体面且有意义的现场竞赛辩论。该系统能通过扫描储存了 4 亿篇新闻报道和维基百科页面的档案库,自行组织开场白和反驳论点。虽然该研究中人类辩手被判定最终获胜,但作者认为,评分接近人类专业辩手水平,人工智能(AI)技术或具备参与复杂人类活动的能力。

    据悉,本研究成果于今晨登上了顶级学术科学期刊《Nature》(自然)杂志封面。

    *(photo:MyZaker)

    本周《自然》杂志封面图

    本论文通讯作者、IBM 研究院杰出工程师 Noam Slonim 博士在接受钛媒体 App 采访时表示,作为有史以来首个人工智能系统,Project Debater 可以与人类进行有意义的现场辩论,这一研究成果具有重大意义。同时,这也是 IBM 研究院掌握语言这一更广泛议程上的一个重要里程碑。

    钛媒体了解到,本份研究中的 IBM Project Debater 是首次登上《自然》主刊封面。

    事实上,AI 发展到今天,应用层主要是计算机视觉(CV)以及听觉环境中。虽然可能存在像 GPT-3 这种文章变换语言新技术,但未有其大规模商用化应用案例。如今随着技术的发展,数据集的不断延伸,具有创造力的 AI 辩论场景成为了新的可能。

    IBM 的 Project Debater 项目由来已久。

    1997 年,IBM 研发的超级计算机深蓝(Deep Blue)国际象棋比赛中击败了世界冠军加里 · 卡斯帕罗夫(Gary Kasparov),而象棋一直被认为是一种人类社会的高智力博弈。

    Project Debater 项目最早于 2011 年被提出,研究目标是让 AI 与人类进行现场辩论时应对自如。

    2018 年,IBM Project Debater 首次公开亮相,并与以色列国家辩论冠军 Noa Ovadia 和以色列国际辩论协会主席 Dan Zafrir 进行辩论。最终在 " 是否应该增加使用远程医疗 " 的其中一个议题中,Project Debater 赢得了辩论,但在另一个 " 我们是否应该资助太空探索 " 话题中败给了人类。最终以各获一次胜利的结果展示给世人。

    如今的这篇最新论文,更多是描述 Project Debater 项目中的体系结构并评估了其性能,还有使用 AI 赋能于辩论环境的技术过程。

    具体来说,研究人员利用大量人工标记的高质量数据,通过训练深度神经网络 ( DNN ) 和弱监督 DNN 来提高自然语言处理 (NLP)技术框架,从而取得和人一样的辩论能力,并通过文本转语音方式输出到外界当中。

    *(photo:MyZaker)

    论点挖掘:是基于约有 4 亿篇报道文章的大型语料库(来自 LexisNexis2011-2018 语料库),将文章分成句子,并用其中的单词、维基百科的概念、预定义索引语句等进行分类,然后使用神经模型根据这些句子代表相关论据的概率对它们进行排序;

    论据知识库:旨在捕捉不同辩论之间的共性,通过论点进行手动编辑,分成专题,接着利用匹配方式将相关文本转换至语音中,在输出时包含鼓舞人心的引语、丰富多彩的类比、辩论的适当框架等;

    论点反驳:更多是利用新的文本转语音 ( TTS ) 算法技术,为 Project Debater 提供清晰流利、有说服力的语言表达能力,包括添加双关语等,基于之前的语料,针对话题论点进行反驳。

    论证构建:主要集成一个基于规则的聚类分析系统,将此前反驳的论点、论据串起来,对于每个集群确定一个主题,类似于维基百科、百度百科的概念,从而完成与对手的辩论、交流。

    那么,AI 辩手真的有能力和人进行主题辩论吗?

    论文中提到,研究人员向人类组成的虚拟观众提供了辩论的文字稿,让他们在一系列话题(如资助学前教育)上对该系统与人类(包括专业辩手)和现有 AI 技术的辩论表现进行盲打分。尽管 Project Debater 在组织开场白方面的得分很高,明显优于其他系统,但最后并没能赢得辩论。

    最终,Project Debater 在 78 类辩题中获得接近人类专业辩手的平均评分。

    *(photo:MyZaker)

    Project Debater 得分情况(来源:论文)

    作者认为,赢得辩论比赛并非 IBM Project Debater 项目的研发重点,仅仅预示着一个新技术的开始。未来,这种 AI 辩手将有潜力在全球范围内协助人类制定日常的复杂决策。

    " 我们的辩论绝不是输赢,我们想证明 AI 系统和功能如何理解、生成自然语言,我相信我们做到了这一点,并且在此过程中学到了很多东西。"Noam Slonim 对钛媒体 App 强调,AI 辩手的作用,主要还是能够帮助人们推理,模拟人类困境,建立充分的论据,提供数据驱动的辩论内容的生成和表达能力,做出更好的决定。

    在《自然》杂志附评论文章中,来自英国邓迪大学(University of Dundee)辩论技术中心的 Chris Reed 撰文认为,该研究开发了一个完全自主的计算机系统,能够与人类现场辩论。这一发现暗示,未来 AI 技术可以帮助人类制定并理解复杂的论点。

    针对于该技术系统的难点和局限性等问题,Noam Slonim 表示,Project Debater 的数据语料依然较少,情感层面还无法与人类比拟。

    他认为,有些问题人类本能理解支持某一主题,但对于 AI 来说,直接理解十分困难,大都依靠数据语料。如果 Project Debater 没有学习任何主题,其只能创建有说服力的描述,并非直接产生论点、论据等。他希望未来该系统可以覆盖更庞大的语料库,从而更好解决十分困难的辩论议题。

    IBM 方面透露,目前 Project Debater 项目已经实现了部分商业化,潜在应用包括金融顾问、律师、公共事务决策、学生助手和企业决策者等。在上周举行的格莱美颁奖典礼上,该 AI 辩手就流行文化话题展开了非打分式辩论。

    Noam Slonim 强调,Project Debater 解决了一个重大的挑战,代表了 AI 技术的进步,而且拓宽(超出)了当前 AI 技术的舒适区,未来将能够参与更加复杂的人类活动。

    (本文首发钛媒体 App,作者|林志佳,编辑|盖虹达)

    更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App