与ChatGPT抗衡 中国将推出"习思想"聊天机器人

  • 发表时间:
    , 文章来源:RFA, 新闻取自各大新闻媒体,新闻内容并不代表本网立场

    中国AI语言模型充满习思想(photo:RFA)
    中国AI语言模型充满习思想(photo:RFA)

    近日有消息指出,北京当局正在训练人工智能,企图研发出贯彻"习思想"的聊天机器人,以期在管控言论自由的同时与美国科技公司Open AI开发的聊天机器人ChatGPT竞争。

    据英国金融时报报道,中国官方近日即将推出贯彻“习近平新时代中国特色社会主义思想”的聊天机器人。在透过学习大量官方文件建立大型语言模型、确保人工智能彻底理解习近平思想后,该聊天机器人的问世希望与美国的人工智能平台ChatGPT竞争。

    金融时报引述知情人士消息写到,中国官方研发的聊天机器人目前仍在中国网信办内部的一个研发中心进行试验,但最终可能会提供一般民众使用,并支援回答问题、创建报告、总结信息、以及在中英文翻译等功能。

    报道指出,前述聊天机器人的推出显示了中国当局在过去10年积极推广“习思想”的趋势——以习近平名义出版的书籍已经超过十几本,并长年稳坐畅销书排行榜;腾讯或网易等热门媒体平台经常保留顶部推送的位子给官方发布的文章;年仅十岁的学生需要学习习近平的政治哲学;中国官方还推出了“学习强国”应用程序,确保全国1亿的共产党员对党有足够的理解;2018年,习近平思想也被写入了中国宪法中。

    在北京宣传展览上,参观者观看大屏幕上播出的习近平讲话。(美联社)(photo:RFA)
    在北京宣传展览上,参观者观看大屏幕上播出的习近平讲话。(美联社)(photo:RFA)

    生成式人工智能缺乏中文数据 难通过北京言论审查

    与此同时,中国当局对于人工智能聊天机器人已经有著严谨规范。中国网信办在去年七月公布了《生成式人工智能服务管理暂行办法》,该办法要求聊天机器人需贯彻社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、破坏国家统一和社会稳定的内容,并要求开发公司对其机器人所输出的内容负责。

    金融时报的文章写到,前述的相关规定对于聊天机器人的开发者来说是艰钜的挑战,因为训练语言模型的中文数据相对缺乏,多数的训练都是以英文进行,这导致生成式人工智能很容易陷入不符合中国言论规范的情况。对此,中国科技巨头百度和阿里巴巴也都极力确保其生成模型避免触及敏感问题,当用户对敏感话题进行追问时,这两个集团的聊天机器人通常会要求用户重新开启对话。

    针对此一发展瓶颈,与中国网信办存在联系的非营利组织中国网络空间安全协会在去年十二月发布了含括一亿条数据的数据库,提供各团队进行模型训练。而据《金融时报》报道,该数据库内容主要涵盖政府法规和政策文件、国家媒体报道和官方出版物,光是在其中一份文件中,“习近平”的关键词便出现了八万六千次,该文件还写道“确保在思想上、政治上和行动上始终与以习近平总书记为核心的党中央保持高度一致。”

    记者:唐缘媛   责编:李亚千    网编:洪伟