中国提出生成式AI模型训练数据黑名单遏止有害内容

中国提出生成式AI模型训练数据黑名单遏止有害内容(图：REUTERS/TPG)(photo:CnYes)

路透周四 (12 日) 报导，中国针对供应生成式人工智慧 (AI) 服务公司发布了拟议的安全要求，其中包括一份不能用于训练 AI 模型来源的黑名单。

报导指出，这些要求是由中国全国信息安全标准化技术委员会 (National Information Security Standardization Committee) 于周三 (11 日) 发布的，该委员会成员包括来自中国网信办 (CAC)、工信部(MIIT) 以及警方的官员。

该委员会提议对用于训练面向大众的生成式 AI 模型里每个内容主体进行安全评估，其中只要包含「超过 5% 的非法和有害讯息」内容将被列入黑名单。这些讯息包括「宣扬恐怖主义」或暴力，以及「推翻社会主义制度」、「损害国家形象」、「破坏民族团结和社会稳定」。

该草案还规定，中国网路上经过审查的资讯不应用于训练模型。就在一个多月前，中国监管机构允许搜寻引擎巨擘百度 (BIDU-US)(9988-HK) 在内的几家中国科技公司向大众推出其 AI 聊天机器人。

自今年 4 月来，中国网信办一直表示，希望企业在向大众推出生成式 AI 之前，向有关部门呈交安全评估。随后在今年 7 月，该机构发布管理此类服务的措施。有分析人士指出，这些措施远没有 4 月草案概述的那般繁重。

至于中国当局本周三公布的草案只要求培训这些 AI 模型的机构会征求个人同意，这些个人资讯 (包括生物特征数据) 用于培训目的。另外当局还就如何避免侵犯智慧财产权制定详细指导方针。

报导指出，全球各国都努力在替这项技术设置安全护栏。中国将 AI 视为与美国竞争领域的一环，打算在 2030 年成为该领域的全球领导者。

由于 OpenAI 的 ChatGPT 聊天机器人的成功，生成式 AI 开始普及，其可以学习如何从过去的数据中採取行动，并在训练的基础上创建文本或图像等新内容。

Twitter 前 CEO 多西：马斯克是解决当前问题的「唯一解决方案」
全球新闻 • 财经贸易 美国新闻 • • CathyHuang(-85)