中国提出生成式AI模型训练数据黑名单 遏止有害内容

  • 发表时间:
    , 文章来源:CnYes, 新闻取自各大新闻媒体,新闻内容并不代表本网立场

    中国提出生成式AI模型训练数据黑名单 遏止有害内容(图:REUTERS/TPG)(photo:CnYes)
    中国提出生成式AI模型训练数据黑名单 遏止有害内容(图:REUTERS/TPG)(photo:CnYes)

    路透周四 (12 日) 报导,中国针对供应生成式人工智慧 (AI) 服务公司发布了拟议的安全要求,其中包括一份不能用于训练 AI 模型来源的黑名单。

    报导指出,这些要求是由中国全国信息安全标准化技术委员会 (National Information Security Standardization Committee) 于周三 (11 日) 发布的,该委员会成员包括来自中国网信办 (CAC)、工信部(MIIT) 以及警方的官员。

    该委员会提议对用于训练面向大众的生成式 AI 模型里每个内容主体进行安全评估,其中只要包含「超过 5% 的非法和有害讯息」内容将被列入黑名单。这些讯息包括「宣扬恐怖主义」或暴力,以及「推翻社会主义制度」、「损害国家形象」、「破坏民族团结和社会稳定」。

    该草案还规定,中国网路上经过审查的资讯不应用于训练模型。就在一个多月前,中国监管机构允许搜寻引擎巨擘百度 (BIDU-US)(9988-HK) 在内的几家中国科技公司向大众推出其 AI 聊天机器人。

    自今年 4 月来,中国网信办一直表示,希望企业在向大众推出生成式 AI 之前,向有关部门呈交安全评估。随后在今年 7 月,该机构发布管理此类服务的措施。有分析人士指出,这些措施远没有 4 月草案概述的那般繁重。

    至于中国当局本周三公布的草案只要求培训这些 AI 模型的机构会征求个人同意,这些个人资讯 (包括生物特征数据) 用于培训目的。另外当局还就如何避免侵犯智慧财产权制定详细指导方针。

    报导指出,全球各国都努力在替这项技术设置安全护栏。中国将 AI 视为与美国竞争领域的一环,打算在 2030 年成为该领域的全球领导者。

    由于 OpenAI 的 ChatGPT 聊天机器人的成功,生成式 AI 开始普及,其可以学习如何从过去的数据中採取行动,并在训练的基础上创建文本或图像等新内容。