15秒复制出人声还能多语系 OpenAI新技术太厉害将设限

  • 发表时间:
    , 文章来源:LTN, 新闻取自各大新闻媒体,新闻内容并不代表本网立场

    OpenAI公司标志。(路透档案照)(photo:LTN)
    OpenAI公司标志。(路透档案照)(photo:LTN)

    〔编译管淑平/综合报导〕美国人工智慧 (AI)技术开发公司OpenAI开发了利用AI生成文字、图片和影片的技术后,现在更开发出语音复制工具,可以模仿人声,但是为了安全顾虑,暂时不打算公开释出。

    OpenAI 29日公开这款新的「语音引擎(Voice Engine)」技术,根据公司公开的初期测试结果,这项技术能够以令人信服的人声朗读文字,与之前生成语音内容不同的是,「语音引擎」能够以听起来就像某个人讲话的节奏和语调,生成一段谈话。

    OpenAI宣称,只要有15秒的真人说话录音样本,就可以复制出同一个人说话的声音,还能生成出不同语言,例如母语为英语者,可以生成用西班牙语、法语、中文或其他语言讲话。

    《彭博》指出,29日的展示活动上,记者听了一段OpenAI执行长奥特曼(Sam Altman)简短解释这项技术的录音,声音听起来与奥特曼本人讲话难以区别,但却是完全由AI生成的。

    不过,为了防范这项技术被滥用,OpenAI目前仅与少数组织和开发员测试这项功能,「现阶段还不会广泛释出这项技术」。OpenAI在声明中说,「我们了解生成类似某人声音的谈话有严重风险,尤其在选举年更是备受关注」,初期测试员已经同意,未经当事人同意不会模仿其声音,而且会揭露以AI生成的语音。

    OpenAI一週前为这项技术申请的商标权显示,目标可能是要进军语音辨识和数位语音助理业务。改善这类技术最终会有助于OpenAI与亚马逊(Amazon)的Alexa等其他同类产品业者竞争。