15秒复制出人声还能多语系 OpenAI新技术太厉害将设限

OpenAI公司标志。（路透档案照）(photo:LTN)

〔编译管淑平／综合报导〕美国人工智慧（AI）技术开发公司OpenAI开发了利用AI生成文字、图片和影片的技术后，现在更开发出语音复制工具，可以模仿人声，但是为了安全顾虑，暂时不打算公开释出。

OpenAI 29日公开这款新的「语音引擎（Voice Engine）」技术，根据公司公开的初期测试结果，这项技术能够以令人信服的人声朗读文字，与之前生成语音内容不同的是，「语音引擎」能够以听起来就像某个人讲话的节奏和语调，生成一段谈话。

OpenAI宣称，只要有15秒的真人说话录音样本，就可以复制出同一个人说话的声音，还能生成出不同语言，例如母语为英语者，可以生成用西班牙语、法语、中文或其他语言讲话。

《彭博》指出，29日的展示活动上，记者听了一段OpenAI执行长奥特曼（Sam Altman）简短解释这项技术的录音，声音听起来与奥特曼本人讲话难以区别，但却是完全由AI生成的。

不过，为了防范这项技术被滥用，OpenAI目前仅与少数组织和开发员测试这项功能，「现阶段还不会广泛释出这项技术」。OpenAI在声明中说，「我们了解生成类似某人声音的谈话有严重风险，尤其在选举年更是备受关注」，初期测试员已经同意，未经当事人同意不会模仿其声音，而且会揭露以AI生成的语音。

OpenAI一週前为这项技术申请的商标权显示，目标可能是要进军语音辨识和数位语音助理业务。改善这类技术最终会有助于OpenAI与亚马逊（Amazon）的Alexa等其他同类产品业者竞争。

苹果Apple Watch陷专利纠纷，在美停止销售！德国提前终止电动车补贴！
全球新闻 • 美国新闻 科技创新 • • CathyHuang(-41)