语音克隆技术的蓬勃吸引的不仅是演员 还有网络罪犯

  • 发表时间:
    , 文章来源:BBC, 新闻取自各大新闻媒体,新闻内容并不代表本网立场

    • 帕尔迈(Kitti Palmai)

    蒂姆·海勒是一位配音艺术家和演员。(photo:BBC)
    蒂姆·海勒是一位配音艺术家和演员。(photo:BBC)

    随着“语音克隆”技术效果的提高,演员和网络犯罪分子对其兴趣与日俱增。当蒂姆·海勒第一次听到自己的语音克隆时,他说听到的声音是如此准确,以至于 “我惊掉了下巴......这令人震惊”。

    语音克隆是指用计算机程序来生成一个合成的、可适应的人的声音副本。从某人说话的录音中,该软件能复制其声,并说出你在键盘上输入的任何单词或句子。

    这种技术的最新进展是,计算机生成的音频据说现已精确到令人不安的程度。软件不仅能识别口音而且能识别音色、音调、节奏、说话的流畅度和呼吸,克隆的语音样本可以被加以调整以表达任何需要的情绪:如愤怒、恐惧、快乐、爱或无聊等。

    来自德克萨斯州,29岁的配音艺术家和演员海勒从事包括饰演卡通人物、为有声读物和纪录片配音、在视频游戏中发声,以及为电影预告片配音等各类工作。海勒说,他最近将兴趣转向语音克隆,以应证其未来的职业生涯。他又说,这可能使他获得更多工作机会。例如,如果自己被两项工作同时预订,他可以提供克隆配音来代替其中一个工作。

    “如果我被预订了其他工作...... 我可以把我的‘配音’(他称自己的克隆声音)定位为一个可以节省客户时间的选择,并为自己创造被动收入,” 海勒说。

    为了克隆自己的声音,海勒找到一家位于波士顿,名为VocaliD的公司。越来越多的公司提供这种服务,它是其中之一。

    VocaliD由其首席执行官鲁帕尔·帕特尔(Rupal Patel)创立,她也是东北大学(Northeastern University)通信科学教授。帕特尔在2014年成立这家公司,作为其临床工作的延展内容,为那些在没有帮助的情况下便无法说话的病人创造人工声音。例如在手术或生病后失声的人。

    帕特尔教授是一名美国学者,是语音克隆应用方面的专家。(photo:BBC)
    帕特尔教授是一名美国学者,是语音克隆应用方面的专家。(photo:BBC)

    她说,这项技术由人工智能主导,软件可以 "学习 "并自行适应,在过去几年里有很大进步。这也引起配音艺术家的注意:“我们还专门为客人定制更加多样化的声音,”帕特尔教授说。

    “我们制作了一些变性人的声音,还有一些性别中立的声音......技术应该以我们所有人的方式说话,我们都有独特的口音和声音。”

    语音克隆还可以用来将演员的声音翻译成不同的语言,这意味着,例如美国电影制作公司,可能将不再需要雇用额外的演员为电影制作海外发行的配音版本。

    加拿大公司Resemble AI表示,现在可以将克隆的英语语音变成其他15种语言;首席执行官佐海布·艾哈迈德(Zohaib Ahmed)说,要生成一个高质量的人声副本,软件需要某个人说话的录音,时间短至10分钟。

    “当人工智能学习你的声音时,它学习了许多属性......如音色和音调,以及强度,”他说,“但它也会学习(一个人的声音)的数千个其他特征,这些特征对我们来说可能不是很明显。”

    佐海布·艾哈迈德的公司可以将一个人的声音变成其他语言。(photo:BBC)
    佐海布·艾哈迈德的公司可以将一个人的声音变成其他语言。(photo:BBC)

    然而,尽管声音克隆的日益复杂化具有明显的商业潜力,它也导致人们越来越担心它可能被用于网络犯罪:欺骗大众相信另外的人在说话。

    与计算机生成的假视频一起,声音克隆也被称为 “深度伪造”(deep fake)。而网络安全专家埃迪·波布里茨基(Eddy Bobritsky)说,合成声音会带来 “巨大安全风险”。

    以色列公司Minerva实验室的老板说:“当涉及到电子邮件或短信时,多年来人们都知道,冒充他人相当容易。但直到现在,与你信任和熟悉的人通电话是确保你确实了解这个人的最常见方式之一。”

    波布里茨基说,这种情况现在正在改变。“例如,如果一个老板打电话给雇员要求提供敏感信息,而雇员认出了这个声音,其立即反应就是按要求做。这是很多网络犯罪的途径”。

    事实上,《华尔街日报》早在2019年就报道过这样一个案例,据称一位英国经理被骗向骗子转移22万欧元(26万美元;19万英镑),骗子用其德国老板的声音克隆副本行骗。波布里茨基补充说:“需要采取步骤来处理这种新技术及其带来的威胁。”

    正如专业人工智能新闻网站Venture Beat所报道的那样,世界各地的公司事实上已经在这样做。

    这些公司可以监测音频,看它是否是假音,寻找诸如重复、数字噪音和使用某些短语或词语的蛛丝马迹。同时,政府和执法机构也在关注这一问题。去年,欧盟的执法机构欧洲刑警组织敦促各成员国对能够检测深度伪造的技术进行 "重大投资"。而在美国,加州已禁止在政治活动中使用这些技术。

    在德克萨斯州,海勒说虽然他还没有出售他的克隆声音,但 “有几个不同的客户表示有兴趣”。

    从长远来看,他是否担心可能会因为其他人的合成声音而失业?他说:“我并不担心它会让我丢工作。我真的觉得,真正的人声永远有其存在的价值。拥有‘配音’(他的克隆声)的意义不在于取代我或其他任何人,而是作为我业务中的一个额外工具存在。”

    美国演员工会,电影演员协会的执行副总裁丽贝卡·达蒙(Rebecca Damon)说,围绕语音克隆这个话题的另一个关键问题是,配音员要为他们支付适当的报酬。

    她说:“声音克隆可以代表我们的成员从事的一个令人兴奋和可能有利可图的新行业。然而,对我们来说,至关重要的是,配音演员应得到公平补偿,并能够同意如何使用他们的声音。为此我们正在密切监测语音克隆技术的发展,并与我们的成员合作,确保所需的行业护栏可以就位,使这项崭新的和受欢迎的工作领域实现其潜力。”

    海勒补充说,关于设定语音克隆的定价问题是,“这是配音界的‘西部荒野’”。

    他说:“在我看来,当涉及为你的人工智能语音]定价和合同谈判时,最重要的是你并未签下所有权和永久使用权。”

    BBC记者威尔·斯梅尔(Will Smale)对本文亦有贡献。