叮当号7月12日消息,据媒体报道,微软公司近期成功研发了一款名为VALL-E2的革命性AI语音生成技术,该技术的问世标志着AI语音合成领域的一个重大突破。仅需短短三秒钟的音频样本,VALL-E2便能以前所未有的精确度与自然度,复现出说话者的独特声线,其表现几乎达到了以假乱真的人类水准。
科学家表示,这是AI语音首次达到人类水平,由于太过危险,无法向公众发布。
鉴于当前AI语音诈骗案件频发,该技术若落入不法分子之手,可能加剧此类犯罪的风险,诈骗者能够轻易克隆他人声音,进行高度逼真的电话诈骗,诱导受害者进行财务交易,造成巨大经济损失。
与此同时,VALL-E2技术的快速发展也对传统声音演员行业构成了挑战。声音演员们担心,随着AI语音合成技术的日益成熟,他们的声音可能被轻易复制并用于各种场合,而他们所应得的经济补偿却难以得到合理保障,这无疑对他们的职业生涯构成了潜在威胁。
尽管VALL-E2 AI语音生成器不会对公众开放,但也证明了AI在这方面的技术进步,以及未来在合适的时候可以应用,包括教育学习、娱乐、新闻、聊天机器人等。
文章来自互联网,只做分享使用。发布者:木子,转转请注明出处:https://www.dingdanghao.com/article/634888.html