美国流媒体巨头Spotify近日为播客推出了一项新的人工智能语音翻译功能,赢得了X公司老板埃隆·马斯克的赞誉。
Spotify正在测试一项新的人工智能功能,该功能名为“语音翻译(Voice Translation)”,可以克隆播客主播的声音,并使用相同的语气,节奏和速度,提供西班牙语,法语和德语的无缝听力体验。
该工具是Spotify在OpenAI 的自动语音识别 (ASR) 系统Whisper的帮助下开发的,使用了语音转文本生成AI模型来翻译音频文件,并使用语音复制模型来匹配原始说话者的风格。
这项技术的早期测试已经在一些流行的英语播客上进行了,Spotify打算将这一功能扩展到更多的播客,甚至尝试为多语种主持人提供人工智能配音的内容。
知名播客主持人和计算机科学家莱克斯·弗里德曼在X平台上发帖,表达了他对Spotify的人工智能翻译和语音克隆能力的兴奋之情。
马斯克在他的帖子下回应了一个表示惊叹的“Wow”。