ElevenLab的AI语音生成技术正在扩展到30种语言

ElevenLab's AI speech generation technology is expanding to 30 languages.

ElevenLabs是一家初创公司,因其基于人工智能的语音生成平台而闻名,该平台已被用于叙述有声读物并增加内容的可访问性,但也被滥用以使公众人物似乎说出可怕的事情。该平台现在已经推出测试版,并且在更多语言上有了显著的扩展。

周一,ElevenLabs宣布该平台将退出从一月份开始的测试阶段,该初创公司还公布了一个新的基础多语言深度学习模型,名为Eleven Multilingual v2。

同时:Claude AI可以做到的4件事ChatGPT无法做到

Eleven Multilingual v2支持30种语言,并允许全球人们使用ElevenLabs的文本转语音和语音克隆能力。

根据发布信息,当用户输入文本时,该模型会自动识别所写语言,并生成“前所未有的真实度”的语音。

无论是合成的声音还是克隆的声音,说话者独特的声音特征在这30种语言中保持不变,这确保了使用相同的语音风格,包括口音。

“ElevenLabs的创立是为了实现以任何语言和任何声音普遍访问所有内容的梦想,” ElevenLabs的首席执行官兼联合创始人Mati Staniszewski说道。

“通过发布Eleven Multilingual v2,我们离实现这一梦想更近了一步,将人类质量的AI声音提供给每个方言。”

同时:IBM研究表明,由于人工智能,未来3年中40%的工人将需要重新学习技能

ElevenLabs确定了该应用的一些潜在用例,例如允许独立作家制作有声读物,为国际观众翻译视频游戏体验和音频内容,以及增加视觉障碍和其他学习需求人群的内容可访问性。

根据发布信息,支持的语言包括韩语、荷兰语、土耳其语、瑞典语、印度尼西亚语、越南语、菲律宾语、乌克兰语、希腊语、捷克语、芬兰语、罗马尼亚语、丹麦语、保加利亚语、马来语、匈牙利语、挪威语、斯洛伐克语、克罗地亚语、经典阿拉伯语、泰米尔语、英语、波兰语、德语、西班牙语、法语、意大利语、印地语和葡萄牙语。