简介:来自语音独角兽ElevenLabs创始人的访谈
ElevenLabs是一家专注运用深度学习开发自然逼真的语音合成的公司。2022年成立,发展迅猛,2025年1月完成1.8亿美元C轮融资,估值达33亿美元。
片面摘要:
- 我们一直有个坚定的信念:语音是人类与技术交互最自然、最高效的接口,也是人与设备之间最直观的沟通方式。虽然最初的愿景是聚焦在配音和影视本地化上,但后来我们意识到,声音的潜力远不止于此——它可以提升从叙述类内容到实时交互体验的方方面面。
- 我们很多语音生成工作,正是通过加入一些不完美的“人性化特征”,让合成声音显得更加真实和有情感,这也成为ElevenLabs的声音技术与众不同之处。当然,并不是所有场景都适合这种风格。但总体而言,“人性”中的不完美,恰恰是人愿意互动的关键。
- 最让我意想不到的、基于ElevenLabs产品的应用场景:有一个对我们来说最温暖的故事。去年发生了一件事,一位美国国会议员因为ALS(渐冻症)不幸失去了声音,却希望继续代表她的州在国会工作,我们帮助她重建了声音。
来源:www.youtube.com