在快速发展的播客领域,Podcastle 平台近日宣布推出其全新的 AI 文本转语音模型 Asyncflow v1.0。这个新模型不仅为用户提供了超过450种不同的 AI 语音,还向开发者开放了 API 接口,以便于他们将这一文本转语音功能直接集成到自己的应用程序中。在价格方面,Podcastle 的文本转语音服务定价为每500分钟约40美元,相比之下,竞争对手 ElevenLabs 则收取99美元。除了文本转语音模型外,Podcastle 的语音克隆功能也得到了升级,训练过程由之前的需朗读70句不同句子,缩短至现在仅需几秒的录音。新过程利用了 Podcastle 去年推出的 Magic Dust AI 技术,显著提高了音频录制质量。在实际测试中,尽管新生成的语音听起来稍显机器人,但仍能较好地模仿说话者的语调。