OpenAI正在为其API引入新的转录和语音生成AI模型,该公司声称这些模型比以前的版本有所改进。对于OpenAI来说,这些模型符合其更广泛的“代理”愿景:构建能够代表用户独立完成任务的自动化系统。“代理”的定义可能存在争议,但OpenAI产品负责人Olivier Godemont描述了一种解释,即可以与企业客户交谈的聊天机器人。
UsFn! !+
K6-M .I
OpenAI声称,其新的文本转语音模型“gpt-4o-mini-tts”不仅可以提供更细致入微、听起来更逼真的语音,而且比上一代语音合成模型更“可控”。开发人员可以指导gpt-4o-mini-tts如何用自然语言说话——例如,“像疯狂的科学家一样说话”或“像正念老师一样用平静的声音说话”。 TE+>|}]R
`q<W %'Tb$
以下是“真实犯罪风格”的饱经风霜的声音: HBOyiIm Q
7LrmI~P
以下是女性“专业”声音的样本: RfTGTz@H
^c.D&