内容目录
Toggle
什麽是进阶语音模式(AVM)
进阶语音模式(AVM)是 OpenAI 为 ChatGPT 开发的功能,最初於五月宣布并展示,它允许使用者透过即时语音与ChatGPT人工智慧模型进行互动对话。这种模式利用文字转语音的合成技术,使得ChatGPT能够用人类般的声音回应使用者的问题和指令,而且具有自然的语调。
这项技术的目的是模仿人与人之间的即时对话,提升使用者与AI互动的自然度和流畅性。使用者可以在对话中随时打断ChatGPT,而ChatGPT能够根据对话内容适应性地回应,就像与真人交谈一样。
安全优先
然而,这项技术在五月发布时仍然存在一些缺陷,且该技术本身所带来的潜在安全隐患(如伪造他人声音)也是一大硬伤。根据 OpenAI 的说法,安全一直是该公司的首要关注点。在 X 平台上宣布这项功能推出的贴文中,该公司写道:
「我们与 100 多个外部红队(Red Teaming)成员在 45 种语言中测试了GPT-4的语音功能。为了保护人们的隐私,我们训练模型只使用四种预设声音进行说话,并建立了阻止与这些声音不同的输出的系统。」
根据 OpenAI 的说法,AVM 的限时发布已经开始,并将继续增加更多用户「滚动」加入。该公司预计这项功能将在秋季向所有 Plus 订阅用户开放。