OpenAI首席执行官Sam Altman表示,人们越来越倾向于使用语音与AI互动,尤其在需要输入大量上下文时。GPT-Realtime-2语音模型今日正式接入API,这是语音AI领域的重大进步。
Altman在X平台发帖指出,该模型显著提升了实时语音处理能力,用户可更自然地“倾倒”复杂信息。他观察到,年轻人与老年人偏好语音交互,而中年群体仍习惯打字,这一模式可能随技术演进而改变。OpenAI同时透露,正在优化Chat中的语音功能,以进一步提升用户体验。
此举源于用户反馈:语音交互能加速信息传输,适用于全球多样场景,如移动办公或多语言环境。相比文本,语音减少了输入障碍,推动AI从工具向伴侣转型。
Altman强调:“GPT-Realtime-2是语音AI的重要一步。”OpenAI此番更新或加速企业级语音应用部署,助力AI融入日常生活。

