OpenAI CEO Sam Altman 今日宣布,GPT-Realtime-2 模型正式向 API 用户开放,这是语音 AI 领域的重大进步。“人们越来越倾向于通过语音与 AI 互动,尤其是当他们需要倾倒大量上下文时,”Altman 在 X 平台发帖称,“GPT-Realtime-2 今天上线 API,它是相当大的前进一步。”
该模型专为实时语音处理优化,支持更自然的对话流畅性。Altman 观察到,年轻人更偏好语音互动,而中年用户仍习惯打字;OpenAI 同时正改进 ChatGPT 中的语音功能,以适应全球用户多样需求。
这一发布源于用户行为变化:语音输入能高效传输复杂信息,推动 AI 从文本向多模态转型。OpenAI 已在 API 中集成该模型,开发者可立即构建语音应用,如虚拟助手或实时翻译工具。
全球 AI 市场中,语音技术需求激增,此举将加速企业级部署,助力 OpenAI 在竞争中领先。
随着 GPT-Realtime-2 的推广,多模态 AI 或将重塑日常互动格局。

