人声接近真人！OpenAI更新三款超强语音AI

发布时间：2026-05-09来源：快科技鹿角

据媒体报道，

OpenAI

正式宣布对其实时API接口进行重大升级，一次性推出三款全新高阶语音智能模型，全面强化

AI

在实时听觉、口语交互、翻译与转录方面的能力，并大幅降低企业开发智能语音应用的技术门槛。

本次更新的核心产品包括：

GPT-Realtime-2、实时翻译模型以及实时转写模型。其中，GPT-Realtime-2搭载了GPT-5级别的推理能力，人声仿真度进一步提升。

相比前代产品，它能够更精准地理解并处理复杂的人类指令，实现更自然、更智能的连续对话交互。

在翻译方面，GPT-Realtime-Translate支持超过70种语言的识别以及13种语言的语音输出，能够同步人声语速完成实时翻译，实现无卡顿的跨语言沟通。

配套上线的Whisper实时转录模型，可在人机互动过程中同步完成语音转文字，适用于会议记录、实时笔录等高频办公场景。

OpenAI表示，

本次升级将AI音频交互从基础问答提升为综合性智能语音操作系统，集聆听、思考、翻译、转写与实时响应于一体，实用性大幅增强。

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。