OpenAI 最智能 AI 语音模型:GPT

发布时间:2026-05-29 17:04

今日科技新闻:最新AI语音助手能模仿你的语气交互 #生活乐趣# #日常生活趣事# #每日生活新鲜事# #科技前沿资讯#

IT之家 5 月 8 日消息,OpenAI 发布三款实时语音模型,分别针对推理、翻译和转录场景,集成于 Realtime API 供开发者调用。这三款模型为实时语音应用提供底层技术支撑,目标解决语音交互中的延迟、打断处理和多语言支持难题。

GPT-Realtime-2 专为实时交互设计,是首款具备 GPT-5 级推理能力的语音模型。它在保持对话自然流畅的前提下,能在对话过程中进行推理、调用工具,并处理用户的打断或纠正。这意味着开发者可以构建更复杂的语音助手,并能执行多步骤任务。

定价方面,GPT-Realtime-2 音频输入定价为每百万 Token 费用 32 美元(IT之家注:现汇率约合 218.1 元人民币),输出为 64 美元(现汇率约合 436.2 元人民币),缓存输入仅需 0.4 美元。

GPT-Realtime-Translate 支持 70 种输入语言转 13 种输出语言,翻译速度与说话者同步,适用于跨国会议或实时沟通场景。

GPT-Realtime-Whisper 则专注于低延迟流式转录,音频随说随转,让实时字幕和会议记录能跟上对话节奏,减少等待时间。翻译和转录模型按分钟计费,分别为每分钟 0.034 美元和 0.017 美元。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

网址:OpenAI 最智能 AI 语音模型:GPT https://www.yuejiaxmz.com/news/view/1459251

相关内容

OpenAI一夜干翻语音助手!GPT
OpenAI放大招:即将推出AI语音助手,与苹果达成合作
压力之下,奥特曼宣布:OpenAI数月内推GPT
ChatGPT: 如何利用OpenAI的GPT
OpenAI发布GPT
苹果Siri的AI突破:从语音助手变成智能体
OpenAI奥特曼频繁造势,GPT
Alloy Voice Assistant: 一款创新的AI语音助手
OpenAI实时API发布:实时语音交互新纪元的来临
OpenAI又开源了:推出两个能在笔记本和手机上运行的开源模型

随便看看