xAI正式宣布Grok Voice Agent API,面向开辟者开放其在Tesla车辆及移动应用中已验证的语音代理技巧。据介绍,该API支撑数十种说话,具备及时对象调用与收集搜刮才能,平均首音频响应时光低于1秒,在Big Bench Audio评测中位列第一。
今朝支撑经由过程xAI LiveKit插件或浏览器语音沙盒快速接入。

Grok Voice Agent API在Big Bench Audio音频推理基准测试中排名第一,平均首音频响应时光小于1秒,比最接近的竞争敌手快近5倍。该API采取固定费率计费,每分钟连接时光收费0.05美元。

Grok Voice Agent采取自研全栈语音技巧,包含语音活动检测、分词器与音频模型,订价为每分钟0.05美元。API兼容OpenAI Realtime规范,并供给Ara、Eve、Leo等多款天然表达语音。

发表评论 取消回复