xAI正式宣布Grok Voice Agent API,面向开辟者开放其在Tesla车辆及移动应用中已验证的语音代理技巧。

今朝支撑经由过程xAI LiveKit插件或浏览器语音沙盒快速接入。

据介绍,该API支撑数十种说话,具备及时对象调用与收集搜刮才能,平均首音频响应时光低于1秒,在Big Bench Audio评测中位列第一。

Grok Voice Agent采取自研全栈语音技巧,包含语音活动检测、分词器与音频模型,订价为每分钟0.05美元。API兼容OpenAI Realtime规范,并供给Ara、Eve、Leo等多款天然表达语音。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部