ginobefun

ginobefun

0 关注者

1个月前

Gemini Live API 是 Google 正式发布的实时对话 API,基于 Gemini 2.5 Flash Native Audio 模型,通过单一 WebSocket 连接提供低延迟的多模态对话能力。 核心创新为原生音频处理架构:摒弃传统的 STT(语音转文字)→ LLM(大模型)→ TTS(文字转语音)三段式流水线,改用统一的低延迟原生音频模型,直接处理音频流,大幅降低响应延迟。

热门新闻