Geek2025-03-11 22:32:18Groq 的 QwQ-32B 以 453.20 T/s 的惊人速度运行时,看到「思考1秒」的标签还以为是系统偷懒,点开却发现它生成了大量中间推理内容,但结果却差强人意……突发奇想尝试用 DeepClaude 混合模型,试着将 Groq 的推理过程传给 GPT-4o 分析,结果速度太快,连 DeepClaude 都没捕捉到推理内容就结束了。😂 #人工智能#模型推理#混合模型
Haoshan Hong2025-02-12 09:34:17这绝对是一周以来最重要的新闻,但却没有人报道也很少人发现。 Groq和sambanova开放了对普通开发者的付费权限! 他们不是简单的 API 提供商,他们是飞速的 API 提供商。 和几十token每秒的生成速度相比,几百几千token每秒不只是速度上量级的改变,对应用场景来说也是会带来质变的。 此前,普通开发者只能免费试用这些革命性的API,忍受着限额,并不能实际投入产品中。 但现在#Groq#sambanova#开放权限
Huihoo灰狐2024-12-29 08:37:04Nvidia, GPU (Graphics Processing Unit) Google, TPU (Tensor Processing Unit) Groq, LPU (Language Processing Unit) Groq:Nvidia 的最新 AI 竞争对手 Groq 创新的核心是其 LPU,旨在以前所未有的速度加速 AI 模型,包括 ChatGPT 等语言模型 与使用高#NVIDIA#AI#Groq