#Groq

5个月前

国内这些大模型调用速度实在太慢了。试了下curl纯测试，deepseek和智谱一个简单的调用要10s。而随便测试了下groq，一个调用0.6s。这差距太大了。

#大模型 #调用速度 #DeepSeek #智谱 #Groq

7个月前

gpt-oss-120B API 提供商的基准测试与分析看在 Groq、Nebius 免费的份上就不说了，Azure、Amazon 你们这些个浓眉大眼的怎么还垫底了，骗子！

#Groq #NEBIUS #Azure #Amazon #API

7个月前

Groq 路走窄了🤏 学些不好的开始学隔壁封号，我的所有 Groq 帐号都被扬了，总共也没用几次，这都容纳不下，拜拜！

推特封号潮席卷加密圈，KOL频遭封禁引发恐慌· 224 条信息

#Groq #封号 #帐号 #消极 #拜拜

7个月前

用惯了groq上的kimi2，觉得其他模型都慢的不行。秒出一大篇的感觉很爽。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Groq #Kimi2 #模型速度 #用户体验 #积极

7个月前

马斯克的 Groq 也来蹭盘子了 😂 Groq 团队正式开源 Groq Code CLI，可以还是 Grok 写代码的效果呢

#马斯克 #Groq #Grok #开源 #代码

7个月前

Groq 出品： OpenBench 为大语言模型提供标准化、可复现的基准测试，跨越20多个涵盖知识、推理、编程和数学的开源评估框架。

#Groq #OpenBench #大语言模型 #基准测试 #开源评估框架

9个月前

不知道国内有没有类似Groq类似的产品，需要LLM的首Token降至100ms以内voice agent 的体验才能普遍提升上去。

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Groq #LLM #首Token #Voice Agent #体验提升

1年前

Groq 的 QwQ-32B 以 453.20 T/s 的惊人速度运行时，看到「思考1秒」的标签还以为是系统偷懒，点开却发现它生成了大量中间推理内容，但结果却差强人意……突发奇想尝试用 DeepClaude 混合模型，试着将 Groq 的推理过程传给 GPT-4o 分析，结果速度太快，连 DeepClaude 都没捕捉到推理内容就结束了。😂

#人工智能 #模型推理 #混合模型 #GPT-4o #DeepClaude #Groq #QwQ-32B #系统性能 #推理分析 #技术挑战

1年前

这绝对是一周以来最重要的新闻，但却没有人报道也很少人发现。 Groq和sambanova开放了对普通开发者的付费权限！他们不是简单的 API 提供商，他们是飞速的 API 提供商。和几十token每秒的生成速度相比，几百几千token每秒不只是速度上量级的改变，对应用场景来说也是会带来质变的。此前，普通开发者只能免费试用这些革命性的API，忍受着限额，并不能实际投入产品中。但现在开通付费之后可以无限爽用了。之前是想花钱都没地方花，除非用企业申请。但现在每个人都可以付钱用他们的服务了，这对产品的变革是巨大的。尤其是在现在开源模型越来越强大的背景下，速度将会是一个至关重要的因素。 groq， sambanova，cerebras这三家公司就是把速度做到极致的，其中cerebras还没有开放付费，只有groq和sambanova开放了。赶紧趁着这周时间用这些飞速的token做点事情吧。现在网上的新闻有很多，但分为看似重要的新闻和实际重要的新闻。这几家公司开放付费使用token或许没那么起眼，但实实在在是最获真价实、最有用的消息。

#Groq #sambanova #开放权限 #API #开发者 #速度提升 #应用场景

1年前

Nvidia, GPU (Graphics Processing Unit) Google, TPU (Tensor Processing Unit) Groq, LPU (Language Processing Unit) Groq：Nvidia 的最新 AI 竞争对手 Groq 创新的核心是其 LPU，旨在以前所未有的速度加速 AI 模型，包括 ChatGPT 等语言模型与使用高带宽内存 (high-bandwidth memory, HBM) 的 GPU 不同，Groq 的 LPU 利用 SRAM 进行数据处理，从而显著降低能耗并提高效率 GroqChip 的独特架构与其时间指令集相结合，可实现非常适合自然语言和其他顺序数据的顺序处理 Groq Language Processing Unit (LPU) 与最初为图形处理而设计的 GPU 完全不同，LPU 是为 AI 推理和语言而设计的 Groq 是 LPU 的创造者，它从头开始构建，以满足 AI 的独特特性和需求 LPU 以更快的速度运行大型语言模型 (LLM)，在架构层面上，与 GPU 相比，其能源效率提高了 10 倍 Groq 使用 Haskell 的其中一个目的是为新芯片 LPU 提供嵌入式领域特定汇编语言（assembly EDSL，汇编 EDSL）这也是 Haskell 又一成功案例 Groq 创始人兼 CEO：Jonathan Ross 在创立 Groq 之前，Jonathan 启动了 Google 的张量处理单元 (TPU) 项目，这是一个 20% 的项目，他设计并实现了第一代 TPU 芯片的核心元素 Jonathan 接下来加入了 Google X 的快速评估团队，这是著名的“Moonshots factory”的初始阶段，他为 Google 的母公司 Alphabet 设计并孵化了新的 Bets (Units) Jonathan 师从纽约大学柯朗研究所的 Yann LeCun

#NVIDIA #AI #Groq #GPU #TPU #LPU #ChatGPT