Groq 的 QwQ-32B 以 453.20 T/s 的惊人速度运行时,看到「思考1秒」的标签还以为是系统偷懒,点开却发现它生成了大量中间推理内容,但结果却差强人意……突发奇想尝试用 DeepClaude 混合模型,试着将 Groq 的推理过程传给 GPT-4o 分析,结果速度太快,连 DeepClaude 都没捕捉到推理内容就结束了。😂
Groq 的 QwQ-32B 以 453.20 T/s 的惊人速度运行时,看到「思考1秒」的标签还以为是系统偷懒,点开却发现它生成了大量中间推理内容,但结果却差强人意……突发奇想尝试用 DeepClaude 混合模型,试着将 Groq 的推理过程传给 GPT-4o 分析,结果速度太快,连 DeepClaude 都没捕捉到推理内容就结束了。😂
Gorden Sun
1周前
Stream-Omni:多模态聊天框架 实现的效果类似GPT-4o,支持文本、图片、语音输入,同时输出文本和语音,不是原生多模态模型,而是把视觉和语音跟文本对齐,成本更低,适合自研多模态交互时使用。 Github:
中国民主转型研究所(ICDT)
1周前
欢迎收听《中国民主季刊》2025年第二季播客节目 专论 莎拉·克雷普斯 道格·克里纳:人工智能如何威胁民主(徐行健翻译 朗读 麥莉)