Yinsen
1个月前
【招聘】 Cherry Studio,欢迎同行者 作为核心开发者 ,负责 Cherry Studio 客户端、Web 服务与后端架构的设计与开发。我们希望你不仅是卓越的需求实现者,更能从技术和产品的角度出发,与我们一起定义产品的走向和未来 。 我们希望你 技术功底扎实: 前端:对 React、TypeScript、Node.js 有深入的理解和实践。能熟练运用 TailwindCSS、shadcn/ui 等现代工具库,快速构建精美、高效的界面。 后端:熟练掌握 Go 与 Node.js 生态,具备高并发架构设计能力。能驾驭复杂的业务逻辑与数据流,构建高性能、高可用的服务端引擎。 全栈:深谙 React、Node.js 与 Electron 技术栈。能打破 Web 边界,完美融合原生能力,独立打造体验极致的跨平台桌面客户端。 移动端:熟练掌握 React Native 架构,兼具 iOS 或 Android 原生开发能力。 测试:极度的耐心和细腻的用户视角,定义 AI Agent 的测试标准,用技术手段保障 AI 产品的极致体验。 能独当一面: 有过主导完整项目 的研发经验,能够独立负责核心模块,从技术选型、架构设计到最终落地,拥有专业判断和工程品味。 对 AI 的信念与热情:是 AI 代码工具(如 Cursor, Claude Code, Codex,Droid 等)的深度用户 ,它们是你日常开发中不可或缺的伙伴。 拥有 LLM 应用的实际研发经验 ,熟悉 RAG、LangChain/LangGraph 等框架; 了解 agent 开发的核心要素与目标,并有动手实操的经验。 我们能提供什么? 🚀 自由和尊重不打卡,没有“企业文化”的条条框框。我们是一个纯粹的工程师团队,推崇高效、直接的沟通方式。 💰 早期回报你将作为最早期的核心成员 加入,获得极具吸引力的期权激励 。 🏝️ 纯粹的环境工作地点在上海嘉定南翔 。这里闹中取静,静谧悠远。没 如果你渴望在一个高自由度、高影响力的环境中,将自己对 AI 的热情和技术实力发挥到极致,我们迫不及不及待地希望你加入。 (打开链接投递简历)
Yinsen
1个月前
Yinsen
6个月前
解密 Groq 的速度惊人的 K2 instruct 模型: 最近 Groq 部署的K2 推理速度真的震惊了我和我的小伙伴。 其超过 300 tokens/s 的表现,远超主流 MaaS 平台普遍低于 50 tokens/s 的水平,带来了近乎实时的交互体验。 这背后的核心是其自研的 LPU (Language Processing Unit) 芯片,一种专为语言模型推理设计的硬件。在2024年2月,Groq 就已火一把了,与通用目的的 GPU 不同,LPU 架构旨在消除外部内存瓶颈,最大化每个时钟周期的计算效率,从而实现极致的低延迟和高吞吐量。 然而,在惊人的性能演示之后,贾扬清对成本的分析揭示了另一面现实,这也是评估其商业可行性的关键。要实现 Groq 所宣称的旗舰性能,成本差异是巨大的: Groq 方案: 硬件成本高达 1144万美元,年电费约 25.4万美元。这意味着实现其顶级推理速度的初期总成本接近 1171万美元。 英伟达方案: 作为对比,实现同等性能,一个 8 卡 H100 盒子的硬件成本约为 30万美元,年电费仅 2.4万美元。 此外,即使是密度更高的英伟达 H200,也能在更小的空间(如1/4服务器机架)内高效运行这些模型,这进一步凸显了 Groq 在当前阶段面临的成本效益挑战。 但无论如何,Groq 团队的工作显然揭示了一些新的可能性与其价值。 对于 AI 的进化,我们应持有更乐观、也更审慎的心态,期待技术在竞争与迭代中找到成本与性能的最佳平衡点。