九原客2025-03-13 17:31:56目前我日常使用的模型(非广告~) (日常用): - (Grok3 真的很好) - (Qwen2.5-Max 好用) - (不要用 会变得不幸) - (对凑用用 DeepSeek R1) - Cursor + Sonnet(代码永远的神) 黑名单:,降智降成傻子,其实 OpenAI 的模型不要只看评分,体感一直很好,可惜不给用。 (API 用): - (测试各种奇怪的模型,没必要自己
orange.ai2025-01-25 08:17:55R1+Sonnet:我们加起来才是最强的! 在 Aider 的最新多语言基准测试中测试中,R1+Sonnet 超越 o1 拿下第一。 R1 作为架构师, Claude Sonnet 作为编辑器,在 aider 多语言基准测试中设定了新的 SOTA(最先进技术水平)64.0%。 不仅超过了之前 o1 的 SOTA 总体成本还降低了 14 倍。 这件事很神奇,因为使用 o1+ Sonnet 无法
Matt Shumer2025-01-14 21:01:23One of the most powerful prompts to get Claude 3.5 Sonnet unstuck from a loop: "This isn't working. First, think for ten paragraphs about what's going on here + the best way to do this, and then impl
AI进化论-花生2024-12-30 05:56:46一个建议,不一定对: 虽然deepseek是国产良心,我也很建议在做AI应用调用API时使用。 但是最好别接入Cursor作为默认模型使用,现在让AI编程跨过可用性临界点的依然有且只有Claude 3.5 sonnet,o1实际体感也不够好。为了节约成本或者支持国产做这个选择还是得不偿失。 测试这事让自媒体去干(比如我,我其实一般都懒得干了),大家实际在做AI编程的话就先关注自己要解决的问题