九原客2025-03-13 17:31:56目前我日常使用的模型(非广告~) (日常用): - (Grok3 真的很好) - (Qwen2.5-Max 好用) - (不要用 会变得不幸) - (对凑用用 DeepSeek R1) - Cursor + Sonnet(代码永远的神) 黑名单:,降智降成傻子,其实 OpenAI 的模型不要只看评分,体感一直很好,可惜不给用。 (API 用): - (测试各种奇怪的模型,没必要自己#模型#Grok3#Qwen2.5-Max
virushuo2025-02-25 08:46:17sonnet 3.7确实不错,分数不假,写码能力应该是目前最好的。给一个token限制让它写码,它会选一些函数不实现,在里面写上 // Implement xxxxx 而它选出来的这些也是我认为也会比较长比较复杂的函数,还是比较有意思的。但我还是更期待QwQ-max-preview,开放模型还是更好玩。#sonnet#写码#模型开放
orange.ai2025-01-25 08:17:55R1+Sonnet:我们加起来才是最强的! 在 Aider 的最新多语言基准测试中测试中,R1+Sonnet 超越 o1 拿下第一。 R1 作为架构师, Claude Sonnet 作为编辑器,在 aider 多语言基准测试中设定了新的 SOTA(最先进技术水平)64.0%。 不仅超过了之前 o1 的 SOTA 总体成本还降低了 14 倍。 这件事很神奇,因为使用 o1+ Sonnet 无法#R1#sonnet#Aider
Matt Shumer2025-01-14 21:01:23One of the most powerful prompts to get Claude 3.5 Sonnet unstuck from a loop: "This isn't working. First, think for ten paragraphs about what's going on here + the best way to do this, and then impl#sonnet
AI进化论-花生2024-12-30 05:56:46一个建议,不一定对: 虽然deepseek是国产良心,我也很建议在做AI应用调用API时使用。 但是最好别接入Cursor作为默认模型使用,现在让AI编程跨过可用性临界点的依然有且只有Claude 3.5 sonnet,o1实际体感也不够好。为了节约成本或者支持国产做这个选择还是得不偿失。 测试这事让自媒体去干(比如我,我其实一般都懒得干了),大家实际在做AI编程的话就先关注自己要解决的问题#DeepSeek#国产良心#AI应用