#模型能力

Tw93
2周前
深度对比了一天 ChatGPT 的 Codex 和 Claude Code,早上刚开始继续包月 ChatGPT Plus 的的时候,安装完 VSCode 的 Codex 体验下来,第一感觉是,Codex 的产品交互、模块展示丰富上完全强于 Claude Code,每个步骤展示也清晰的,代码改动对比也舒服的,而且甚至用了很久都没有之前的 Claude Code 的防沉迷设计,一时都不适应,甚至认为 OpenAI 真良心。 但是发现碰到难解的疑难杂症,Claude Code 的逻辑清晰度思路完胜 Codex,虽然 Claude Code 非常毛坯的效果,但是完全不影响能力的展示以及问题的解决,Anthropic 虽然政治上不咋地,对用户也有点不客气,但真有两把刷子,不影响继续付费,打算等合适价格买点儿 Amazon 的股票。 这也和当前很多大模型产品一样,其实单纯的把产品工具做好的阶段感觉也快过去了,「模型即产品」的概念再一次被突出重点,产品交互在好,在用户对于他的需求面前,最重要的还是模型本身的能力,交互变成了锦上添花,模型能解决问题变成了取胜关键。 回到大模型公司而言,的确变成了谁掌握模型训练,谁就掌握未来,当前的 AI 竞争也不是像上一代那种应用创新的竞争了,卷不出啥来了,而是技术创新的竞争,如果下游依赖的模型能力不完善,直接去卷应用本身意义不大,单纯没有模型能力的公司去套壳弄 AICoding 编辑器的意义也不大。
宝玉
8个月前
一句简单的提示词就可以让 LLM 在翻译的时候更好的“意译” 以前为了让 LLM 达到更好的翻译效果,我尝试了很多方式,比如最初的先直译再意译,后来的直译、反思和意译。虽然效果好了,但是却复杂了。 现在随着模型能力增强,不再追求复杂的提示词技巧,而是尝试返璞归真,找到更好更简单的提示词方法。 我发现对于翻译的任务,有时候翻译的效果过于生硬,恰恰在于给模型的任务是“翻译”,因为是翻译,所以模型会尝试按照字面意思去翻译,尽量还原原始的格式,但也造成一些翻译过于直白和生硬。 这就像我们在学英语的时候,老师让我们去把英文翻译成中文,通常就会按照英文的单词和句式去翻译,但是如果老师让我们用中文“重写”而不是翻译,那么就可以自由的多,只需要去理解原来英文的意思,用中文的方式去重新表达,反而效果好很多。 所以我最近尝试了在做翻译任务的时候,让大语言模型去用“目标语言重写”而不是“翻译”,效果果然大不一样,结果不再拘泥于原有语言的格式语法,而是用更自然的方式表达出来。 比如说昨天 OpenAI 星际之门的公告,最后一句话: “We want to connect with firms across the built data center infrastructure landscape, from power and land to construction to equipment, and everything in between.” 如果“翻译”,就是按照字面意思: “我们希望与整个数据中心基础设施领域的企业建立联系,从电力和土地到建设再到设备,以及这其中的所有环节。” 如果“用中文重写”,就自然的多: “我们希望与整个数据中心基础设施领域的企业建立联系,包括电力和土地、建筑施工、设备等各个方面的合作伙伴。” 至于提示词,则很简单: “请尊重原意,保持原有格式不变,用简体中文重写下面的内容:” or "Please respect the original meaning, maintain the original format, and rewrite the following content in Simplified Chinese:" 翻译其他语言也类似,只要把提示词中目标语言部分换掉即可。 欢迎分享你用这个提示词成功或者失败的案例。