九原客
0 关注者
nicekate
6天前
提问:Grok 4 Fast 和 DeepSeek-V3.1-Terminus,搜索他们在不同基准上的对比,生成表格,还有价格的对比 结果:两个模型在这个问题都回答不好 图1-图2是我将链接和图片信息直接发给 Grok 4 Fast,几次修改后的结果 图3 是Grok 4 Fast生成的错误信息 图4 是DeepSeek-V3.1-Terminus生成的
1周前
目前个人测试中文效果最好的 端到端文档识别小模型 是腾讯的 POINTS-Reader(比小红书的dots.ocr 还要好一些)。 做了如下小小的工作: 1. 合并了官方的PR到sglang 0.5.3 版本,可以高效推理。 2. 基于TRL的模型训练代码,可以进行训练。训练只需要图片和对应的markdown文本。
orange.ai
2周前
最近两个P图模型,即梦4.0和小香蕉都太火了,实际用起来感觉差异非常大。 前几天我写 Nano Banana 的文章时候,当时的判断是 Nano Banana 是今年商业价值最高的模型了。 但是没想到很快,字节就推出即梦4.0 ,完全弥补了 Nano Banana 的中文场景不足的问题,但在非中文的P图场景中的表现有时会出现很奇怪的问题,比如面部模糊。 为了方便大家对这两个模型的能力有个清晰的认知
铁锤人
3周前
想知道GPT-5,还是Sonnet 4牛逼 最好的方法还是亲自自己去测试 因为就是同个模型 用不同的编程工具 用不同的编程语言 用不同的代码库 效果都不一样 而且模型基准测试几乎不能相信了,都是为了优化跑分的 还是试试方能知道深浅
-Zho-
1个月前
nano-banana 大展宏图!开个我的图像编辑测试大合集贴! 目的: ✅探索模型能力边界 ✅模型各有所长,方便大家根据细分场景找到最合适自己的模型 ✅方便整活/灵感 参与对比模型(当前版本四强/各有所长): 1️⃣nano-banana(Gemini2.5FlashImg 2️⃣GPT-Img 3️⃣Flux-Kontext-Pro 4️⃣Qwen-Img-Edit 1/n