阑夕
1周前
爆肝两天时间,玩了下二次元生图赛道最出圈的PixAI,几乎是一个周末就把攒下来的积分全用完了,看着满满当当的成果,有种溢出屏幕的爽感。 这事的契机,源于我对AI大厂的二次元生图能力始终评价不高,包括Banana在内的很多模型,画面的精美程度倒是没毛病,但角色灵魂总有挥之不去的空洞感。 碰巧PixAI发布了Tsubaki.2的新模型,我只能说专业的事还得专业的人来干,哪怕跟Midjourney/niji这些同类产品比,PixAI的自由度可能也远超出了我的预期。 其中最明显的感受是,我甚至在Tsubaki.2的身上,体验到了一种类似于肉鸽游戏构筑BD的玩法。 什么意思呢?就是它给的模块化的可选项实在太多了,除了最常规的提示词输入和补全之外,Token预算、风格预设、LoRA参考、图片尺寸、生成数量……这些统统都是可以定制的,整个过程像搭积木一样垒出来最终的成品。 当然,由于这些默认设置基本都是取一个通用性最高的选项,所以新手也不存在什么使用门槛,稍微多用一用,掌握一些技巧还是不难的。 更何况还有提示词助手这种轮椅级别的功能,都是为了能让人最快上手。 比如我沿着社区里吹爆的光影表现,做出了这么两组风格完全不同的图,看完瞬间理解那些画师的失业焦虑了……(图1)(图2) 包括用二游相关LoRA做出来的成品,虽然背景还略显拉跨,但人物完全够格拿来当一些小厂的角色设计底板了。(图3) 更不用提最热门的二创方向,Tsubaki.2同时解决了多人物混乱和手部建模扭曲的问题,这也是过去二次元生图赛道大家公认的阿克琉斯之踵。(图5)(图6) 这也难怪PixAI近一半的用户都来自日本,作为ACG文化的老家,可能没几个肥宅,我是说二次元爱好者能顶得住开箱即用的体验。 我贴出来的这些,基本都是从一次多张生成里选出来的,没有太高的抽卡成本,如果不是非常高频,每日赠送的额度完全够用。 这多少能解释,为什么从今年开始关于「垂类模型到底有没有必要存在」的讨论声音变得越来越少了,按理来说,模型越做越强,AI生图这门生意一定会被大厂垄断。 但现实是,仍然有大量像PixAI这样的垂类平台能跑出来,说明通用模型其实很难满足真实存在的长尾需求。
sitin
1周前
Claude Code 我用了半年,才发现一个很离谱的点:上下文什么时候烧满,我是完全没感觉的。 最开始我还以为是模型抽风——写着写着突然变笨,前面说好的逻辑不认了,甚至开始自相矛盾。后来才反应过来:不是它变傻了,是上下文早就爆了。 最近发现一个叫 Claude HUD 的插件,干的事特别简单——在终端底部加一行状态栏,实时显示上下文占用百分比、当前用的什么模型、工具在调什么、子 Agent 跑到哪了。就一行信息,但装上之后真的回不去了。 安装就三步,在 Claude Code 里敲: <TEXT>/plugin marketplace add jarrodwatts/claude-hud/plugin install claude-hud/claude-hud:setup 重启就能用。 我觉得这个插件最值钱的就是那个上下文进度条。它读的是 Claude Code 原生的 token 数据,不是估算的,颜色会从绿变黄变红。 绿色就放心用,黄色该注意了,红色就得考虑压缩或者开新会话。到了 85% 以上还会自动展开明细,告诉你输入输出各用了多少 token,钱到底花在哪了。 说实话,这个东西解决的不是什么高深的技术问题,它解决的是信息差。AI 工具现在能力都很强,真正卡效率的反而是你跟工具之间的信息不对称——它知道自己在干什么,你不知道。 上下文悄悄满了你没察觉,子 Agent 跑偏了你没看见,token 烧了多少心里没数。这些事单个都不大,但积少成多,整个开发体验就变得不可控了。 Claude HUD 就是把这层窗户纸捅破了,该看到的信息都摆在眼前,你随时能判断是继续推进、压缩上下文、还是干脆开个新会话。 好的工具不只是帮你干活,还得让你清楚它在干什么,这才是用起来真正踏实的状态。
你有没有发现:我们每天都在和 LLM 对话,但其实完全不理解它在“想”什么? 大多数人以为 AI 是一条路走到黑的“概率复读机”,但真正卡住模型推理能力的,是它缺乏像人类一样“悔棋”和“推演”的过程。 这个交互式站点,本质上是 LLM 思考过程的“CT 扫描仪”。 在 AI 研究圈子里,它被当成是 2026 年最直观的 MCTS(蒙特卡洛树搜索)原理解释器。 你学不会 AI 原理也许是因为而是那些数学公式和论文黑盒太过于枯燥。 你现在遇到的核心问题,其实是缺乏一种“视觉直觉”去理解 AI 是如何在数百万种可能中,精准选中那条逻辑最严密的推理路径。 Metafunctor 这篇刚发布的文章牛在它把 MCTS 彻底透明化了: 1️⃣ 实时参数调节:拖动滑块就能看“探索”与“利用”的博弈过程。 2️⃣ 推理动画播放:像看棋谱一样看 AI 如何在节点间反复横跳、回溯。 3️⃣ 点击式拆解:点击任何一个树节点,直接看该步的 Q 值和访问频率。 这不是在读文章,这是在实时调试一个“思维模型”。 玩过这个可视化项目后,你会明显感觉到: 原本抽象的“大模型推理”变成了具体的“路径搜索”; 那种对黑盒的恐惧,被一种“原来如此”的掌控感所取代。 (你对 AI Prompt 的优化思路,甚至都会因此发生质变。) 如果你正在试图攻克 AI 架构和推理逻辑, 这个资源,基本可以当成你入坑 MCTS 的终点站。 🔗 深度解析与互动实验: