Mr Panda
0 关注者
阑夕
4天前
爆肝两天时间,玩了下二次元生图赛道最出圈的PixAI,几乎是一个周末就把攒下来的积分全用完了,看着满满当当的成果,有种溢出屏幕的爽感。 这事的契机,源于我对AI大厂的二次元生图能力始终评价不高,包括Banana在内的很多模型,画面的精美程度倒是没毛病,但角色灵魂总有挥之不去的空洞感。 碰巧PixAI发布了Tsubaki.2的新模型,我只能说专业的事还得专业的人来干,哪怕跟Midjourney/
1周前
全球主流的三大模型, GPT-5.4 Pro 的价格可真是贵, 差不多是另外两家的5倍以上。
卫斯理
2周前
通过openclaw编写skill + vibe coding搞定了飞书的语音输入 耗费了16W token,使用了ffmepg + whisper本地模型.....
indigo
Claude 最近上新频繁!今天 Max、Team & Enterprise 的 Claude Code 默认支持了 1M 的上下文。如图 Opus 4.6 和 Sonnet 4.6 在整个 1M 窗口内的准确率明显高于 GPT 5.4 和 Gemini 3.1 Pro。一个模型上下文的准确性和检索力,决定了其完成复杂任务的质量,Context 就是模型在应用层面的“持续学习”✨
sitin
Hume AI 这次开源的 TADA,换了一个更务实的方向:先把不出错、够快、够轻这三件事做到极致。 传统 LLM 做 TTS,一个很大的麻烦就是:文字信息很少,但音频帧特别多,最后就容易上下文爆炸、推理变慢,甚至模型越说越跑偏。 TADA 的解法很直接,就是尽量让文字和语音“一对一锁住”往前走。你可以简单理解成,它不是先想好一大段声音再慢慢往外吐,而是每读一个 token,就同步生成对应那一