𝗖𝘆𝗱𝗶𝗮𝗿

统计数据

142

文章

0

粉丝

0

获赞

1757

阅读

𝗖𝘆𝗱𝗶𝗮𝗿

2个月前

说到巧思，其实，很多巧思是给懂的人看的，不懂的人设计出花，他也不懂！

#巧思 #设计 #用户理解

𝗖𝘆𝗱𝗶𝗮𝗿

2个月前

今天咱们从 LangChain Agent Builder 内测始！

#LangChain #Agent Builder #内测 #技术 #积极

𝗖𝘆𝗱𝗶𝗮𝗿

2个月前

非常高的赞誉了，虽然我觉得我媳妇过于客气了，哈哈哈！

#赞誉 #媳妇 #客气 #哈哈哈 #积极

𝗖𝘆𝗱𝗶𝗮𝗿

2个月前

就是12年前的今天嘛？我注册了推特！

#推特 #注册 #12周年 #社交媒体 #纪念

𝗖𝘆𝗱𝗶𝗮𝗿

2个月前

桃李无言，下自成蹊！

#桃李 #教育 #积极

𝗖𝘆𝗱𝗶𝗮𝗿

2个月前

近期AI浏览器方向、新模型方向依旧火热，不过随着 DeepSeek-OCR开源的革命性文字识别模型到来，也迎来了模型OCR这个赛道的新纪元，无论是光学压缩技术还是模拟人类记忆机制，相信在这个赛道不会缺乏新的追逐，而且，这是传统ETL的基础。于是，这两天我观察了一下各大模型平台的OCR模型竞争，Huggingface 和 ModelScope，我发现了一个老朋友，PaddleOCR-VL（而且，连续5天HuggingFace Trending 第一）。我把 DeepSeek-OCR 和 PaddleOCR-VL 进行了一些使用性场景对比。首先，对比一下两个模型： PaddleOCR-VL - 轻量级、开箱即用的完整方案 - 广泛的多语言覆盖（109种语言） - 成熟的工业级生态和工具链 - 多种调用方式（命令行、Python API、vLLM 加速） - 最低的硬件部署门槛（0.9B） DeepSeek-OCR - 视觉文本压缩技术 - 处理超长文档的效率 - 二次开发和学术研究基座 - 高效的训练数据生成能力从目前来看，PaddleOCR-VL 0.9B 模型大小在低GPU应用场景里当属佼佼者，并且Benchmark依然强悍！之前在很多开源社区以及项目中就关注到PaddleOCR-VL。从几个我亲自实践的场景Case来看，这两个模型输出的结构标注都非常完善，没有出现错标。但是，部分比较复杂的页面出现了漏标。而且，从对比来看，PaddleOCR-VL 对页面内容的清洗和过滤做过微调，比如很细微的页眉页脚、一些无关紧要的内容会被过滤掉，而 DeepSeek-OCR 则会保留这些内容。我的几个实验场景： - 古文印刷在第一次识别中DeepSeek-OCR 会产生莫名的重复字符，第二次会回归正常，而在重新进行的三次测试中 PaddleOCR-VL 的确输出稳定。 - 表格解析双方都非常稳定且内容质量对比相差不大。 - 复杂公式和手写字体 DeepSeek-OCR 偶尔会出现缺失，PaddleOCR-VL非常稳定，相关图像存储、标记、非常准确。总结下适用场景 PaddleOCR-VL： - 对部署成本敏感的场景 - 需要多语言支持的全球化应用 - 要求端到端完整解决方案的企业项目 - 需要快速落地的工业级应用 DeepSeek-OCR： - 长文档处理的算力优化需求 - 需要极致压缩效率的场景 - 进行二次开发和学术研究 - 需要高效数据生成的训练场景基于我的使用场景，总体还说 PaddleOCR 不愧被大家成为：最强OCR之神！

#OCR #PaddleOCR-VL #DeepSeek-OCR #模型对比 #文字识别

𝗖𝘆𝗱𝗶𝗮𝗿

2个月前

如果每个人都懂你要做什么，那大家都能吃这碗饭，无非是白米饭、蛋炒饭、卤肉饭之间的区别。

#白米饭 #蛋炒饭 #卤肉饭 #区别 #简单

𝗖𝘆𝗱𝗶𝗮𝗿

2个月前

做生态是做什么，不是做自己的闭环，是把蛋糕做大，大家都能上来吃一口！

#生态 #开放合作 #共赢 #蛋糕做大

𝗖𝘆𝗱𝗶𝗮𝗿

2个月前

今天在搞 PPT，回看了一下，我们的确进入这个赛道太早了，赛道已上，看看什么时候上牌桌！

#PPT #赛道 #牌桌

𝗖𝘆𝗱𝗶𝗮𝗿

2个月前

各位老铁，这是我拍的还是生成的？哈哈哈！

#老铁 #视频 #娱乐 #幽默 #自媒体

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

呀，是被大佬关注了嘛，那我要加加油了！

#大佬 #关注 #加油 #积极

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

不知道你们有没有过那种对一件事儿执着到生理反胃的感觉！

#执着 #生理反胃 #负面情绪

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

刚才突然想起和杺宝说的话，于是今晚尝试使用Juchats 测试功能生成了一个小视频。大人眼中的凌乱世界，孩子眼中的童话王国。转场提示词如下: A cinematic camera movement transitioning from a bird's eye overhead view of scattered toys on a colorful playroom floor, gradually descending and rotating to ground level perspective. The camera smoothly moves from high above looking down at the messy toy collection, then slowly lowers while maintaining focus on the toys. As the camera reaches toy-level height, the ordinary toys magically transform into a grand fairy tale kingdom - teddy bears become towering guardians, building blocks turn into castle towers, toy cars become magnificent carriages, and the entire scene shifts into a whimsical magical wonderland with sparkling lights, rainbow colors, and enchanted atmosphere. The transition should feel like shrinking down into the toys' secret world, revealing their hidden magical fairy tale reality.

#杺宝 #Juchats #童话王国 #玩具 #转场

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

今天周哥说，识别出特长基因后的战略就会自然独特，我深以为然！

#周哥 #特长基因 #战略 #独特 #积极

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

最新更新的功能中，大家反馈 Word 格式导出，公式直接可编辑还是非常实用的！ F1 分数（F1 Score）是机器学习中用于评估分类模型性能的重要指标，它是精确率（Precision）和召回率（Recall）的调和平均数。F1 分数综合考虑了模型的查准率和查全率，特别适用于处理类别不平衡的数据集。

#Word格式导出 #公式可编辑 #F1分数 #机器学习 #模型评估

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

从目前的格局来看，我还是比较看好 Gemini 的，主要可能还是在生态这块，注意来说下我的感受：最近一直在和 Claude 4.5 Sonnet 聊天，聊出来很多很有价值的思路和脉络也受到了很多精神层面的洗礼，可以说之前的版本是做不到的，哪怕它现在还是以总结为主（可控制），但是，很多主客观点、思考方式、辩证想法、都像和一个更像启发者的角色在对话。Anthropic 前瞻性尤其针对企业的商业价值还是有比较深度的思考。 OpenAI Sora2 以及昨天的 Dev Day，一如既往的往 C 端去覆盖以及更多的算力合作，不过从很多用户的截图，Sora 2 生成的视频有抖音的残影，有即梦的残影来看，如果是这样训练的话，那在视频这个赛道未来的几个月肯定也会群魔乱舞，拼的还是抢占入口。Agent 这个赛道就不重复了，成为基础建设这个是必然的。所以一直也有说，在 AI 这个赛道，千万不能下车，下车以后再想上来，太难了。 Google 这侧还是期待 Gemini 3，大家可以尝试，把一些需要联网推理的问题，直接丢给 Gemini 2.5 Pro，它可以通过世界数据硬推出来，当然在 API 这个层级路由有没有其他处理就不得而知了，但是，从众多测试来看，直接世界数据可能性比较大。从整体商业闭环来说，还是更看好 Google，毕竟多模态的语料全部自己闭环了，自有算力，而且，全部玩的是内网，还有强大的入口（搜索引擎、硬件设备）如果不受反垄断制约，这是可预见性的可怕！

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini #Claude #OpenAI #ai赛道 #商业价值

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

一年一度的杺宝送中秋祝福，杺宝祝各位哥哥姐姐，叔叔阿姨，弟弟妹妹，中秋快乐，阖家欢乐，团团圆圆！下面隆重介绍一下，我大哥，22个月，附赠大哥语录∶ 01. 每天洗完澡，妈妈给按摩的时候开始喊∶HC（我名字）给大哥冲奶！ 02. 早上吃完饭，在餐椅上和我说∶爸爸，抱你大闺女下去吧！ 03. 中午睡醒对着监控说∶爸爸，爸爸，我的好爸爸呢！

#杺宝中秋祝福 #22个月大哥语录 #家庭欢乐 #亲子互动 #温馨

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

今天 Juchats 除了更新了 Sonnet4.5 / GLM4.6，还支持了给 10s 以内的视频去水印，包含 Sora2 ，打开 Sonnet 对话窗口，视频丢上去，让它去水印即可，大家可以尝试！

AI视频井喷：Midjourney领跑，多模态混战· 337 条信息

#Juchats #Sonnet4.5/GLM4.6 #视频去水印 #Sora2 #积极

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

今天是第四季度的第一天，在这个季度里，我们会发布全新的产品 CelHive，它会传承 Juchats 的优点，也会朝着的新的目标去努力，大家要的都会有！ Say Hi to productivity and creativity! 思考：我们之前想了很多名称，也想了很多域名，也和大家征集了很多，很多人体验 Agent 这个方向这么火，而且新产品也朝着这个方向去做，应该往这个方向去靠。我们的思考是：Agent 的确是方向，但是对于未来 AI 这个赛道来说，它可能只是浓墨重彩的一笔，不足以完全影响这个赛道的方向，通用 Agent 是必经之路，未来它会朝着真正的用户现实场景任务或落地个人用户PMF做基础建设！而创建这个闭环的基础就是：从生产力转向创造力！没有生产力，没有边界认知，创造力会受到巨大影响！含义： CelHive = Cell + Hive 从细胞转向丰巢！ Cell: 生命基本单元，具有独立功能，协同构成复杂有机体 Hive: 蜜蜂社会性昆虫典范（Intelligence），蜂巢象征高效协作（Collaboration）、分工明确（Productivity）、共同创造价值（Ecosystem）。方向：在新的产品设计中，并没有摒弃传统的对话窗口，在和很多用户讨论及观察中，我们发现对于生产力来说，传统对话窗口虽然不像画布那么有延展性，但是，整体的输出更趋向于信息阅读，配合三栏结构，可以产出更多的一目了然的结构信息，当然在交互体验方面产品面向于多元，更倾向于什么场景做什么事儿，这样才是相对符合和友好的状态。从生产力到创造力的转变，是尝试 → 积累 → 沉淀 → 使用的完整闭环，我们会着重的努力！初心：不忘初心，方得始终！依稀记得，2023 年，我们第一次给王川总介绍产品的时候，他问我：“这个产品的方向是如何的”我说：“AI + Human 让多模态产出可用” 这一句话中的每个字，每个词，从 AI 真的发展阶段到现在，想做好都是非常艰难的，可以这么说！我们会持续努力的，我们也会更尊重用户的想法！核心：在 CelHive 中，曾经大家需要的，在我们的 Issues List 里面都有记录。产品侧：我们会用更适合的模型来完成 Hive 体系，多模态模型也会根据生产力，通过我们自研网关接入（文 / 图 / 视频）模型，及完善的知识库体系，让产出更丰富。同时，也会控制产出结果，是时候为产出的最后 100 米做努力了！运营侧：运营这个方向一直在尝试，之前也没有做的很好，新的产品中，我们会融入更多的用户社区、用户帮助、以及开放我们的 Roadmap，可以让大家来共创起来！价值：我们认为这个赛道，商业化是让用户安心的基础，同时行业价值才是根本，CelHive 会不断的产出领域或者核心功能的「最佳实践」，把这些最佳实践变成对行业真正有落地性、推动力的产出！也会做一些开源方向。这个赛道本来就没有护城河和所谓的壁垒，它的发展之快，让世界每天都发生变化！

懒猫家族新成员亮相，AI算力舱引发热议！· 143 条信息

#CelHive #AI Agent #生产力到创造力 #用户共创 #多模态可用

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

说两个词，附赠一个真实的笑话。东北方言里，有两个我们从小就听过的词儿：老毕登：嘲讽思想守旧、好为人师的"爹味"群体欠儿登：东北人用来形容那些过分热心、爱管闲事但又让人觉得讨厌的人的一个生动形象的方言词汇这个词儿让我想起了我魏哥，几年前魏哥（我的老乡）在上海过年，快到正月十五了，他说：“大成子，我带你去看灯啊。” 我说：“咱去哪看啊，城隍庙吗？” 他说：“走，我带你去看老毕登”

#东北方言 #老毕登 #爹味 #欠儿登 #魏哥

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

考虑了一天了，到底要不要写，团队小伙伴劝我还是别写了，这里是推特，不是微博，我干啥不写呢？我不写我来推特是干啥呢？我从我的视角来说一说。首先，我觉得啊，没必要纠结微信公众号排版这个事儿，他就是不好用啊，没啥好说的，你要问我，到底哪里不好用：「我对产品理解能力为零」，对于用户而言，感觉不好就一切不好，这个不是正常的事儿嘛，那为什么感觉不好呢？相信意见建议官方团队自己也看了很多，也可能没 KPI 在这里。不过我就没想明白，宝玉老师只是在我们大辉老师下面随口提了一嘴「用户诉求」，我想用户诉求和用户需求是有本质区别的吧，咱们大辉老师就盯着不放了。你必须说，你不说我没法给微信团队反馈，我的妈呀。这是凡尔赛 + PUA 嘛？我想说：“包龙星，你好大的官威啊！” 然后，最可恨的来了！！！突然，我们池大跳出来了，评论区和风月色，我理解是给我们大辉老师评论区礼仪了？然后，暗搓搓回去开始写小作文，按照池大说的社交礼仪，我觉得没必要再写小作文了吧，直接点名啊，这不是你的社交原则嘛？结果没有。你这不是妥妥的双标么？另外，我觉得不可理解的是，你在你评论区爆粗口？这就是所谓，你的地盘你说了算么？我都感觉我回到打土豪分田地的时代了。昨天大辉老师视频号说：“骂人是素质问题，你要是每天在家都是和家里人这么说话，那正常了”，你们俩一起在双标么？至于什么你做多少年技术，你抛弃 Markdown 了，这些事儿吧，我个人觉得好汉不提当年勇，你那破公众号不用 MD 也是正常的，你懂什么是视觉传达不？视觉传达和内容的层次的关系？当然不懂没关系，因为，大辉老师说过「你对设计传达能力理解为零」，一切都可以往这个新兴的网络热词里面套！最后，我想说：“每个时代有这个时代的英雄，也有这个时代红利带来的效应，咱们不能红利吃完了，开始倒退吧”从 AI时代的来临，我一路看着宝玉老师对 AI 这个赛道的分享，思考，提供更多的优质资源翻译，当然你们也可以说，这些你们也能。但是，并没有！

#微信公众号排版 #用户诉求与用户需求 #双标 #PUA #AI

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

睡不着的，一起听歌吧！

全球寒潮持续：健康告急，多地现极端天气· 136 条信息

#睡眠 #音乐 #情感 #放松 #夜间

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

睡不着了，干活吧，这个太暴露年龄了，哈哈哈！

#失眠 #暴露年龄 #幽默 #自我调侃

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

很多产品越来越妖魔化，朝着完全看不懂的方向前进，产品就两条路，要么赚钱，要么不赚钱，要赚钱就好好赚钱不寒碜，要不赚钱就好好做产品，徘徊在赚钱和不赚钱之间是对团队和用户的不尊重，不知道整天在搞什么东西，谁家正经产品整天搞黑灰产，自废武功！

#产品妖魔化 #赚钱 #黑灰产 #自废武功 #不尊重用户

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

昨天张哥来和我们讨论产品，午饭的时候讨论到一个话题：《鸡娃不如鸡自己，反正他们未来也找不到工作》哈哈哈，卧槽，我感觉这个话题太好了，我们娃都小，也都在考虑这个问题，我觉得他说的是对的，于是我开始看和 AI 共生的话题。张哥又给我补了一句，他说：“本来现在很多 Leader 都不把人当人了，那后面人机共生了，那人更不是人了，擦！”直到晚上睡觉，我还在想这个事儿，于是我拿起手机和 Juchats 聊，无意间看到了华为的这篇《智能世界2035》。刚想关掉，的确是对华为写的东西不感冒，扫了一眼目录，感觉还行，就读了起来，我先说我觉得还可以的地方，关于： - 算力技术革命（解决算力是根本问题） - 仓储和物流（我个人觉得这个方向可能是结合最快速的，它拥有强大的历史基础以及成熟的闭环体系） - 推动 AI 向善（安全是人工智能的风口浪尖，输入、输出、记忆都会产生安全问题，我个人觉得 AI 向善这个话题是全人类的。虽然，目前脑机、类脑方向也在蓬勃发展，但是，共生方向还太遥远）这是看到还不错的，其他的方向感觉依然会出现落地问题比如说什么《设计即制造，制造即服务》还有就是：引用的数据有点杂乱，有些非常老旧，当然也需要某些历史数据支撑，但是，从别的地方复制过来，Unicode 格式编码没修改，导致英文字符联结链接，原始链接无法访问，这个问题有点太低级了。

#张哥 #AI共生 #华为智能世界2035 #算力技术革命 #AI向善