微软发布OmniParser 2.0版本，用于把屏幕截图转化成LLM可处理的结构化格式，再结合屏幕操作工具即可让LLM操作屏幕。模型： Github：

#微软 #OmniParser 2.0 #屏幕截图 #LLM #结构化格式

相关新闻

howie.serious

2个月前

gemini 最佳实践：if 深度思考，then 信息图总结。每次和 gemini 聊完一个话题，如果是多轮的层层深入的对话，最后有所收获的话，那就多走一步：选择 nano 🍌， > 基于我们前面的对话，画一张信息图，整理核心观点例如，刚才和 ai 聊 llm 强化学习对于父母的启发。语言是模糊的，思想是在多轮对话中逐渐清晰的，和 llm 多轮对话当然是有启发的，但多了信息图总结这一步，

howie.serious

2个月前

chatgpt 以来，发展了三年的LLM，提供的早已不止是情绪价值。我在2025跨年对谈时就明确认为，2025年，使用ai的关键，是向 ai “要价值”！要直接的、经济的价值！ 2025年的发展，基本上验证了我的判断。本周的ai专题直播，一起聊一聊这三年，这三年的ai学习、应用。欢迎预约直播，本周五直播间见。预约方式：（不知不觉，发现 2025 年已经做了 20 场 ai 专题

素人极客-Amateur Geek

2个月前

今天重新思考了语言的功能， LLM可能会变成我们语言效率变革的一个工具。未来语言可能变成一种文化而存在，作为工作来讲，效率语言可能很快会出现。出现的前提：语言表达经过LLM后可以实现100%正确性

看不懂的sol

2个月前

为了兄弟们更加清楚的了解美股巨头的AI 叙事玩法，特意制作此图。说实话，AI 巨头们的 “闭环互喂局”，这玩法真TMD刺激！英伟达拟投 OpenAI 千亿美元 → OpenAI 五年向甲骨文买 3000 亿算力 → 甲骨文再向英伟达狂购 GB200 → 钱又回到英伟达。微软已投 OpenAI 超 130 亿美元 → OpenAI 用这笔钱买 Azure（底层英伟达 GPU）→ 英伟达再

蓝点网

2个月前

微软宣布 Outlook 邮箱启用新域名，就是有点长：Outlook[.]Cloud[.]Microsoft，在过渡期间新旧域名可以同时使用，过渡期结束后旧域名会跳转到新域名。使用密码管理器的用户可以在微软账户里新增条目 Cloud[.]Microsoft，这样后续这个域名下的所有服务都可以快速登录。

微软发布OmniParser 2.0版本，用于把屏幕截图转化成LLM可处理的结构化格式，再结合屏幕操作工具即可让LLM操作屏幕。 模型： Github：

相关新闻

微软发布OmniParser 2.0版本，用于把屏幕截图转化成LLM可处理的结构化格式，再结合屏幕操作工具即可让LLM操作屏幕。模型： Github：