时政

财经

科技

#LLM

$𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞$

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

2025-05-30 11:40:13

“生成智能”的时代，创作者即路径激活者平台的价值，不再在于“内容容器”，而在于能否成为生成路径的激活器与承载器；创作者的价值，不再在于“表达能力”，而在于如何调动LLM的生成力，构建可复用的智能链条。

#生成智能 #创作者 #平台价值

2025-05-29 22:32:01

deepseek 真的是 llm 顶流待遇。没有哪家模型的版本号更新（例如 gpt-4o-1104）会激起如此大的声浪 🌊

#DeepSeek #LLM #GPT

2025-05-29 20:33:48

Lemon AI：开源通用智能体写的是全栈通用智能体，但是目前看起来就是调用LLM+搜索API+经验库，来实现类似Deep Research的功能。 Github：手册：

#开源 #通用智能体 #全栈智能

$𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞$

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

2025-05-29 12:41:19

难以想象，连乌龟给个四轮滑板都能如此，人给了LLM会怎样？

#乌龟 #四轮滑板 #人

2025-05-28 21:15:47

12-Factor Agents - 构建可靠 LLM 应用的原则 "12-Factor Agents" 项目借鉴了经典的 "12 Factor Apps" 理念，为构建生产级别的、基于大型语言模型的应用程序提供了一套清晰、实用的工程原则。作者 Dex 通过自身丰富的实践经验，指出当前许多 AI 代理框架虽然功能强大，但在追求高可靠性、可维护性和可扩展性的生产环境中，开发者往往需要回归到更基础

#12-Factor #LLM #大型语言模型

2025-05-28 18:21:35

前两年的 LLM APPs，无论是 ChatBot 形态的 ChatGPT 或者 IDE 形态的 Cursor，他们的共同点是都需要占据“注意力”，也就是“同步”。 2025 仍是未知。可以确定的是：不需要占据前台和注意力的，也就是异步或者说后台执行的是一种基本确定的属性。 - 和同事讨论 Agent (Dify App Type) 重构时我的看法

#LLM #ChatGPT #Cursor

$𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞$

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

2025-05-28 16:56:25

anthropic 比较实在，LLM当前阶段交互，主要还是prompt。自家的4的6万字系统提示词已经做了大部分工作。

#Anthropic #LLM #Prompt

2025-05-28 07:57:00

一个关于使用 llms.txt 文件进行标准化的建议，以提供信息来帮助 LLM 在推理时使用网站，这个思路挺好的，原来的内容都是给人阅读的，假如给 AI 阅读是否需要提供一个单独的版本？我认为是很需要的。 🤖

预览

#LLM #标准化 #网站推理

2025-05-27 17:29:14

Cursor 是如何用 Merkle 树 + RAG 实现快速索引代码库？ 💡 核心思路： 1️⃣ 本地用 AST 分割代码 → 构建 Merkle 树"指纹" 2️⃣ 只同步变更文件（增量更新，节省 90%+ 带宽） 3️⃣ 代码块 → Embedding 向量 → Turbopuffer 向量数据库 4️⃣ 用户提问 → 语义搜索 → 本地读取源码 → LLM 生成答案 🛡️ 隐私保护：

#Merkle树 #代码索引 #RAG

$𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞$

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

2025-05-27 06:11:35

如果说LLM的“生成”基于是下一个token的预测，生物体的生成是基于下一秒生存确定性追求，那这和生物体的“DNA复制、RNA转录、蛋白质翻译、核糖体机”有什么样的联系？

#LLM #生物体 #DNA复制

2025-05-25 17:43:12

自动化简直是技术直男的第二春药 !! 之前选 DBA 做职业，看中的是脚本自动化。哪里有 Blocking ,写脚本；哪里性能差，IO高，写脚本。每天第一件事, 打开 dashboard 找弱鸡自以为掌控了全公司的数据盘，傲娇的不得了。我呸，现在想想愚不可及进入 AI 时代，又迷上了所谓的 AI Agent, 其实是 workflow + llm . 没有爆款选题，RPA 抓 10

#自动化 #技术直男 #DBA

2025-05-25 12:18:34

#BestBlogs 淘宝 Java 工程师的 LLM 开发实践 | 大淘宝技术从 Java 工程师视角出发，详细介绍如何使用 Spring AI 框架进行 LLM 应用开发，包括对话、Function Calling 和 RAG 实践。摘要：本文为 Java 工程师提供了 LLM 应用开发的实战指南。首先分析了当前 LLM 的局限性，强调了应用开发的重要

#JAVA #LLM #RAG

$𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞$

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

2025-05-25 11:13:22

话说起来，大众对于AI的热情是从LLM突破了语言开始的，语言的功用就是内在思考和外在的共情投射-交流。Chatbot使得每个人可以第一次真正面对AI。以往即使alphago下出神奇的37步也就那样而已。

#大众 #AI #LLM

$𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞$

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

2025-05-23 20:19:23

到底有没有AGI？坐等Demis的文章澄清… 我之前以为这是个类似宗教信仰的投射，不过现在看起来并行的LLM推理系统也许可以用一群LLM生成系统组合成一个AGI缝合怪！

#AGI #人工智能 #LLM

$𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞$

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

2025-05-23 08:46:38

和LLM被prompt激活的路径存在类似，我们被need、desire和Meaning三个系统提示词的设定所loop。 “Need 是生理的闭环，Desire 是心理的飞轮，Meaning 是存在的回音。”

#LLM #prompt激活 #Need

马东锡 NLP 🇸🇪

2025-04-26 21:32:50

读书笔记：当 LLM 成为 Agent——从自然语言到“协议语言”的演化这两周选了四篇极其出色的文章做了分享，ReSearch, ReTool, APR 和 PASTA。它们虽然解决的具体问题不相同，但 general 的目标都一致，即让LLM知道 when and how 做决策，这就是agent的核心，要做精准的决策。而这种精准与人类语言的模糊性不一致，但 LLM 的 token

#LLM #agent #自然语言处理

马东锡 NLP 🇸🇪

2025-04-14 04:26:54

「LLM, Reasoning」论文： (How) Do reasoning models reason? “真正的智能，是让模型在生成时就做出正确选择，而不是事后去验证哪个选项是对的。” 作者Subbarao Kambhampati，我不完全同意他，但我很喜欢他。2024年ACL Keynote，他批评当前对 Chain of Thought 的信仰如同宗教。——我们喜欢看到推理的样子，但并

#LLM #reasoning #智能

马东锡 NLP 🇸🇪

2025-04-04 17:33:30

「LLM x RL」DeepSeek 最新论文：Inference-Time Scaling for Generalist Reward Modeling 在 RL 中，Reward Modeling（RM）是一个非常重要的部分。RM 主要用于对 LLM 的生成结果进行打分，从而调整 LLM 的 policy，使其更符合 RM 设定的要求，比如更强的 reasoning 能力。针对特定任务（

#LLM #RL #RewardModeling

马东锡 NLP 🇸🇪

2025-04-02 06:34:00

「LLM， Agent, RL的关系」在LLM的语境下，Agent是能理解问题，自主进行推理（Reasoning），并采取行动的系统。你可以把它想象成一个非常聪明的助手，当你提出复杂问题时，它不会立即给出答案，而是会在内心进行推理和规划（Planning），再给出最终决定。如果我们回顾prompt engineering中提高LLM Reasoning能力的方法，如Self-Consis

#LLM #agent #RL

Jintao Zhang 张晋涛

2025-03-31 20:29:02

这是什么意思呢？Anthropic 给自己的 API 加了个 OpenAI 的 API 兼容。这样就可以直接使用 OpenAI 的 SDK 了，以及在各类兼容 OpenAI API 接口的应用上来使用 Anthropic 的模型了。原本还以为以后 LLM 的接口形式有两种，Anthropic 能硬扛压力，但这样看，以后应该就只有 OpenAI 这一种了

#Anthropic #OpenAI #API兼容

马东锡 NLP 🇸🇪

2025-03-29 04:10:35

「Agent」论文：Executable Code Actions Elicit Better LLM Agents 从 ReAct 到 CodeAct 如果让我在所有 LLM 论文中选择我最喜欢的一篇，2022 年的 ReAct 绝对是前三名之一。 ReAct 大道至简，天才般地将复杂的强化学习（RL）过程，通过口头表达的方式表现出来，至今依然是 Agent 项目中最简单、最有效、最稳健的

#agent #LLM #React

里昂叉 | Leon X 🐡

2025-03-24 13:18:34

#MCP 我自我感觉英文水平还说得过去，但是读书读文章还是没有母语那么快。大家有试过用llm翻译一整本书吗？我之前尝试过，有几个痛点： 1. 直接塞塞不下，受限于context window和输出token限制 2. 怎么拆是个学问，拆完保证翻译的一致性又有些工作要做 3. 自动化完成这一系列翻译，可能需要用到coze或是dify这样的工作流工具今天试了下MCP来解决这些个问题，用的就是最基础

#MCP #LLM #翻译

2025-03-22 08:24:28

前几天看到的折纸风格视频，复刻教程： 1. Midjourney Describe 反推提示词 2. LLM 给出其他动物和材质组合提示词 3. Midjourney 生成图片 4. POE上的可灵 v1.5 生成视频，剪映拼接加音效

#折纸风格 #midjourney #LLM

马东锡 NLP 🇸🇪

2025-03-20 22:59:17

更强的reasoning，更好的Agent 论文分享： Thinking Machines: A Survey of LLM based Reasoning Strategies 在我们开发Agent的项目的时候，需要更好的LLM reasoning的能力，以获得更高的任务完成准确率。那么有哪些方法可以增强LLM的reasoning能力呢？沿着之前我分享的Testing time s

#reasoning #LLM #agent

马东锡 NLP 🇸🇪

2025-03-19 15:55:38

Large Reasoning Model时代, 几乎等于Reinforcement Learning + LLM的时代。但RL专业性非常强，去参加ML的会议时，专门做RL的研究员都现场拿着笔纸推算数学公式，掌握起来学习难度较高。分享一本RL的入门教材，从RL基础MDP，PPO，直到跟LLM结合，如RLHF，都有讲解，深入浅出。 Reinforcement Learning: An O

#强化学习 #大型语言模型 #RLHF