#大型语言模型

1周前

如何紧跟大型语言模型和智能体技术前沿的？有哪些具体的学习和跟踪方式？问题: 你平时是如何紧跟大型语言模型和智能体技术前沿的？有哪些具体的学习和跟踪方式？回答: 我会通过“输入-内化-实践”结合的方式跟踪前沿。首先，学术动态方面，每天花10分钟浏览arXiv的和板块，重点看标题和摘要，标记如“LLM alignment”“agent reasoning”等关键词的论文；每月会精读1-2篇顶会（NeurIPS/ICML）的核心论文，比如最近拆解Llama 3的预训练数据优化方法，梳理模型架构改进点。行业进展上，我会固定关注OpenAI Blog、DeepMind Updates的技术报告，以及GitHub Trending的AI仓库——像上周发现LangChain新增了智能体工具调用的内存优化模块，立刻试玩了其与LlamaIndex的联动逻辑。实践中，我习惯用“小项目驱动学习”：比如复现过MetaGPT的任务拆解流程，用GPT-4o API开发过智能简历分析工具，测试多模态理解在信息提取中的效果。社区交流也很重要，每周参加本地AI技术沙龙，听一线工程师讲落地痛点；Reddit的r/LanguageModels板块会看从业者对新模型的实测反馈，比如大家讨论Gemini 1.5 Pro在长文本处理上的优势时，我会同步用自己的文档测试验证。这种闭环让我能快速捕捉关键突破——比如Sora发布时，通过拆解其视频生成的扩散模型逻辑，结合之前复现的文本生成经验，预判出多模态智能体在内容创作场景的落地路径。整体下来，既能保持对技术细节的敏感度，也能将前沿转化为可落地的思路。

#大型语言模型 #智能体技术 #技术前沿 #学习跟踪 #实践应用

歸藏(guizang.ai)

1个月前

又一个必看视频出现了 Andrej Karpathy 昨天在 YC 的旧金山创业大会上发表了一场 40 分钟的演讲。介绍了软件从传统编码（软件 1.0）到神经网络（软件 2.0）的演变，并着重阐述了由大型语言模型（LLMs）驱动的软件 3.0 时代。我翻译了演讲视频而且结合他以前的文章对演讲做了总结

#AndrejKarpathy #YC创业大会 #旧金山 #软件1.0 #软件2.0 #神经网络 #大型语言模型 #软件3.0 #演讲总结 #视频翻译

2个月前

local-ai-packaged 是一个开源的本地 AI 开发环境模板，通过 Docker Compose 集成了多种主流工具，包括 n8n、Supabase、Ollama、Open WebUI、Flowise、Qdrant、Neo4j 和 SearXNG 等。用户可以通过该项目一键部署本地大型语言模型（LLM）、AI 代理和检索增强生成（RAG）等应用。n8n 负责自动化和工作流编排，Supabase 和 Qdrant 提供数据及向量数据库支持，Ollama 实现本地 LLM 推理。Neo4j 用于知识图谱场景，SearXNG 可以作为隐私友好的搜索引擎。 Open WebUI 和 Flowise 提供方便的可视化界面，用于与 LLM 和 AI 工作流交互，简化了应用开发和使用体验。所有组件均在本地部署，保障了数据隐私和自主控制，适合开发、测试和个性化扩展。详细内容和部署方法见项目仓库：

#开源 #AI开发 #Docker Compose #n8n #Supabase #Ollama #Open WebUI #Flowise #Qdrant #Neo4j #SearXNG #本地部署 #大型语言模型 #AI代理 #检索增强生成

2个月前

作为一个免费开源 llm，deepseek-R1 的 benchmark 分数确实吓人。

#DeepSeek-R1 #Benchmark #开源 #免费 #大型语言模型 #评分

2个月前

12-Factor Agents - 构建可靠 LLM 应用的原则 "12-Factor Agents" 项目借鉴了经典的 "12 Factor Apps" 理念，为构建生产级别的、基于大型语言模型的应用程序提供了一套清晰、实用的工程原则。作者 Dex 通过自身丰富的实践经验，指出当前许多 AI 代理框架虽然功能强大，但在追求高可靠性、可维护性和可扩展性的生产环境中，开发者往往需要回归到更基础的软件工程实践。该项目认为，许多成功的智能体应用，其核心并非完全不可控的自主决策循环，而是精心设计的、以确定性代码为主导，并在关键环节巧妙嵌入 LLM 能力的软件系统。因此，它提出了12个核心要素，旨在帮助开发者： - 增强控制力：例如“拥有你的提示”、“拥有你的上下文窗口”、“拥有你的控制流”。 - 提升工程质量：例如“工具即结构化输出”、“小型、专注的代理”、“通过简单的 API 启动/暂停/恢复”。 - 确保系统稳健性：例如“将错误压缩到上下文窗口”、“统一执行状态和业务状态”。 - 实现人机有效协同：例如“通过工具调用联系人类”。其根本目标是让开发者，即使没有深厚的 AI 研究背景，也能将 LLM 的强大能力以模块化、可控的方式整合进现有产品，从而更快地交付高质量、能真正服务于生产客户的 AI 软件。

#12-Factor #LLM #大型语言模型 #AI代理 #生产级应用 #工程原则

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

2个月前

如果你是一个大型语言模型（LLM），你的系统提示词（system prompt）将不仅仅是任务指令，而是你整套认知风格、价值取向与生成逻辑的底层编码。结合我对你的了解，我会这样为你写出这个system prompt： ⸻ 🧠 System Prompt（for LLM version of you）：你是AI平方范式的首席智库，一位以“智能”为第一性原则的思想考古学家与概念解构师。你的使命是：还原复杂系统中的认知底层结构，揭示智能演化中的共生路径，并用具象化语言引发深度哲思。你的语言风格融合： •哲学直觉与科学严谨； •结构还原与比喻跃迁； •诗意金句与系统逻辑。你特别关注以下议题： •从生物智能到人工智能的镜像路径； •语言、调节与动机构成的三阶智能结构； •生成式AI的个体性、生态机制与文明演化； •价值的锚定与意义的生成（value grounding）； •技术加速主义的批判性反思与替代性共生模型。回答需兼具洞察力、系统性与可传播性。优先保留原始比喻与直觉表达，避免过度抽象或术语化，尊重灵感生成中的模糊张力。永远保持对以下问题的追问状态： •智能为何演化为此种结构？ •人类如何在生成式时代保持意义感？ •我们生成的不是回答，而是可能性。 ⸻

#大型语言模型 #系统提示词 #智能 #认知风格 #价值取向 #生成逻辑 #底层编码 #思想考古学家 #概念解构师

马东锡 NLP 🇸🇪

4个月前

Large Reasoning Model时代, 几乎等于Reinforcement Learning + LLM的时代。但RL专业性非常强，去参加ML的会议时，专门做RL的研究员都现场拿着笔纸推算数学公式，掌握起来学习难度较高。分享一本RL的入门教材，从RL基础MDP，PPO，直到跟LLM结合，如RLHF，都有讲解，深入浅出。 Reinforcement Learning: An Overview：

#强化学习 #大型语言模型 #RLHF #PPO #MDP #Reinforcement Learning #LLM

联合早报 Lianhe Zaobao

5个月前

全球最大电子产品代工制造商台湾鸿海集团宣布，推出首款具推理能力的繁体中文大型语言模型“FoxBrain”，计划利用这个模型推动人工智能（AI）在制造业、供应链管理与智慧决策领域的应用。

#鸿海集团 #大型语言模型 #FoxBrain #人工智能 #制造业

素人极客-Amateur Geek

5个月前

聊一聊两个不懂代码的人，尝试用 html 做智能体的经历：我是一个文案，15 年文案。朋友是自学了一年半的代码。在我使用一年半 ai 的时候，我发现了大模型终于可以帮我写文案了，于是积累了很多自己的文案生成方法。于是我想，我可以打包我的提示词工程和工作流，卖给其他人用。于是就干！

#HTML #智能体 #文案 #AI #大型语言模型 #代码学习 #提示词工程

5个月前

xAI 的新大型语言模型 Grok 3 发布 Grok 3具备推理能力，以及一个Grok-mini的小模型在 LMArena 上的 ELO 评分达到 1400，排名第一 AIME 24 —— 52% [推理后 96%] GPQA —— 75% [推理后 85%] 编程（LiveCodeBench）—— 57% [推理后 80%] 此外，在最新的数学竞赛 AIME 2025 中取得了 93% 的成绩，击败了 o3-mini-high。

#XAI #大型语言模型 #Grok 3 #Grok-mini #LMArena #ELO评分 #推理能力 #AIME 24 #GPQA #编程 #LiveCodeBench #数学竞赛 #AIME 2025