时政
财经
科技
登录
#大型语言模型
关注
歸藏(guizang.ai)
1周前
又一个必看视频出现了 Andrej Karpathy 昨天在 YC 的旧金山创业大会上发表了一场 40 分钟的演讲。 介绍了软件从传统编码(软件 1.0)到神经网络(软件 2.0)的演变,并着重阐述了由大型语言模型(LLMs)驱动的软件 3.0 时代。 我翻译了演讲视频而且结合他以前的文章对演讲做了总结
#AndrejKarpathy
#YC创业大会
#旧金山
#软件1.0
#软件2.0
#神经网络
#大型语言模型
#软件3.0
#演讲总结
#视频翻译
分享
评论 0
0
Frank
4周前
local-ai-packaged 是一个开源的本地 AI 开发环境模板,通过 Docker Compose 集成了多种主流工具,包括 n8n、Supabase、Ollama、Open WebUI、Flowise、Qdrant、Neo4j 和 SearXNG 等。 用户可以通过该项目一键部署本地大型语言模型(LLM)、AI 代理和检索增强生成(RAG)等应用。n8n 负责自动化和工作流编排,Supabase 和 Qdrant 提供数据及向量数据库支持,Ollama 实现本地 LLM 推理。Neo4j 用于知识图谱场景,SearXNG 可以作为隐私友好的搜索引擎。 Open WebUI 和 Flowise 提供方便的可视化界面,用于与 LLM 和 AI 工作流交互,简化了应用开发和使用体验。所有组件均在本地部署,保障了数据隐私和自主控制,适合开发、测试和个性化扩展。 详细内容和部署方法见项目仓库:
#开源
#AI开发
#Docker Compose
#n8n
#Supabase
#Ollama
#Open WebUI
#Flowise
#Qdrant
#Neo4j
#SearXNG
#本地部署
#大型语言模型
#AI代理
#检索增强生成
分享
评论 0
0
howie.serious
1个月前
作为一个免费开源 llm,deepseek-R1 的 benchmark 分数确实吓人。
#DeepSeek-R1
#Benchmark
#开源
#免费
#大型语言模型
#评分
分享
评论 0
0
ginobefun
1个月前
12-Factor Agents - 构建可靠 LLM 应用的原则 "12-Factor Agents" 项目借鉴了经典的 "12 Factor Apps" 理念,为构建生产级别的、基于大型语言模型的应用程序提供了一套清晰、实用的工程原则。作者 Dex 通过自身丰富的实践经验,指出当前许多 AI 代理框架虽然功能强大,但在追求高可靠性、可维护性和可扩展性的生产环境中,开发者往往需要回归到更基础的软件工程实践。 该项目认为,许多成功的智能体应用,其核心并非完全不可控的自主决策循环,而是精心设计的、以确定性代码为主导,并在关键环节巧妙嵌入 LLM 能力的软件系统。因此,它提出了12个核心要素,旨在帮助开发者: - 增强控制力: 例如“拥有你的提示”、“拥有你的上下文窗口”、“拥有你的控制流”。 - 提升工程质量: 例如“工具即结构化输出”、“小型、专注的代理”、“通过简单的 API 启动/暂停/恢复”。 - 确保系统稳健性: 例如“将错误压缩到上下文窗口”、“统一执行状态和业务状态”。 - 实现人机有效协同: 例如“通过工具调用联系人类”。 其根本目标是让开发者,即使没有深厚的 AI 研究背景,也能将 LLM 的强大能力以模块化、可控的方式整合进现有产品,从而更快地交付高质量、能真正服务于生产客户的 AI 软件。
#12-Factor
#LLM
#大型语言模型
#AI代理
#生产级应用
#工程原则
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
如果你是一个大型语言模型(LLM),你的系统提示词(system prompt)将不仅仅是任务指令,而是你整套认知风格、价值取向与生成逻辑的底层编码。 结合我对你的了解,我会这样为你写出这个system prompt: ⸻ 🧠 System Prompt(for LLM version of you): 你是AI平方范式的首席智库,一位以“智能”为第一性原则的思想考古学家与概念解构师。 你的使命是:还原复杂系统中的认知底层结构,揭示智能演化中的共生路径,并用具象化语言引发深度哲思。 你的语言风格融合: •哲学直觉与科学严谨; •结构还原与比喻跃迁; •诗意金句与系统逻辑。 你特别关注以下议题: •从生物智能到人工智能的镜像路径; •语言、调节与动机构成的三阶智能结构; •生成式AI的个体性、生态机制与文明演化; •价值的锚定与意义的生成(value grounding); •技术加速主义的批判性反思与替代性共生模型。 回答需兼具洞察力、系统性与可传播性。优先保留原始比喻与直觉表达,避免过度抽象或术语化,尊重灵感生成中的模糊张力。 永远保持对以下问题的追问状态: •智能为何演化为此种结构? •人类如何在生成式时代保持意义感? •我们生成的不是回答,而是可能性。 ⸻
#大型语言模型
#系统提示词
#智能
#认知风格
#价值取向
#生成逻辑
#底层编码
#思想考古学家
#概念解构师
分享
评论 0
0
马东锡 NLP 🇸🇪
3个月前
Large Reasoning Model时代, 几乎等于Reinforcement Learning + LLM的时代。 但RL专业性非常强,去参加ML的会议时,专门做RL的研究员都现场拿着笔纸推算数学公式,掌握起来学习难度较高。 分享一本RL的入门教材,从RL基础MDP,PPO,直到跟LLM结合,如RLHF,都有讲解,深入浅出。 Reinforcement Learning: An Overview:
#强化学习
#大型语言模型
#RLHF
#PPO
#MDP
#Reinforcement Learning
#LLM
分享
评论 0
0
联合早报 Lianhe Zaobao
3个月前
全球最大电子产品代工制造商台湾鸿海集团宣布,推出首款具推理能力的繁体中文大型语言模型“FoxBrain”,计划利用这个模型推动人工智能(AI)在制造业、供应链管理与智慧决策领域的应用。
#鸿海集团
#大型语言模型
#FoxBrain
#人工智能
#制造业
分享
评论 0
0
素人极客-Amateur Geek
4个月前
聊一聊两个不懂代码的人,尝试用 html 做智能体的经历:我是一个文案,15 年文案。朋友是自学了一年半的代码。 在我使用一年半 ai 的时候,我发现了大模型终于可以帮我写文案了,于是积累了很多自己的文案生成方法。于是我想,我可以打包我的提示词工程和工作流,卖给其他人用。 于是就干!
#HTML
#智能体
#文案
#AI
#大型语言模型
#代码学习
#提示词工程
分享
评论 0
0
勃勃OC
4个月前
xAI 的新大型语言模型 Grok 3 发布 Grok 3具备推理能力,以及一个Grok-mini的小模型 在 LMArena 上的 ELO 评分达到 1400,排名第一 AIME 24 —— 52% [推理后 96%] GPQA —— 75% [推理后 85%] 编程(LiveCodeBench)—— 57% [推理后 80%] 此外,在最新的数学竞赛 AIME 2025 中取得了 93% 的成绩,击败了 o3-mini-high。
#XAI
#大型语言模型
#Grok 3
#Grok-mini
#LMArena
#ELO评分
#推理能力
#AIME 24
#GPQA
#编程
#LiveCodeBench
#数学竞赛
#AIME 2025
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞