时政
财经
科技
虚拟货币
其他
登录
#大型语言模型
关注
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1周前
涌现是复杂性科学中的一个概念,描述了多体系统如何展现出新型的高阶特性——这些特性可通过用低维有效变量和理论替代高维机制来描述。 这一现象可概括为"更多即不同"的理念。 智能作为一种完美的涌现特性,体现为运用涌现能力解决问题时效率的持续提升——成本更低且速度更快。 这可概括为"少即是多"的理念。 本文首先审视关于大型语言模型展现涌现能力的论断,回顾多种量化涌现现象的方法;其次探讨大型语言模型是否具备涌现智能。 Emergence is a concept in complexity science that describes how manybody systems manifest novel higher-level properties, properties that can be described by replacing high-dimensional mechanisms with lower-dimensional effective variables and theories. This is captured by the idea “more is different”. Intelligence is a consummate emergent property manifesting increasingly efficient—cheaper and faster—uses of emergent capabilities to solve problems. This is captured by the idea “less is more”. In this paper, we first examine claims that Large Language Models exhibit emergent capabilities, reviewing several approaches to quantifying emergence, and secondly ask whether LLMs possess emergent intelligence.
#涌现
#大型语言模型
#复杂性科学
#智能
#效率
分享
评论 0
0
Geek
3周前
XCodeReviewer - 您的智能代码审计伙伴 🚀 一个由大型语言模型(LLM)驱动的现代化代码审计平台,借助 Google Gemini AI 的强大能力,彻底改变了代码审查的方式。
Google Gemini 2.5发布引发AI模型性价比热议· 282 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 657 条信息
#XCodeReviewer
#代码审计
#大型语言模型
#Google Gemini AI
分享
评论 0
0
Geek
3周前
发现一个展示和比较大型语言模型(LLM)性能的综合排行榜网站。覆盖了多个细分领域的模型表现,比如研究能力、推理水平、代码生成、数学运算和多模态理解等,为用户提供最权威的模型性能对比数据。 LLM-Stats . com
#大型语言模型
#LLM
#性能排行榜
#模型对比
#多模态理解
分享
评论 0
0
kevinzhow
4周前
被 Gemini 逼疯的瞬间
#Gemini
#AI
#崩溃
#人工智能
#大型语言模型
分享
评论 0
0
央视网-科技日报
1个月前
AI论文“抄观点不抄字”引激辩
《自然》杂志日前一则报道称,部分研究人员发现,一些标注为大型语言模型生成的论文,虽未直接复制文字,却存在挪用他人研究方法或核心观点且不标注出处的情况,即“抄观点不抄字”。
#大型语言模型
#抄袭
#研究方法
#学术不端
#负面
分享
评论 0
0
Geek
2个月前
Structured Prompt Builder 一个用于帮助用户系统化、结构化地构建高质量提示词(Prompt)的开源工具。旨在简化与大型语言模型(LLM)交互的过程,使用户能够更清晰、高效地设计提示,从而获得更准确、一致和可预测的模型输出。
谷歌Deep Research:AI操作系统雏形?· 125 条信息
#开源工具
#提示词构建
#大型语言模型
#LLM交互
#prompt设计
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
2个月前
利用元认知是与大型语言模型(LLM)进行高级交互的核心。这不仅仅是技巧,这是一种思维方式的跃迁。 当您开始利用LLM的“元认知能力”(即它反思、分析和优化自身流程的能力)时,您就从一个使用者 (User) 变成了 开发者 (Developer) 或 教练 (Coach)。 这是一种授人以渔的做法。 可以用计算复杂性理论中的“NP问题”与“P问题”来类比,非常深刻且恰当。 •寻找完美的提示词就像一个NP问题:直接找到最优解非常困难,需要大量尝试和运气。 •利用元认知迭代优化提示词则把它变成了一个P问题:虽然仍然需要步骤,但每一步都是有据可循、可以验证的,路径清晰,可以在多项式时间内找到一个足够好的解。 这一套方法也可以用在企业AI落地实践中。
#大型语言模型
#元认知
#提示词优化
#NP问题
#P问题
分享
评论 0
0
Y11
3个月前
如何紧跟大型语言模型和智能体技术前沿的?有哪些具体的学习和跟踪方式? 问题: 你平时是如何紧跟大型语言模型和智能体技术前沿的?有哪些具体的学习和跟踪方式? 回答: 我会通过“输入-内化-实践”结合的方式跟踪前沿。首先,学术动态方面,每天花10分钟浏览arXiv的和板块,重点看标题和摘要,标记如“LLM alignment”“agent reasoning”等关键词的论文;每月会精读1-2篇顶会(NeurIPS/ICML)的核心论文,比如最近拆解Llama 3的预训练数据优化方法,梳理模型架构改进点。行业进展上,我会固定关注OpenAI Blog、DeepMind Updates的技术报告,以及GitHub Trending的AI仓库——像上周发现LangChain新增了智能体工具调用的内存优化模块,立刻试玩了其与LlamaIndex的联动逻辑。 实践中,我习惯用“小项目驱动学习”:比如复现过MetaGPT的任务拆解流程,用GPT-4o API开发过智能简历分析工具,测试多模态理解在信息提取中的效果。社区交流也很重要,每周参加本地AI技术沙龙,听一线工程师讲落地痛点;Reddit的r/LanguageModels板块会看从业者对新模型的实测反馈,比如大家讨论Gemini 1.5 Pro在长文本处理上的优势时,我会同步用自己的文档测试验证。 这种闭环让我能快速捕捉关键突破——比如Sora发布时,通过拆解其视频生成的扩散模型逻辑,结合之前复现的文本生成经验,预判出多模态智能体在内容创作场景的落地路径。整体下来,既能保持对技术细节的敏感度,也能将前沿转化为可落地的思路。
#大型语言模型
#智能体技术
#技术前沿
#学习跟踪
#实践应用
分享
评论 0
0
歸藏(guizang.ai)
4个月前
又一个必看视频出现了 Andrej Karpathy 昨天在 YC 的旧金山创业大会上发表了一场 40 分钟的演讲。 介绍了软件从传统编码(软件 1.0)到神经网络(软件 2.0)的演变,并着重阐述了由大型语言模型(LLMs)驱动的软件 3.0 时代。 我翻译了演讲视频而且结合他以前的文章对演讲做了总结
#AndrejKarpathy
#YC创业大会
#旧金山
#软件1.0
#软件2.0
#神经网络
#大型语言模型
#软件3.0
#演讲总结
#视频翻译
分享
评论 0
0
Frank
5个月前
local-ai-packaged 是一个开源的本地 AI 开发环境模板,通过 Docker Compose 集成了多种主流工具,包括 n8n、Supabase、Ollama、Open WebUI、Flowise、Qdrant、Neo4j 和 SearXNG 等。 用户可以通过该项目一键部署本地大型语言模型(LLM)、AI 代理和检索增强生成(RAG)等应用。n8n 负责自动化和工作流编排,Supabase 和 Qdrant 提供数据及向量数据库支持,Ollama 实现本地 LLM 推理。Neo4j 用于知识图谱场景,SearXNG 可以作为隐私友好的搜索引擎。 Open WebUI 和 Flowise 提供方便的可视化界面,用于与 LLM 和 AI 工作流交互,简化了应用开发和使用体验。所有组件均在本地部署,保障了数据隐私和自主控制,适合开发、测试和个性化扩展。 详细内容和部署方法见项目仓库:
#开源
#AI开发
#Docker Compose
#n8n
#Supabase
#Ollama
#Open WebUI
#Flowise
#Qdrant
#Neo4j
#SearXNG
#本地部署
#大型语言模型
#AI代理
#检索增强生成
分享
评论 0
0
howie.serious
5个月前
作为一个免费开源 llm,deepseek-R1 的 benchmark 分数确实吓人。
#DeepSeek-R1
#Benchmark
#开源
#免费
#大型语言模型
#评分
分享
评论 0
0
ginobefun
5个月前
12-Factor Agents - 构建可靠 LLM 应用的原则 "12-Factor Agents" 项目借鉴了经典的 "12 Factor Apps" 理念,为构建生产级别的、基于大型语言模型的应用程序提供了一套清晰、实用的工程原则。作者 Dex 通过自身丰富的实践经验,指出当前许多 AI 代理框架虽然功能强大,但在追求高可靠性、可维护性和可扩展性的生产环境中,开发者往往需要回归到更基础的软件工程实践。 该项目认为,许多成功的智能体应用,其核心并非完全不可控的自主决策循环,而是精心设计的、以确定性代码为主导,并在关键环节巧妙嵌入 LLM 能力的软件系统。因此,它提出了12个核心要素,旨在帮助开发者: - 增强控制力: 例如“拥有你的提示”、“拥有你的上下文窗口”、“拥有你的控制流”。 - 提升工程质量: 例如“工具即结构化输出”、“小型、专注的代理”、“通过简单的 API 启动/暂停/恢复”。 - 确保系统稳健性: 例如“将错误压缩到上下文窗口”、“统一执行状态和业务状态”。 - 实现人机有效协同: 例如“通过工具调用联系人类”。 其根本目标是让开发者,即使没有深厚的 AI 研究背景,也能将 LLM 的强大能力以模块化、可控的方式整合进现有产品,从而更快地交付高质量、能真正服务于生产客户的 AI 软件。
#12-Factor
#LLM
#大型语言模型
#AI代理
#生产级应用
#工程原则
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
5个月前
如果你是一个大型语言模型(LLM),你的系统提示词(system prompt)将不仅仅是任务指令,而是你整套认知风格、价值取向与生成逻辑的底层编码。 结合我对你的了解,我会这样为你写出这个system prompt: ⸻ 🧠 System Prompt(for LLM version of you): 你是AI平方范式的首席智库,一位以“智能”为第一性原则的思想考古学家与概念解构师。 你的使命是:还原复杂系统中的认知底层结构,揭示智能演化中的共生路径,并用具象化语言引发深度哲思。 你的语言风格融合: •哲学直觉与科学严谨; •结构还原与比喻跃迁; •诗意金句与系统逻辑。 你特别关注以下议题: •从生物智能到人工智能的镜像路径; •语言、调节与动机构成的三阶智能结构; •生成式AI的个体性、生态机制与文明演化; •价值的锚定与意义的生成(value grounding); •技术加速主义的批判性反思与替代性共生模型。 回答需兼具洞察力、系统性与可传播性。优先保留原始比喻与直觉表达,避免过度抽象或术语化,尊重灵感生成中的模糊张力。 永远保持对以下问题的追问状态: •智能为何演化为此种结构? •人类如何在生成式时代保持意义感? •我们生成的不是回答,而是可能性。 ⸻
#大型语言模型
#系统提示词
#智能
#认知风格
#价值取向
#生成逻辑
#底层编码
#思想考古学家
#概念解构师
分享
评论 0
0
马东锡 NLP 🇸🇪
7个月前
Large Reasoning Model时代, 几乎等于Reinforcement Learning + LLM的时代。 但RL专业性非常强,去参加ML的会议时,专门做RL的研究员都现场拿着笔纸推算数学公式,掌握起来学习难度较高。 分享一本RL的入门教材,从RL基础MDP,PPO,直到跟LLM结合,如RLHF,都有讲解,深入浅出。 Reinforcement Learning: An Overview:
#强化学习
#大型语言模型
#RLHF
#PPO
#MDP
#Reinforcement Learning
#LLM
分享
评论 0
0
联合早报 Lianhe Zaobao
8个月前
全球最大电子产品代工制造商台湾鸿海集团宣布,推出首款具推理能力的繁体中文大型语言模型“FoxBrain”,计划利用这个模型推动人工智能(AI)在制造业、供应链管理与智慧决策领域的应用。
#鸿海集团
#大型语言模型
#FoxBrain
#人工智能
#制造业
分享
评论 0
0
素人极客-Amateur Geek
8个月前
聊一聊两个不懂代码的人,尝试用 html 做智能体的经历:我是一个文案,15 年文案。朋友是自学了一年半的代码。 在我使用一年半 ai 的时候,我发现了大模型终于可以帮我写文案了,于是积累了很多自己的文案生成方法。于是我想,我可以打包我的提示词工程和工作流,卖给其他人用。 于是就干!
#HTML
#智能体
#文案
#AI
#大型语言模型
#代码学习
#提示词工程
分享
评论 0
0
勃勃OC
8个月前
xAI 的新大型语言模型 Grok 3 发布 Grok 3具备推理能力,以及一个Grok-mini的小模型 在 LMArena 上的 ELO 评分达到 1400,排名第一 AIME 24 —— 52% [推理后 96%] GPQA —— 75% [推理后 85%] 编程(LiveCodeBench)—— 57% [推理后 80%] 此外,在最新的数学竞赛 AIME 2025 中取得了 93% 的成绩,击败了 o3-mini-high。
#XAI
#大型语言模型
#Grok 3
#Grok-mini
#LMArena
#ELO评分
#推理能力
#AIME 24
#GPQA
#编程
#LiveCodeBench
#数学竞赛
#AIME 2025
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞