ginobefun
5个月前
#BestBlogs 复杂场景下的 RAG 架构演进:跨模态知识联邦与统一语义推理实践 | InfoQ 中文 文章深入探讨复杂 RAG 场景挑战,提出基于融合知识库与统一语义层的跨模态知识联邦架构及实践。 摘要: 文章分析了传统 RAG 技术在处理企业级复杂知识交互场景(如异构、多模态知识)时遇到的挑战,特别是知识离散性和模态多样性问题。 作者基于 QCon 大会演讲内容,提出了一种新的 RAG 架构演进方向:构建融合知识库以整合多元异构数据,并通过统一知识图谱构建统一语义层,实现跨模态信息的关联和高效检索。 文章详细阐述了融合知识库的构建方法和统一知识图谱的生成与检索逻辑,并结合医院电子病历查询和银行风险指标分析两个具体案例,展示了该架构在实际生产环境中的应用成效。最后,文章讨论了统一语义层动态更新、图像/视频数据处理、行业语义模型赋能以及知识库标准化等未来演进方向。 主要内容: 1. 传统 RAG 难以应对复杂异构和多模态知识挑战 -- 现有 RAG 技术在处理分散于不同文档、不同格式(文本、图片等)的知识时,难以建立有效关联,导致问答结果片面或不准确。 2. 提出基于融合知识库和统一语义层的 RAG 新架构 -- 通过构建融合知识库整合结构化与非结构化数据,并利用统一知识图谱形成语义层,解决知识离散和模态多样性问题,提升检索与推理能力。 3. 统一知识图谱是实现跨模态知识关联的核心 -- 从多模态数据中提取实体和关系构建图谱,基于用户问题进行图谱检索获取包含多模态信息的子图,为 LLM 提供丰富的上下文。 4. 新架构在医疗和金融等复杂场景展现应用价值 -- 通过医院电子病历查询和银行风险指标分析案例,验证了该架构能有效整合多源数据,提升问答和分析的准确性与全面性。 文章链接:
ginobefun
5个月前
ginobefun
5个月前
#BestBlogs 公司来的新人用字符串存储日期,被领导怒怼了…… | dbaplus社群 文章对比分析了 MySQL 和 PostgreSQL 数据库中存储日期时间的几种方式,并提供了选择建议,强调避免使用字符串。 摘要: 文章针对数据库中如何有效存储日期时间这一基础问题,详细分析了常见的几种方法。首先,强烈不建议使用字符串存储日期,指出了其在空间、查询效率和计算功能上的显著劣势。接着,重点对比了 MySQL 中的 DATETIME 和 TIMESTAMP 类型,阐述了它们在时区处理、存储空间和表示范围上的差异,并通过实际 SQL 示例演示了 TIMESTAMP 的时区转换特性。文章还讨论了使用数值型(Unix 时间戳)存储时间的优缺点,尤其指出了其在可读性上的不足。最后,补充介绍了 PostgreSQL 中对应的时间类型,并提供了基于时区需求、时间范围及性能偏好的选择建议,强调没有“银弹”,需根据实际业务场景权衡利弊。 主要内容: 1. 不应使用字符串存储日期,会导致效率低下和功能受限 -- 字符串存储日期效率低,比较和计算复杂,且不利于索引优化,远不如数据库原生日期时间类型。 2. TIMESTAMP 具有自动时区转换能力,适合国际化应用 -- MySQL TIMESTAMP 和 PG TIMESTAMPTZ 在存储时转为 UTC,查询时转回会话时区,简化多时区处理,但有时间范围限制。 3. DATETIME 存储字面值,不涉及时区转换,范围更广 -- MySQL DATETIME 和 PG TIMESTAMP WITHOUT TIME ZONE 存储原始值,适合无需时区转换或表示远期时间的场景。 4. 数值时间戳便于计算和跨系统,但可读性差 -- 使用整数存储 Unix 时间戳效率高,尤其适合排序和系统间传递,但直观性不如日期时间格式。 文章链接:
ginobefun
6个月前
感觉自己像颗快被拧坏的螺丝,疲惫、迷茫,甚至有点暴躁?这往往是内心在呼唤:嘿,我们该换个活法,找回真正的自己了。心理咨询师陈海贤老师说,这种感觉,往往是因为我们“丢失了旧的自己”。别急,这里有10个心法,帮你重塑一个更自在、更有力量的新自我。 1. 讨厌的人?让他从你的世界“缩水”。工作中遇到让你“如上坟”般难受的同事或伙伴?别让他定义你的心情和选择。你讨厌他,这感受很真实,接纳它。但如果为了他,你连热爱的工作、晋升的机会都想放弃,那他岂不是“太重要”了?真正的“报复”,是让他变得无足轻重。你的舞台,你的精彩,远比他重要。他,不配占据你人生的C位。 2. 内心的苛责声太响?去“暖气片”旁边待着总觉得自己不够好,像有个声音在脑子里不停挑错?这多半是过往某个“权威”(如严厉的父母、老师)的声音内化了。那时你小,不得不听。现在你长大了,可以选择。怎么选?去找那些欣赏你、宽容你的人——你的“暖气片”。在他们温暖的目光里,你会慢慢学会宽容自己,让心里的冰碴子融化。 3. “躺平”还是“内卷”?别让选择题定义你的人生想休息又怕落后,想努力又觉疲惫,于是卡在中间,反复拉扯?我们都贪心,都“既要又要”。破局点在于:别把对一件事的态度(比如“我要躺平”或“我要奋斗”)上升到整个人生态度。享受闲暇时就全身心投入,工作学习时也全力以赴。人生是动态平衡,不是单选题。 4. 自卑感挥之不去?切换到“我们”频道老觉得自己不如人,像活在排行榜里,赢了短暂得意,输了就自卑?这是“排序思维”在作祟。试试切换到“联结思维”:把身边的人看作森林里的树,各有姿态,共同成长,相互支持。你不是孤军奋战的斗士,而是伟大生态系统里不可或缺的一员。为他人的优秀鼓掌,因为我们是“我们”。 5. 害怕犯错?“错”只是个路标,不是判决书怕自己做不好,怕别人做不好,心里总悬着一块石头?这种恐惧,往往源于对“对错”的执念。如果事情搞砸了,不代表“你不行”,只代表“这里有经验值得吸取”或“有人受伤了,需要安抚和解决”。把“错误”看作导航中的“前方转弯”提示,而不是“你已失败”的终点。 6. 内向是弱点?不,它是“深度思考”的静音模式。不爱说话,不擅交际,就觉得自己格格不入?内向的人,往往因为说得少,所以想得多。一旦开口,话语可能更有分量。如果你想和陌生人交流,不妨真诚点:“我有点内向,不太会聊天,但我很想认识你。”这份笨拙的真诚,有时比油滑的客套更能打开心扉。 7. 愤怒时想“爆炸”?先看看“炸”的目标是什么压力大到想对全世界发飙?其实,愤怒本身不是坏东西,它说明你还有反抗的能量,你的边界受到了侵犯。关键在于,发脾气是“方式”,不是“目的”。问问自己:我发火,到底想得到什么?保护自己?表达不满?还有没有更好的方式能达到这个目的? 8. 与父母的关系剪不断理还乱?立好“篱笆”,才能种好“花园”。一边觉得亏欠父母,一边又对他们满腹抱怨?试试两件事:首先,和父母之间要有清晰的“边界”。这道“篱笆”既保护你,也保护他们。有关爱和安慰,而不是无尽的纠缠和怨恨。其次,如果原生家庭没给够你想要的爱,那就学着“重新养育”自己,给自己那份缺失的爱。 9. 总为别人操碎了心?试着“演砸”一次。是不是觉得自己像个超人,照顾着所有人(父母、伴侣、孩子),他们反而乐得清闲?你的能干值得点赞,但也可能正是你的“无所不能”,让他们变得“无能”。试着“放手”,允许自己“手忙脚乱”一下,别把所有事都扛起来。当你不再是大包大揽的“家长”,他们才有机会长大,成为真正的“伙伴”。 10. 失去旧我,才能“孵化”新我。那些痛苦的经历、迷茫的情绪,让你感觉失去了自我?恭喜,这正是转变的开始。重要的东西,往往在失去中孕育。旧模式像一个“壳”,破壳而出虽然痛苦,却是成长的必须。你心中的那些“为什么”、“怎么办”,就是引领你探索的北极星。保留旧自我里最珍贵的核心(那是种子),用它去培育一个更真实、更强大的新自我。 希望这10个“心法”能像一缕清风,吹散你心头的一些迷雾。找回自己,不是回到过去,而是勇敢地走向一个更整合、更自由的未来。记住,你远比你想象的更有力量。端午安康,愿你享受假期,更享受成为自己的旅程。
ginobefun
6个月前
#BestBlogs 超越 GoF:现代 AI 系统实用设计模式 | InfoQ 中文 文章探讨了超越 GoF 的现代 AI 系统实用设计模式,涵盖提示、责任、UX、Ops 和优化等方面。 摘要: 文章指出,现代 AI 系统面临传统软件和机器学习模式无法完全解决的新挑战,因此需要专门的设计模式。 作者将新兴模式分为五类:提示和上下文模式(如少样本、角色、CoT、RAG),用于引导模型输出;负责任的 AI 模式(如输出防护栏、模型批评者),确保输出安全可靠;用户体验模式(如上下文引导、可编辑输出、迭代探索),提升 AI 应用易用性;AI-Ops 模式(如指标驱动、版本控制),管理大规模 AI 系统的部署和运营;以及优化模式(如提示缓存、动态批处理、智能模型路由),提高效率和降低成本。 文章强调这些模式帮助标准化解决方案,提高开发效率和系统可维护性,并简要提及了微调、多代理等高级主题。 主要内容: 1. 现代 AI 系统需要区别于传统软件和 ML 的专门设计模式 -- AI 系统的行为受指令和上下文严重影响,带来新的挑战,需要标准化模式来解决已知问题,提高开发效率和维护性。 2. 有效的提示与上下文模式是引导 AI 输出的基础 -- 通过少样本、角色、思维链和 RAG 等模式,可以提高模型的推理、准确性、一致性,并减少幻觉。 3. 负责任的 AI 和用户体验模式是构建可信赖 AI 应用的关键 -- 输出防护栏、模型批评者确保内容安全道德;上下文引导、可编辑输出、迭代探索提升用户互动和满意度。 4. AI 系统的生产运营需要专用的 AI-Ops 和优化模式 -- 指标驱动的监控、提示 - 模型 - 配置版本控制、提示缓存、动态批处理和智能模型路由是管理大规模 AI 系统效率和成本的关键。 文章链接:
ginobefun
6个月前
想象一下,过不了几年,AI 智能体就像今天的 App 一样,无处不在。但别急着把它们看作手机里那些 App 的升级版,那样就太小瞧它们了。 大多数人眼里的 AI 智能体,可能还是个更聪明的工具,帮你订餐、规划行程,最多是个得力助手。但特赞创始人范凌博士和他的 ,给我们描绘了一个更激动人心的画面:AI 不再仅仅是听话的工具,它正在变成能模拟真人的“数字演员”。 那么,Atypica 和我们通常理解的 AI 智能体,最大的不同是什么? 打个比方: - 传统 AI 智能体 像个超级员工或“万能遥控器”。 你给它指令,它帮你完成任务、搜索信息、写代码,或者把不同工具串联起来提高效率。它的核心是做事和回答问题。就像一个聪明的助手,你问它“今天天气怎么样?”,它给你答案。 - Atypica 更像一群“虚拟用户”或“数字焦点小组”。 它不直接给你答案,而是用 AI 扮演出各种典型的用户。比如,你想知道年轻人为什么喜欢某个新潮饮料,会生成几个符合特征的虚拟年轻人,然后让另一个AI 专家去采访这些虚拟年轻人,问它们:“你为什么喜欢这个饮料?口感?包装?还是别的?” 通过这种方式,你能高效、低成本地听到大量“用户”的声音。 核心区别在于: 1、焦点不同 传统 AI 聚焦于解决问题、执行任务、提供信息(更像一个收敛的过程,找到答案)。 Atypica 聚焦于模拟人类、理解主观世界、洞察需求(更像一个发散的过程,探索可能性)。它要为主观世界建模。 2、角色不同 传统 AI 通常是回答者、执行者。 Atypica 可以是提问者(AI扮演专家)、被访谈者(AI扮演用户)。它让 AI 反过来向我们提问,或者模拟用户间的讨论。 3、价值不同 传统 AI 主要价值在于效率提升、自动化。 Atypica 主要价值在于商业洞察、创意激发、共情理解。它甚至欢迎 AI 的幻觉,因为那些意想不到的观点,可能正是打破思维定式的金钥匙,特别适合需要多元视角的商业决策或民意调查。 简单说,如果把传统 AI 比作给你鱼或者教你捕鱼的工具,那 Atypica 就是帮你创造了一个模拟的鱼塘,让你能观察和理解各种鱼(用户)的行为和偏好。它不再局限于工具层面,而是试图成为一面洞察人性和社会的镜子。 这种转变,就像我们以前用望远镜观察星辰(获取信息),现在我们开始创造一个个微缩宇宙(模拟系统)来理解宇宙的法则。 正是想用 AI 来构建人类主观世界的微缩宇宙,让我们更懂消费者,甚至更懂我们自己。
ginobefun
6个月前
ginobefun
6个月前
利用 AI 提取了播客中一些闪光的洞见,分享给大家 🔽 ------------------------------------------------------ 纷繁的世事中,关于金钱、欲望与幸福的迷思,常常困扰着我们。以下是从播客中淬炼出的几颗思想宝石,它们或许能帮助我们重新审视内心,找到更澄澈的生活之道: 一、“足够”的边界,由内心而非外界定义 查尔斯·费尼(Charles Francis Feeney)在拥有巨额财富后,主动定义了自己的“足够”,匿名捐出 80 亿美元,找到了内心的自由与平静。 与之对比,阿道夫·默克尔(Adolf Merckle)在损失部分财富后,尽管仍拥有 80 亿美元,却因无法摆脱“还想要更多”的执念而走向绝望。 也许真正的“足够”并非一个客观的数字,而是一种主观的认知状态。当“足够”由不断膨胀的欲望和外界比较来定义时,人会陷入无止境的追逐;当它由内心的需求和价值审视来定义时,则成为通往自由与平静的基石。 二、欲望的“被制造”与幸福感的“伊斯特林悖论” 现代消费社会不仅制造商品,更擅长制造“渴望商品的心”。我们购买的往往不只是物品的使用价值,更是其承载的符号与身份认同。 经济学家伊斯特林发现,虽然在同一时间点上富裕与幸福感正相关,但长期来看,国民生产总值的持续增长并未带来幸福感的同等提升,甚至可能下降,其原因在于“社会比较”和“享乐适应”。 我们许多“想要”并非源于真实需求,而是社会系统精心构建的结果。幸福感并非简单与物质拥有量成正比,它更深受社会比较和自身适应性的影响。警惕被制造的欲望,理解幸福的相对性,有助于我们从消费主义的符号游戏中解脱出来。 三、“雄心”与“贪婪”的一线之隔 追求目标的过程中,存在一条微妙的分界线。在此之前,我们由“雄心”(Ambition)驱动——好奇、热爱、自我成长、内在驱动;越过此线,则由“贪婪”(Greed)主宰——外部评价、攀比心、占有欲、排名。 区分驱动我们行动的根本动力至关重要。以雄心为燃料,我们能享受过程,获得内在满足;被贪婪裹挟,则容易陷入焦虑与迷失。无论是个人还是企业,在追求“更多”的路上,都应时常审视自己是否跨越了这条界限,Enough 在哪里? 四、注意力是我们最宝贵的隐形财富 “如果你总是需要查看点什么,那就算不上真正的富有。(If you are constantly checking something, you are not rich.)。” 真正的富足并非仅指物质财富,更关乎内心的自由与平静,以及对注意力的自主掌控。 无论是频繁查看股价、社交媒体点赞数,还是其他即时反馈,本质上都是在用外部信息确认安全感。 我们最稀缺的资源是注意力。将其从对外部评价的依赖和即时反馈的焦虑中解放出来,投入到真正珍视的事情、内在的成长与创造上,才能获得更深层次的富足感。 五、真正的美好,从不刻意寻求关注 (Beautiful things don't ask for attention) 查克·费尼匿名捐赠 14 年不为人知,以及电影《白日梦想家》中摄影师肖恩对待雪豹的态度,都体现了这一智慧。 源于内心的富足与美好,无需外界的聚光灯来证明其价值。当行动的出发点是纯粹的热爱与内在的指引,而非为了获取他人的赞赏或艳羡时,我们便接近了真正的自由。
ginobefun
6个月前
#BestBlogs Agent Infra 图谱:哪些组件值得为 Agent 重做一遍? | 海外独角兽 深度分析 Agent Infra 四大核心赛道,探讨创业与云厂商机会。 摘要: 本文从投资视角出发,对新兴的 Agent Infra(Agent 基础设施)领域进行了全面的图谱分析,将其划分为 Environment、Context、Tools 和 Agent Security 四大核心赛道。 详细阐述了每个赛道的价值、关键技术(如 Sandbox、Browser Infra、RAG、MCP、Memory、Search、Payment、Backend Workflow)以及值得关注的初创公司。文章探讨了创业公司在 Agent Infra 领域的两大机会:在现有 Infra 中寻找 AI-native 需求,以及抓住 Agent 开发的新痛点。同时,附录总结了主要云厂商(AWS, Azure, GCP)在这些领域的布局,指出当前云厂商的产品多源自传统 Infra,Agent-native 产品相对缺乏。整体为技术从业者和投资者提供了 Agent Infra 领域的全景视图和潜在方向。 主要内容: 1. Agent Infra 是 Agent 落地的关键,涵盖开发到部署全生命周期。 -- Agent Infra 是 Agent 从概念走向实际应用不可或缺的支撑体系,提供 Agent 执行任务所需的计算环境、信息、工具和安全保障。 2. Environment 和 Context 是 Agent Infra 的核心赛道。 -- Environment 为 Agent 提供运行容器(Agent-native computer),Context 为 Agent 提供记忆和知识,是 Agent 有效规划和行动的基础。 3. Tools 层正快速扩展,搜索和金融工具尤为值得关注。 -- Agent 需调用各类工具完成任务,特别是搜索和支付,Agent 经济出现新商业模式,需要专属支付工具和交易网络。 4. Agent Security 机会需待 Agent 生态成熟后涌现。 -- Agent 安全需从静态权限转为动态意图分析,但 AI-native 安全 Infra 是需求驱动,尚处早期,老牌安全厂商主导。 5. 创业公司机会在于寻找 AI-native 需求和抓住新痛点。 -- 创业公司可在现有 Infra 中寻找 Agent 特有的高性能需求,或开发易用性高、降低开发门槛的新 Infra 产品。 文章链接:
ginobefun
6个月前
#BestBlogs 一文带你 "看见" MCP 的过程,彻底理解 MCP 的概念 | 阿里云开发者 深度解析 AI 上下文协议(MCP),对比 RAG 与 Function Calling,并通过实践演示理解其工作流程。 摘要: 文章详细介绍了模型上下文协议(MCP),一个旨在标准化 AI 助手与外部系统连接的开放标准。作者首先回顾了 RAG 和 Function Calling 等相关概念,阐述了它们与 MCP 的联系和区别。接着,文章深入讲解了 MCP 的核心组件(主机、客户端、服务器)及客户端-服务器架构,并对比分析了 MCP 相较于传统 API 在动态适应性方面的优势。随后,文章通过 ModelScope 的 MCP 市场和 Cherry Studio 客户端,一步步演示了 MCP 的实际配置和调用过程,通过开发者模式让读者“看见”并理解模型选择工具并请求服务器的数据交互流程。最后,文章总结了 RAG、Function Calling 和 MCP 在借助外部工具增强大模型能力上的共同本质。 主要内容: 1. MCP 是连接 AI 助手与外部数据/工具的开放标准 -- 模型上下文协议(MCP)由 Anthropic 开源,旨在为 AI 模型访问内容、工具提供标准化的“USB-C”式接口,提升 AI 应用的互操作性。 2. MCP 采用客户端-服务器架构,组件包括主机、客户端、服务器 -- 主机提供 AI 交互环境,客户端运行于主机内与 MCP 服务器通信,服务器暴露工具、资源、提示等功能,实现结构化互动。 3. MCP 通过动态能力描述克服传统 API 硬编码问题 -- 客户端能查询服务器当前功能并动态适应,无需硬编码参数变更,提高了 AI 应用与外部系统集成的灵活性和稳定性。 4. RAG、Function Calling、MCP 本质都是增强大模型外部能力 -- 这几种技术殊途同归,都是为了让大模型能够获取外部信息或使用外部工具,以完成更复杂、更准确的任务。 5. 通过开发者工具可“看见”MCP 调用的实际过程 -- 文章通过工具演示,展示了 AI 应用选择 MCP 工具、发送请求、接收结果,并最终由大模型生成回复的完整流程,增强体感理解。 文章链接: