#Elasticsearch

深夜说一个最近的感想 其实也不算新,还是老生常谈的一个话题“做 infra 的人必须要去贴近业务,否则一切都是空中楼阁” 我介绍过很多次鄙司是 AIGC 头部玩家,主攻二次元赛道。 我们最近面临的一个问题是 Elasticsearch 带来的。 我们用户公开发布的 Artwork 和生成任务都是可以搜索的。 最近 Elasticsearch 频繁会出现部分 Data Node 被打满然后连锁搜索出现问题的情况。 那么我们需要去怎么样快速的解这个问题? 在进一步讨论之前我们需要思考在这个场景下,搜索这个操作的本质是什么? 我的看法是资产管理。在 AIGC 场景下,Prompt 毫无疑问是用户的核心资产,而对应的 Task 以及 Artwork 某种意义上算是资产的预览(or 属性) 那么有了这样一个推论后,我们便能清晰的知道,至少在目前的形态下,业务核心属性必然不能为了技术结果让步。 同时我们又有一个观察,我们用户公开发布的 Artwork 其的可见性和 Task 是不太一样的,Artwork 可公开检索,也会承担 SEO 的责任,而 Task 实际上仅用户可见。那么换句话讲,两者的数据的访问频率,资源需求都是不太一样的。 换句话说,我们对 ES 的 Index 存在了多租的需求。但是很遗憾,按照目前的 ES 的设计,是不具备多租的能力的。 虽然长远来说,优化查询会是一个必然的选项,但是在当下面对超高速发展的业务,拆分 Index 为不同的集群,按照 Index 不同的属性给不同的算力/磁盘,快速试错会成为我们的首选。 目前这项工作正在进行中,效果未知,但是整个思考博弈的过程其实是我前几年会很少考虑的。很多时候技术的最优解未必是业务的最优解。 最后的最后,再打一个广告。鄙司招人,ML Engineer,ML Data/Full Stack/Backend/Marketing 等职位虚位以待。如果你想一起做一些有趣的事情,欢迎 DM,帮你老板直达
ginobefun
2个月前
#BestBlogs 基于 Elasticsearch 创建企业 AI 搜索应用实践 | InfoQ 中文 文章基于 QCon 演讲实录,深入探讨了在智能时代,如何利用 Elasticsearch 构建企业级 AI 搜索应用,尤其强调通过结合大模型和 Elasticsearch 的技术,有效规避大模型幻觉。 文章首先阐述了语义搜索的需求及传统搜索的局限,引出向量搜索的必要性。接着,详细介绍了 Elasticsearch 对密集向量和稀疏向量的支持、其向量搜索架构、操作步骤及混合搜索(RRF)机制。文章还重点讲解了 Elasticsearch 在性能优化(如量化技术、GPU 加速、并发查询)和未来 Serverless 架构上的创新。最后,通过 RAG、Agentic RAG 和 HyDE 等方法,结合 Elasticsearch 的多路召回能力,展示了如何实现更精准、高效的企业搜索实践。 主要内容: 1. 结合传统与向量搜索的混合搜索能显著提升 AI 搜索精度 -- 传统关键词搜索与语义向量搜索各有优劣,通过 RRF 等机制融合两者的优势,可有效提高召回率和搜索结果的精准度。 2. Elasticsearch 通过多项技术创新支持高效、可扩展的 AI 搜索 -- 文章介绍了 Elasticsearch 在密集/稀疏向量、量化、GPU 加速、Serverless 架构等方面的进展,为大规模 AI 搜索提供了坚实基础。 3. RAG 结合 Elasticsearch 可有效解决大模型幻觉问题并优化企业搜索 -- 利用 Elasticsearch 作为外部知识库,通过多路召回、Agentic RAG 和 HyDE 等策略,为 LLM 提供实时、准确的上下文,规避幻觉,提升企业搜索实用性。 文章链接: