时政
财经
科技
登录
#语义搜索
关注
GitHubDaily
2周前
又发现一个很强的 MCP 服务器:Chrome MCP Server,基于 Chrome 插件,直接让 AI 助手控制我们的浏览器。 实现复杂的浏览器自动化、内容分析和语义搜索等场景,并且能保持我们的登录状态和浏览器设置。 GitHub: 主要特性: - 使用我们原本的浏览器,保留所有配置和登录状态 - 完全本地运行,保护用户隐私和数据安全 - 支持截图、网络监控、内容分析等 20+ 种工具 - 智能语义搜索,AI 驱动的标签页内容发现 - 跨标签页操作,实现复杂的浏览器自动化 - 书签和历史记录管理,支持智能搜索和分类 - 表单填写和页面交互,模拟键盘鼠标操作 此外,比 Playwright 方案资源占用更少,响应更快。先通过安装其提供的 Chrome 插件,然后在 Claude 桌面客户端上配置 MCP 即可使用。
#MCP服务器
#Chrome插件
#AI助手
#浏览器自动化
#内容分析
#语义搜索
#隐私保护
#GitHub
#网络监控
分享
评论 0
0
Geek
2周前
更为强大的 Chrome MCP Server 一个基于 Chrome 插件的模型上下文协议 (MCP) 服务器,它将您的 Chrome 浏览器功能暴露给 Claude 等 AI 助手,实现复杂的浏览器自动化、内容分析和语义搜索等。
#Chrome插件
#模型上下文协议
#MCP服务器
#AI助手
#浏览器自动化
#内容分析
#语义搜索
分享
评论 0
0
ginobefun
3周前
#BestBlogs RAG 技巧与底层代码剖析 | 阿里云开发者 使用 Python 基础库从零实现 RAG 内核,深入剖析文本分块、语义搜索及上下文增强技巧。 摘要: 本文旨在通过手写代码的方式帮助读者深入理解 RAG 的工作原理,避免过度依赖现有框架。 文章首先展示了使用 Python 基础库实现简易 RAG 系统的过程,包括数据导入、固定长度文本分块、Embedding 创建和基于余弦相似度的语义搜索,并提供了代码示例。接着,详细介绍了基于语义的文本分块方法,对比了其与传统方法的优势,并阐述了百分位法、标准差法、四分位距法等切分点判定策略,同样给出了基于语义分块的代码实现。最后,文章引入并实现了“上下文增强检索”技巧,即在检索到最相关文本块的同时包含其前后相邻块,以提供更丰富的上下文信息给语言模型,从而提升回答质量。通过代码实践,文章有效地揭示了 RAG 的核心逻辑和关键优化方向。 主要内容: 1. 手写 RAG 核心模块有助于深入理解其工作原理。 -- 通过仅使用 Python 基础库和常用科学计算库实现 RAG 流程,能更清晰地掌握从数据处理到响应生成的底层逻辑。 2. 语义分块比固定长度分块更能捕获完整语义单元。 -- 基于句子间语义相似度进行智能切分,能有效避免语义割裂,提高检索到的上下文质量和相关性。 3. 上下文增强检索能为 LLM 提供更全面的信息。 -- 在检索结果中包含相关文本块的邻近内容,能丰富大模型获得的背景知识,减少因信息不完整导致的回答偏差。 文章链接:
#RAG
#Python
#文本分块
#语义搜索
#上下文增强
#阿里云开发者
#手写代码
#工作原理
分享
评论 0
0
Viking
3周前
最近看到一个非常神奇的项目 MemVid ,彻底把我给惊到了 一个数据存储解决方案,但是它将文本数据编码为 MP4 视频文件,利用视频压缩技术,实现高达 10 倍的存储效率。 同时还内置了语义搜索,用户可以通过自然语言来进行数据的查询。 这个解决方案完全离线,直接拷贝这个视频文件哪里都可以用。 真的是非常有想象力,大家可以看看 Demo,不知道有没有类似这个的数据存储方案吗?我应该是第一次听说见到这样的方案。
#Memvid
#数据存储
#视频编码
#语义搜索
#存储效率
分享
评论 0
0
Cell 细胞
3周前
Memvid,很有意思的项目,将文本数据编码为视频,实现高效的 AI 记忆管理。 🎥 视频即数据库:将数百万文本片段存储在单个 MP4 文件中。 ⚡ 快速语义搜索:支持自然语言查询,检索速度达到亚秒级。 💾 高效存储:相比传统数据库,存储效率提高约 10 倍。 🔌 离线运行:视频生成后可完全离线使用,无需依赖外部数据库。 📚 适用于数字图书馆、教育内容、新闻档案、企业知识库等多种场景。 🔗 项目地址:
#Memvid
#AI记忆管理
#视频数据库
#语义搜索
#存储效率
#离线运行
#数字图书馆
#教育内容
#新闻档案
#企业知识库
分享
评论 0
0
johann.GPT
1个月前
Cursor 是如何用 Merkle 树 + RAG 实现快速索引代码库? 💡 核心思路: 1️⃣ 本地用 AST 分割代码 → 构建 Merkle 树"指纹" 2️⃣ 只同步变更文件(增量更新,节省 90%+ 带宽) 3️⃣ 代码块 → Embedding 向量 → Turbopuffer 向量数据库 4️⃣ 用户提问 → 语义搜索 → 本地读取源码 → LLM 生成答案 🛡️ 隐私保护:源代码永远不离开本地,只有向量上传云端 ⚡ 效率爆表:Merkle 树让大型代码库秒级同步 🧠 智能理解:用 RAG 检索
#Merkle树
#代码索引
#RAG
#LLM
#隐私保护
#语义搜索
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞