时政
财经
科技
虚拟货币
其他
登录
凡人小北
关注
统计数据
34
文章
0
粉丝
0
获赞
117
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
凡人小北
2个月前
推荐个好东西:火山引擎的 PromptPilot。 之前看 Google 的提示词白皮书,有个点让我印象很深: 他们直接用 Google Doc 管理 prompt,写任务、版本、评估效果。 那时候我就在想,有没有人真把这事儿做成一套完整系统? 现在看到火山这套,有点意思了。 它不只是“帮你写好提示词”,而是把这事儿当作工程问题来解的。 最打动我的,是它在 prompt 优化这件事上做得极其系统,甚至有点狠。 ✅ 从任务出发构造 prompt(带结构、带变量、不是拍脑袋) ✅ 每一版 prompt 都挂着独立评测集 + 自动评分机制 ✅ 没有理想答案也能比对打分(GSB 模式) ✅ 每轮迭代都能 trace 效果,版本可控、可回溯 我们之前做客服对话调 prompt,最常见的就是“改了一句,但说不上来到底有没有变好”。 很多时候上线的版本其实就是“看着还行就先上”。 现在它是:“打一套样本集,系统直接帮你跑出哪一版效果稳定”。 我一直坚持: 模型越强,对 prompt 的要求只会更高。 尤其是在多轮任务、复杂场景里,prompt 不只是“写得好”,而是“是否可控、可管理、可进化”。 PromptPilot 解决的,是这个底层问题。 它不仅能让 prompt 生出来,更重要是——能持续改下去。 版本有 trace,样本能评分,逻辑能反推,工具还能外接, 整个就是“prompt 的 AutoML + GitOps” 一体化工具链。 顺带说一句:这是 2025 火山引擎 FORCE 大会上刚发布的产品,免费版和 Plus 版都开放,9 月前能直接上手全功能体验。 现在市面上很多 prompt 工具做的是“编辑器 + 改写器”, 但你会发现,真正上线之后需要的是一整套治理机制。 PromptPilot 是我目前看到国内第一个跑通这个闭环的, 不是 fancy 的界面,而是认真在解决 prompt 系统演化能力这个问题。 如果你也在做 AI 应用落地,推荐你认真研究一下。 要说缺点:自定义模型没找到海外模型,差评!
#火山引擎
#PromptPilot
#Google doc管理
#Prompt优化
#提示词白皮书
#工程问题
分享
评论 0
0
凡人小北
2个月前
两年前大家还在说 LLM 冲击 NLP,短短两年,连推荐工程师都被大模型盯上了。这事搁 2023 年初讲,根本没人信。 以前觉得推荐是个高度结构化、强依赖特征工程的领域,离语言模型还远着呢。结果 Grok 直接把离散特征的老一套逐渐边缘化。 我们正目睹专业系统向通用模型迁移的拐点。 大模型让推荐系统第一次有了深度理解用户的可能。冷启动、长尾、兴趣迁移这些经典难题,通通能在 embedding + context window 里原生解决。 这两年你也能看到,谁能把业务问题用语言说清楚,谁就能让 LLM 为你打工。 语言表达能力、逻辑思维能力等通识教育这些看似“软”的技能,它们在这个时代越来越像是硬通货。 能不能把结构化问题抽象成语言?能不能把复杂场景 prompt 成可学习的上下文?这些才是大模型时代的关键壁垒。 还是之前的观点,这个时代最值得培养的能力: - 用逻辑框架推导问题本质的能力; - 用清晰语言组织复杂知识的能力, - 用通用模型重构专业系统的能力。 不要再去死磕某个小框架的最佳实践了。
#LLM
#NLP
#推荐系统
#大模型
#Grok
#通用模型
分享
评论 0
0
凡人小北
2个月前
搞 AI 的不写 Python?现在真不是笑话了。 最近越来越明显——在 AI 应用领域,TypeScript 正在一点点蚕食 Python 的霸主地位。 过去你说搞 AI 的,十个有九个写 Python,模型、数据处理、训练、部署,一条龙服务。 但现在越来越多场景变了:不是“训练 AI”,而是“用 AI”。 用 AI 干嘛?做产品、做 UI、做交互代理、搞插件、接入 SDK… 这些一落地,就全是 TypeScript 的主场。 说几个已经发生的和正在发生的事情: 1️⃣ LangChain 和 LangGraph 现在已经有了 TypeScript 支持,能直接跑在浏览器、Node.js、Cloudflare Workers 上。写 agent、接工具、搞多轮对话,在 TS 世界里越来越丝滑。 2️⃣ OpenAI 的 Assistants API 也不给 Python 独宠,今天还贴心地发布了 TS 版本的 Agents SDK。 3️⃣ JetBrains 的统计显示,TypeScript 使用率从 2017 年的 12% 涨到 2024 年的 37%。在企业里,TS 已经不是前端才用的语言,而是你要做 AI 产品就得学的语言。 这些不是趋势预测,而是已经在开发现场发生的事实。 技术栈正在迁移。你要构建个 AI Copilot、Web 插件、对话助手,Python 行不通。 TypeScript 天然和 UI、API、用户互动贴得更近,类型安全又稳,越来越多团队把它当默认选项。 而且别忘了,过去十年,前端其实一直在默默吞噬后端的地盘。 这波 AI 应用化,刚好又给了前端一记重拳,原来你以为是写页面的,结果人家直接搞起 AI Copilot 了。 再看看 Python 那边,Streamlit、Gradio 这些本该承担AI UI 桥梁的工具,一个不争气,一个半死不活,完全没接住这波热潮。 我看了看趋势,有点慌了……我要去学学 TS 了。 以前是“全栈前端”说说而已,现在是真的“前端越来越吃香了”。 但要冷静两秒(防杠专区): 1️⃣ Python 依然是 AI 训练和科研的王者,PyTorch、TensorFlow、scikit-learn 这些生态太厚实了,训练大模型你离不开它。 2️⃣ TS 在底层 AI 能力上还没那么能打,GPU 加速、模型优化这些,暂时还得靠 Python 打底。 但是,现在 AIGC 丰富的是应用的生态,相比做模型的人,做 AI 应用的人数万倍了吧。 最后,非要有个定位的话,Python 搞理论和模型,TypeScript卷体验和交付。 TS 正在从应用这一层切入,把 AI 真正推向了每个 Web 页面的角落。 爆款 AI 产品,正在越来越多的全栈 TS 了。
#AI开发
#Python
#TypeScript
#AI应用
#编程语言趋势
分享
评论 0
0
凡人小北
3个月前
Google 最近有点疯。I/O 刚甩出一堆 AI… 结果这两天,我在 GitHub 看到它又丢了个狠东西: Gemini Fullstack LangGraph Quickstart 我原本以为是那种“又一个 AI demo 项目”,结果一跑…靠,这套结构直接能改成一个 Perplexity mini。 从提问 → 拆 query → 多轮搜索 → 反思 → 再查 → 带引用输出,整个 agent 流程都封装好了。 Google 又开始搞开源慈善卷行业了,连“智能体该怎么搭”都明牌教学了。 1️⃣ Google 一贯的严谨做派,这次不是 demo,是开箱即用的智能体原型系统 你打开项目,会看到它把整个 fullstack 都搞定了: •React + Tailwind + Shadcn 前端,页面是能用的,不是糊的 •FastAPI + LangGraph 后端,整合 Gemini 2.5 •一键 make dev 起飞,Docker Compose 打包也顺 •自带 UI,整个 agent 的“思考过程”能 trace、能 stream、能调 这种项目不是跟最近看到的 openxxx 类项目一样给你看个思路,你照着能跑。 2️⃣ 很典型的 Agent 流程,查资料、思考和总结 你提个问题 → 它拆几个搜索关键词 → 查 → 看信息够不够 → 不够就再查一轮 → 然后整理、生成、引用都给你带上 基于 LangGraph 搞了一个结构化思考流程落地。 3️⃣ 整套配得非常舒服,能上产品原型的那种 做了一整套: •UI 是现成的,查完结果也展示得明白 •回答里每条 citation 是 traceable 的 •开发体验很丝滑,前后端热更新都有 •Agent 逻辑清晰,graph. py 里面节点你一看就懂 这就属于你改个 search API、换套 prompt,几天就能变成一个 vertical agent demo 拿去 pitch。 4️⃣ 当然它也有边界,但不影响当范本看 毕竟是个 quick start,比如: •只接了 Google Search,没知识库整合 •Reflection 是 prompt 层搞的,不是 policy 控制 •Loop 是写死的 max_round,不够聪明但足够控制 但这些反而是好事儿。因为你想改的地方都能改,想替换的接口都开着。不像很多项目写得很花但你根本下不了手。 5️⃣ 如果你是这几类人,我建议你现在就 fork: •想做 research agent,但又不想从头糊起的人 •想理解 LangGraph 到底怎么 orchestrate 的开发者 •做 AI 项目但每次写完 prompt 总觉得 agent 是假的 你想做 AI 工程,就应该研究这种结构通顺、流程稳定、代码能复用的项目。 自己动手跑一遍,比看十篇如何构建智能体的帖子都值。算是站在巨人的肩膀上 vibe 了。
谷歌Deep Research:AI操作系统雏形?· 58 条信息
#Google
#Gemini Fullstack LangGraph
#AI Agent
#开源项目
#智能体原型系统
分享
评论 0
0
凡人小北
3个月前
很丢脸的事情,算法十年+的工程师模型结果竟然败给了实习生,83% 准确率对 93% 准确率。 工程师已经在这个项目上干了两周多,结果被只做了两天的实习生比下去了。 摆在那里的,是多年经验积累的工程师,靠的是调参的直觉、架构的偏好、过去项目的套路。 而实习生,几乎是无招胜有招,大胆尝试新方法,效果就这么炸出来了。 经验主义 vs 新事物拥抱能力,在这个案子里碰撞得清清楚楚。 你不得不承认,模型这行,更新太快了。 很多时候经验值不是护身符,而是思维惯性。 你以为你在优化,其实是在拿旧地图找新大陆。 这不是在否定经验的价值,而是在提醒我们别被它绑住手脚。 真正该留下来的,是持续试错、拥抱变化的肌肉记忆。 这事,很打脸,但也很提醒人。 对我自己,对团队,对我们整个行业。
#经验主义
#新事物
#工程师
#实习生
#算法准确率
分享
评论 0
0
凡人小北
3个月前
OpenAI 在集齐生态,Google 在改造生态,他们两家都有光明的未来。 两家走的是两条很不一样的路,但都在朝着“AI 终局平台”逼近。 OpenAI 在集齐生态: 收硬件(io)、补数据库(Rockset)、强工具链(Windsurf)、搞远程协作(Multi)…… 像在组装一台全栈 AI 战舰,每块拼图都瞄准关键节点,走的是“从无到有”的路径。 Google 则在改造生态: 让 Gemini 深嵌搜索、安卓、Docs、YouTube,甚至改写浏览器、操作系统底层,不是外挂 AI, 而是把原有体系打造成 AI-native 的新容器,走的是“旧我换血”的路线。 创业公司在组建军团,帝国在自我重建。 但不管是哪条路,本质都是在争那个未来的“主操作系统”位置。
#OpenAI生态
#Google生态
#AI终局平台
#硬件
#数据库
#工具链
#远程协作
#全栈AI
#组装
#改造
分享
评论 0
0
凡人小北
3个月前
Gemini 太懂现代人了! 上线了个狠活:你看完深度报告,它直接给你出题考试。 专治:你以为懂了,其实根本没懂。 别小看一个 Quiz,这其实是 AI-native 学习系统的一块重要拼图: 学→考→补→再学,全闭环,全自动。 AI 时代的学习,不是看得多,是你有没有能力复用知识。 Quiz,就是在训练你这个能力。
#Gemini
#AI学习
#深度报告
#自动化学习
#Quiz
#知识复用
分享
评论 0
0
凡人小北
3个月前
建议大家,别在简历里写“熟悉 RAG”了,或者面试前好好学学。 我面试过不少人,说熟悉 RAG,结果一问就穿帮。 RAG 绝大多数工程师只碰到前半段: 拿个 LangChain,上个向量库,把 chunk 和 embedding 丢进去跑个检索; 看起来跑通了,实际啥也没掌握。 但只要你简历上写了,面试官就会问你下面这些(当然不写也不一定逃得过): - chunk 是怎么切的?固定?语义?还是自适应? - embedding 模型选型和维度怎么来的? - rerank 用没用?怎么融合 BM25 和 dense 检索? - prompt 是你写的吗?有没有评估 hit rate、hallucination? 说实话,不是算法出身的人,如果没系统做过推荐系统或者检索优化,很多人说不清。 RAG 的前半段几乎就是推荐系统那套召回 + 排序 + 精排的逻辑: embedding = 向量化特征建模 检索 = 多路召回 rerank = 打分排序 但后半段还多了 prompt 设计、上下文拼接、生成模型行为控制这几个大坑。 所以我劝一句: RAG 真不是写个向量库调用就叫“熟悉”。写了,面试官只会当你能答全链。 别轻易说“熟悉”或“掌握”,你扛不住问。
谷歌Deep Research:AI操作系统雏形?· 58 条信息
#RAG面试
#LangChain
#向量数据库
#检索优化
#prompt设计
分享
评论 0
0
凡人小北
3个月前
这场 AI 大战,终于从谁会造刀卷到了谁能杀猪。 SaaS 的故事讲效率,AI 的下半场只讲结果。 不拼功能,不卷模型,而是看谁能跑完任务、闭上利润闭环。 这不是一轮产品升级,是一场价值重构。 红杉 AI 你们峰会的一些观点,值得经常翻出来咀嚼:
#AI大战
#saas
#AI下半场
#红杉峰会
#价值重构
分享
评论 0
0
上一页
1
2
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞