时政
财经
科技
虚拟货币
其他
登录
Barret李靖
关注
统计数据
80
文章
0
粉丝
0
获赞
22901
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
Barret李靖
5个月前
最近看到了一个开源工具 Zotero,用了一段时间,感觉挺不错的,它是一个学术文献管理工具,支持一键导入论文、自动生成引用和参考文献、批注笔记和标签分类。 并且可以多端同步(桌面端、浏览器插件、移动端和网页端),让论文管理和检索变得非常轻松,文献下载后,也支持离线阅读和批注。 现如今“看论文”这项活动,已经不局限在学术圈,大厂的算法、工程师,包括产品经理也会关注最新的研究成果,很多创新和实践是可以直接被用到工业界的。 我过去两年看的论文数量就有一百多篇了,大部分是主题式学习,例如大模型基础、Prompt 优化、音视频处理、Agent 增强等等,但好多论文看了之后忘了名字也找不到了🥲,一直想搞个工具管理下,Zotero 基本可以满足需求。 另外再推荐一个 github 项目,zotero-arxiv-daily,这是一个基于 Zotero 的自动论文推荐器,它会根据你已有的文献偏好每天从 arXiv 获取最新论文,通过语义匹配和摘要生成筛选出高相关内容,并以邮件形式推送,非常适合想要持续跟进前沿研究的人。
#Zotero
#文献管理
#论文推荐
#学术研究
#效率工具
分享
评论 0
0
Barret李靖
5个月前
看到一个可以将文章直接转换成 PPT 演讲的工具,Paper2Video,一篇文章+一个头像+一段语音样本,它就能帮你生成一个生动的演讲解说视频。对于偏专业和学术性的场景,这个工具几乎能承担起人工完成的工作,做学术汇报和做课程的朋友有福了😄 仔细阅读了源码和论文,它的实现方式颇为精妙,整个 PPT 的渲染,主要基于 Beamer 这个声明式布局框架: 1)首先让大模型对内容做一次通篇的解说,并做好摘要分段,确保能够把核心知识表达清晰; 2)对于每页 PPT 的布局,通过视觉模型判断是否存在溢出、错位、拥挤等情况,如果存在类似的问题,就会让布局模块生成多套拼接方案,对图片和文字进行缩放后进行不同组合,再由视觉模型从中挑选出最优的一张; 3)过程中还添加了一个虚拟鼠标,方便捕获观众的注意力,也让整个呈现更具动态感与交互感; 4)口型采用的是 Hallo2,这是一种支持长时长、高分辨率、音频驱动的人像动画模型,能够让头像与语音同步地做口型/表情动画。 这个工具主要解决的还是论文汇报场景,不过有几个思路值得借鉴,包括如何将文章内容做拆解、如何做好 PPT 排版,如何做好口型等。 稍微改改,应该也能适配到更大众化的领域,例如做自动培训视频、技术方案的交互式解说,甚至产品手册的可视化呈现,把 Paper2Video 升级成 Doc2Video。
#Paper2Video
#PPT生成
#AI工具
#学术汇报
#自动化视频
分享
评论 0
0
Barret李靖
5个月前
维权没啥特别经验,我只知道一个原则,别事事只为自己,想一想问题的普遍性,去寻找更大的问题,同时为最大的问题找到责任方和监管方。 租车的商家想坑点钱,这没啥错,但不能狮子大开口,否则就会出现行业乱象,最恶劣的那波人都会冲入平台;难道平台不知道这类问题么,他们知道,但考虑到 ROI,他们会在“非关键”环节减少投入,例如租车价变更的审批、预扣款的审批等等,这些环节重要但也容易产生沟通纠纷。 这次糟糕的租车体验,一定有平台的疏于管控,有可能是缺少对商家的培训和教育,有可能是缺少对流程的优化,也可能是业务流程过于非标导致治理困难。因此投诉,首先要找到平台的问题。 那平台为什么会出问题?一个行业,只要发展成熟,就会出现对应的监管部门,例如快递,十多年前是没有针对快递的监管部门的,因为乱象太多,后来专门成立了这个部门。监管部门有责任和义务应对行业乱象,因此投诉,一旦受阻,应该即刻去找监管部门。 投诉的要点是什么?不是我被坑了多少钱,而是平台缺少哪些标准化的流程和监管机制,因此才出现问题,然后我才被坑,投诉的要点一定是朝着平台规范化治理去的。你试想一下,那些政府部门的人想拿到好的结果,是不是也得有几个真实 case 可以切入进去,才能做出改变。 当然,最终的鞭子肯定会抽到作恶的商家头上,如果只是要个人赔偿,那么让商家感受到平台客服、平台治理和政府监管的多重压力,同时让他们意识到自己在法律的边缘游走,这事儿基本就成了。但如果需要平台认错,让他们发生变化,还得靠朋友们一起花时间去斗争。
#维权
#平台监管
#行业乱象
#消费者权益
#标准化流程
分享
评论 0
0
Barret李靖
5个月前
跟携程的维权有了阶段性结果,平台跟我沟通,说不收我钱了,扣款全部退还。我没接受。 之前一位客服沟通话术就是各种“对不起”,“不好意思,我们无权处理”,我让他换个好意思、有权限的人来沟通。 我购买的平台保险未覆盖停运费,该赔的还是要赔,但平台需要给我支付精神损失和维权时间成本(可以商量),同时平台应该对违规商家做治理和公示,并做好自查改进工作。 跟 ChatGPT 一起办案,列举了平台和商家存在的系列问题(初步整理),平台在事前、事中和事后处理都很失败,商家就懒得吐槽了,他们纯粹就是为了坑钱。 接下来,给他们先发个律师函试试?
#携程维权
#退款争议
#平台责任
#精神损失赔偿
#律师函
分享
评论 0
0
Barret李靖
5个月前
最近两年 AI 的发展,😂,太生动了!
#AI
#发展
#生动
#积极
分享
评论 0
0
Barret李靖
5个月前
携程越来越像一家诈骗公司了。国庆租车五天花了一千八,其中包含三百的全额保险费。 路上不小心刮擦了一点点😅,结果还车时却要收取四天两千二的停运费,真是离谱到家,要知道低峰期日租价格才一百多呢,还有一个小小刮擦要修四五天,撕逼的时候给我乐笑了。 更有趣的是,第一天取车,还想着线下骗保,说交七百,若有车衣刮擦和停运费等都可免。我长得这么好骗么🤣 投诉携程的时候,他自己一口一个商家行为不合规,结果还是让事情发生了。后面又投诉了消协、交通委和市长热线,看看这次的维权成本和效果如何。
#携程租车
#租车诈骗
#消费维权
#停运费
#差评
分享
评论 0
0
Barret李靖
5个月前
推荐学习下微软搞的这个 R&D-Agent 框架, ,它是一个让 AI 能够自己做科研的系统——能提出问题、设计实验、验证结果、总结规律,整套科研流程都能自动化执行。 微软还基于这套框架,构建了一个用于量化投资研究的智能体 R&D-Agent(Q),,并与开源量化平台 Qlib 结合,实现了自动化因子挖掘与策略优化。照这个趋势发展下去,未来的量化研究,恐怕真得交给 AI 来操盘了,😅 R&D-Agent 的整体架构分为两个阶段:研究阶段(Research Phase)和开发阶段(Development Phase)。研究阶段由四个部分组成:规划、探索路径结构、推理管线和记忆上下文,它们通过反馈机制持续循环,不断在假设、实验与分析之间往复,让系统在多轮探索中自动调整方向、积累知识、优化策略;开发阶段则承接研究成果,主要包括编码工作流与评估策略,前者把想法变成可执行代码,后者负责验证与对比结果,确保系统演化出的改进真实可靠。两个阶段形成首尾相接的闭环,让科研过程实现持续反馈与自我进化。 从本质上看,R&D-Agent 不是在“模拟科研”,而是在“系统化科研”。它让科学探索从线性的人力流程,转变为并行的智能网络。每一次假设的提出与验证,都会被记录下来,形成一份不断扩展的知识图谱,让科研活动变得可编排、可追踪、可积累。 相关论文:1)《R&D-Agent: An LLM-Agent Framework Towards Autonomous Data Science》, ;2)《Qlib: An AI-oriented Quantitative Investment Platform》,
谷歌Deep Research:AI操作系统雏形?· 145 条信息
#微软
#R&D-Agent
#AI科研
#量化投资
#自动化
分享
评论 0
0
Barret李靖
5个月前
软件开发里有一种叫 TDD(Test-Driven Development)的方式,简单讲,就是先写好测试用例,然后再写程序。每写一部分代码就立刻跑对应的测试,看能不能通过。能通过说明实现符合预期,不通过就说明有 bug。TDD 的好处在于,它让整个研发过程可验证、可回归,也让开发变成一种持续的反馈循环。 AI 的发展其实也像是在做一场巨大的 TDD,只不过测试用例变成了数据集(Dataset)。每一次模型迭代,本质上就是在跑新的单测(Benchmark)。MMLU 测知识广度,GSM8K 测逻辑推理,HumanEval 测编程能力,AIME 和 MATH 则测严谨的数学推理。每个 leaderboard 都是一张 AI 世界的成绩单——DeepSeek 在数学推理上用 GSM8K 打出好成绩,Manus 则靠打榜多模态任务的数据集 GAIA 崭露头角。这些 Benchmark 像是模型进化的里程碑,每一代 AI 都得交卷。 2025 可以说是智能体(Agent)元年,模型不再只靠会算、会说来评估,而是要能动手。要让一个 Agent 真正好用,光靠写 Prompt、加检索、拼上下文是不够的,它得能使用工具,能执行 Python、Shell、SQL,能感知状态、理解任务依赖,更要能在反馈中调整自己的行为。评估 Agent 好不好用,也就不能只看单轮问答,而得看它能否完成一件真实的工作。 Anthropic 做的 SWE-bench 就是个典型例子,让 Agent 去修真实项目里的 Bug,看能否通过单测。OpenAI 的 MLE-bench 则更进一步,考察 Agent 在机器学习工程中的执行力,从读数据、清洗、编程、训练,到收集指标、分析再改进,形成一个完整的闭环。社区里还在探索更复杂的测试,比如 App-bench,看 Agent 是否能独立开发一个 Web 应用,从前端到后端再到部署上线;或者 Ops-bench,让它去处理运维任务,比如容器编排、日志分析、系统回滚。这些都在考验 Agent 的真实工程执行力。 AI 的进步,正在从“能思考”走向“能执行”。TDD 让软件工程可验证,而在 AI 世界,Dataset 和 Benchmark 是创新的发动机。Dataset 定义了模型学习的方向,Benchmark 则刻画了行业标准与竞争格局。 未来的竞争,不再是谁的模型更聪明,而是谁的智能体更能干活。真正厉害的 AI,不一定语义最深、参数最多,而是那个能自己规划、自己验证、自己改进的 Agent。换句话说,AI 的未来不只是更聪明的脑子,而是更靠谱的手和脚,能想、能做、还能自己查错修正,这才是“用得上”的智能。
#AI
#tdd
#agent
#Benchmark
#智能体
分享
评论 0
0
Barret李靖
5个月前
脚本地址:
分享
评论 0
0
Barret李靖
5个月前
写了个“网页划词后生成卡片”的油猴脚本,QuoteSnap,我感觉 ChatGPT 的审美还是在线的,跟它结对编程一个小时就搞出来了,效果很不错。 脚本用法比较简单,在网页上划词后,连续按四次字母 c(或直接按 card 四个字母),就会弹出如图的分享卡片。支持更换主题色、编辑文字内容;支持将生成的内容转为图片复制到剪贴板,也可直接下载下来。
#油猴脚本
#网页划词
#QuoteSnap
#ChatGPT
#分享卡片
分享
评论 0
0
Barret李靖
5个月前
推荐学习:
分享
评论 0
0
Barret李靖
5个月前
如何找到一个好的研究方向,这对于研究生和博士生来说,是一件极其重要的事情,当然也包含在工业界从事学术和技术研究的人。它直接影响了研究产物的交付品质。 那什么样的研究才算“有价值”?又该如何让它的价值足够大?可以从三个角度来看。 1)创新性,说的直白一点,就是开脑洞。ResNet 开了一个“残差连接”的脑洞,Transformer 开了一个“注意力即一切”的脑洞,ViT 开了一个“把视觉当成语言建模”的脑洞。开脑洞也叫“挖坑”,只要坑挖得够大,填坑的事情完全可以交给别人。Transformer 论文的引用量达到十万之巨,可以想象有多少人进来“填坑”。 2)有效性,即学术或工业价值。好的研究必须能“跑得通”,不仅概念上新颖,还要在实验中奏效、在工程上落地。很多论文提出漂亮的理论,但没有可复现的结果,也没有能被行业采纳的路径,这样的创新是空中楼阁。 3)问题规模,它决定了研究的“杠杆”。如果问题只是微调参数、改良细节,那么影响力往往局限在局部最优;而当研究直击底层约束、改变范式,它的能量就能跨越领域。 好的研究方向,是在世界的噪音中找到一个“尚未被解答的确定性”,并用一套可验证的逻辑,让它从思想变成现实。
#研究方向
#创新性
#有效性
#问题规模
#学术价值
分享
评论 0
0
Barret李靖
5个月前
大部分网站都支持倍速播放,但基本最大只有 2x,在遇到枯燥无味的剧情和解说时,2x 显然是不够的~ 于是,我手撸了个 0.5~5x-16x 倍速的油猴脚本,放置在网页右下角,可便捷操作。为啥还有个 16x?因为我发现,广告也是可以被加速的😂,16x 约等于跳过广告了。 原理比较简单:定时监控 DOM 的变化,当遇到了 video/audio 标签时,就会展示右下角的控制器,然后通过标签的 playbackRate 属性来调整倍速。 P.S. 你也可以在油猴的配置里添加黑名单域名,避免打扰。
#倍速播放
#油猴脚本
#视频加速
#广告跳过
#网页工具
分享
评论 0
0
Barret李靖
5个月前
最近在 B 站又跟着李沐读了不少 AI 论文,再次推荐他的《AI 论文精读》系列, 论文的结构大多八股:摘要、引言、方法、实验、结论,一板一眼。但要把这样的内容讲得清晰易懂、让人愿意听下去,其实特别难。这考验的不是文笔,而是对问题本质的洞察力。 ResNet 是图像领域的奠基之作。李沐在讲这篇论文时,对它的写作风格评价很高——全文围绕一个核心思想:Residual Learning。简单一句话:别让网络从零学起,让它只学“差的那一点”。就是这个看似朴素的想法,改变了整个深度学习的训练方式。 他读论文的风格也值得学习,不啃细节,而是“扫一眼、圈重点、问问题”三步阅读,关注的不是论文细节本身,而是作者在面对问题时的思考路径。这种方式能让人更快地看透论文背后的逻辑,而不是被推导公式困住。 对作者来说,把简单的东西讲简单,把复杂的东西讲简单,都需要很深的功底。而对读者,要能抓住那个最核心的问题:“这篇论文到底想解决什么?”,当懂得用这种方式去读论文时,其实也在学习如何思考、如何写作、如何提炼本质。
#李沐
#AI论文精读
#ResNet
#深度学习
#思考方式
分享
评论 0
0
Barret李靖
5个月前
清理电脑时,找到了一个七八年前写的项目,为了将淘宝生态能力开放给 ISV,让 ISV 可以参与进来帮助商家把淘宝店铺体验做好,魔改了 VS Code 的源码,技术上做了非常多的定制化。 为了方便调试 Weex DSL 的端容器代码,把 Chrome DevTools 直接给集成了进来,修改了部分 CDP 协议,也实现了一个适配 Weex 语法的 LSP;还劫持了插件市场,允许自定义插件跑在 IDE 上,自定义插件会暴露更多 VS Code 的能力,比官方的插件 API 要丰富很多;登录体系也替换掉了,改成了淘宝登录。 AI Coding 火起来之后,看到了很多基于 VS Code 魔改的项目,例如 Cursor、Trae、Kiro、Windsurf 等等,最近在搞这方面研究的时候,发现之前写的好多文章,仍有很大的参考价值: 1、《VSCode 是怎么运行起来的?》, 2、《让 VSCode 在本地 Run 起来》, 3、《带你开发和调试 VS Code 源码》, 4、《解密 VS Code 断点调试的原理》, 5、《NodeJS的代码调试和性能调优》, 6、《VSCode 调试中 launch.json 配置不完全指南》, 当年改 IDE,是为了让人更高效;如今改 IDE,是为了让 IDE 更懂人。不过今天庆幸的是,你可能不需要学习这些知识也能把项目玩转起来,AI 对代码的理解力已经越来越强了,😄
#VS Code魔改
#淘宝生态
#ISV
#AI Coding
#IDE
分享
评论 0
0
Barret李靖
5个月前
人性的底色是求变,稳定只是阶段性的幻象,而变化才是常态。 唯有在变化过程中,迅速重建稳态,让情绪与行动跟上变化,才能走的更长远、更坚定。
#求变
#重建稳态
#情绪与行动
#长期发展
#积极
分享
评论 0
0
Barret李靖
5个月前
再好看的风景,看多了也会腻;人亦如此。真正的发现之旅,从来不是奔赴远方,而是重新看待近处。 换一个角度,哪怕是每天走过的路,也会看到不同的光影,不同的人情,不同的自己。新的视角,往往比新的目的地更重要。
#视角
#发现
#人情
分享
评论 0
0
Barret李靖
5个月前
刚开始学开车的时候,坐姿总是拘谨,整个人几乎贴在方向盘上,眼睛死死盯着前方十米,每一脚油门下去,心跳和血压也跟着窜上来。 后来,学会了把自己融入到环境,将人、车和路当成一个整体看待,开车就变成了一种本能。
#新手开车
#驾驶体验
#人车合一
#心态变化
#驾驶技巧
分享
评论 0
0
Barret李靖
5个月前
慕强的人生活在恐惧中,因为他生怕自己不够强。 狮子和兔子,兔子想说话,狮子说,你的牙齿呢,你闭嘴。可是狮子在大象面前,狮子又变成了那个弱者。 如果把竞争当作一件重要的事情,内核就会不稳定,因为每次看到对手比自己强大,就会拼命提升对手强大的那一面,而忽视了自己的理想。 关注自己想要的,心里默念着“我的敌人是现在的自己”,慢慢地就会发现,自己不仅在变强,也在走向想成为的那个自己。
#慕强
#恐惧
#竞争
#关注自己
#成为自己
分享
评论 0
0
Barret李靖
5个月前
注意力是稀缺品,在一件事情上投入过多,就很难在另外一件事情投入。要保持高效和聚焦,就需要给自己做减法。 做减法有两种方式,一是明确自己要达成的目标,目标一定是清晰、收敛的,及时清理与目标相关度低的任务,学会“断舍离”,学会放弃。什么都想要只能陷入局部最优,永远无法达到全局最优解。 二是控制脑中的任务并发量。大脑能同时处理的任务数量有限,并发越多,关键任务能获得的注意力就越少。更严重的是,当并发过高时,人会感到压力,而一旦压力升高,注意力便会被转移到“压力本身”。这时,任何模糊不清的事都会被放大,成为焦虑的源头,让人陷入不安。 关于这一话题,比较推荐《被讨厌的勇气》和《要事第一》两本书,断舍离的前提是自我接纳,要事第一首先要明确自己想成为怎样的人。只有在清晰的自我认知下,减法才真正有意义。
#注意力稀缺
#目标聚焦
#断舍离
#压力控制
#自我认知
分享
评论 0
0
Barret李靖
5个月前
最近读《谷歌人不疲倦的工作术》,颇有感触。Google 的文化并不是要求员工拼命提高效率,而是努力把工作本身变成一件让人开心的事情。 通过帮助员工做好专注力管理、能力管理、情绪管理、健康管理以及心理价值的确认,让人能够以更轻松的状态持续投入。 最近同事跟我吐槽,他说之前在 Google 会很自然地把运动、休息写进自己的日程里,理所当然地认为,那也是工作的一部分;在这里,会有种不自在的感觉,工作和生活是割裂的。
#谷歌工作术
#员工关怀
#工作幸福感
#工作生活平衡
#企业文化
分享
评论 0
0
Barret李靖
5个月前
一直在思考 iPad 可能用于哪些工作场景,这几年多次尝试和实践下来,均以失败告终,它天生就是个娱乐工具。 不过,最近也想明白一个道理:娱乐是必需品,无需排斥。它的价值并不是追逐高效,而是让高效的事情变得轻松可持续。就像在 B 站看李沐讲神经网络,学习变成了追番;又或者在通勤路上听一档商业分析播客,信息获取像追剧一样自然。 当娱乐与工作不再被切割,而是能够相互转化,工具的意义就发生了变化。真正的长期主义,从来不是死磕效率,而是找到一种能让自己长期沉浸其中的愉悦形式。
#iPad娱乐
#效率悖论
#长期主义
#工作娱乐转化
#轻松学习
分享
评论 0
0
Barret李靖
5个月前
一些科普和资讯类的音视频,经常不想花太多时间看完,想着先将字幕扔给大模型总结,觉得有必要再回头细看。 找了好几个抓字幕的 Chrome 插件,要么是抓不到内容,因为有些视频根本没提供字幕文件;要么是支持的网站有限,需要每个网站装一个插件。干脆就自己撸了一个😅,大概思路: 1)劫持网络请求接口,当探测到域名中包含类似 subtitle 的单词时,将内容打印出来。支持配置单词关键词。 2)当网页没有字幕文件时,通过浏览器自带的 Web Speech API 将文字识别出来。支持配置语言 花了 20min,跟 ChatGPT 结对编程了一个油猴脚本,还挺好使。
#大模型
#字幕提取
#Chrome插件
#Web Speech API
#油猴脚本
分享
评论 0
0
Barret李靖
5个月前
费曼当年说的是,"What I cannot create,I do not understand",他的用词是 create,这十多年一直理解为 teach/talk。后面还有一句,"Know how to solve every problem that has been solved"。
#费曼
#create
#理解
#解决问题
#学习方法
分享
评论 0
0
Barret李靖
5个月前
Andrej Karpathy 关于 Software 3.0 的演讲,看了好几遍,
#Andrej Karpathy
#Software 3.0
#演讲
#人工智能
#技术趋势
分享
评论 0
0
上一页
1
2
3
4
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞