时政
财经
科技
虚拟货币
其他
登录
九原客
关注
统计数据
33
文章
0
粉丝
0
获赞
194
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
九原客
5天前
Meta 竟然在裁田渊栋,发完求职推后,OpenAI、XAI、Anthropic等等都在喊 Join us。 倒是想知道他们的TBD到底能憋出来啥,也四个月了吧,以Meta的算力模型该训出来一版啦。 闭源比开源更残酷,效果没亮点没人会用的,现在US的闭源模型就剩四五家了。
#Meta裁员
#田渊栋
#OpenAI
#闭源模型
#AI求职
分享
评论 0
0
九原客
1周前
Paddle OCR 确实很久以来都是中文OCR的头把交椅。新的VLM模型也出来了,可以试试。
智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限· 17 条信息
#Paddle OCR
#中文OCR
#VLM模型
#技术
#测评
分享
评论 0
0
九原客
1周前
看来还是CLI 好做,阿里光Claude Code 竞品就由三个团队分别做了三个。 iFlow CLI、Qwen CLI、Qoder CLI。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1089 条信息
#CLI
#阿里
#Qwen
#iFlow
#Qoder
分享
评论 0
0
九原客
2周前
如果对 DeepResearch 这类复杂的 Agent 感兴趣,我建议学一下LangGraph的免费课程 Deep Research with LangGraph。 课程比较循序渐进,先做一个单Agent系统,然后进化为多 Agent。 最主要是架构简单,外部依赖非常少,一个大模型一个搜索API就完了。
谷歌Deep Research:AI操作系统雏形?· 108 条信息
#DeepResearch
#LangGraph
#agent
#大模型
#搜索API
分享
评论 0
0
九原客
2周前
对的对的,我发现Claude Code 特别爱编写防御性代码。 而我是异常神教信徒,秉持不做异常处理,错误就要抛出的观点。 Error early Error fast
#Claude Code
#防御性代码
#异常神教
#错误处理
#Error early Error fast
分享
评论 0
0
九原客
3周前
尝试了很多内网穿透的办法(tailcale等)最后发现还是买一台国内云上的虚拟机,然后用frp映射22端口,上vscode remote 最稳。 只是要注意安全性,关闭密码只用密钥。
#内网穿透
#frp
#vscode remote
#安全性
#密钥
分享
评论 0
0
九原客
4周前
只需要一个While循环,让Claude 无限运行。(之前我也用了这招,好用!) while :; do cat | claude -p --dangerously-skip-permissions; done prompt也很简单: Your job is to port assistant-ui-react monorepo (for react) to assistant-ui-vue (for vue) and maintain the repository. You have access to the current assistant-ui-react repository as well as the assistant-ui-vue repository. Make a commit and push your changes after every single file edit. Use the assistant-ui-vue/.agent/ directory as a scratchpad for your work. Store long term plans and todo lists there. The original project was mostly tested by manually running the code. When porting, you will need to write end to end and unit tests for the project. But make sure to spend most of your time on the actual porting, not on the testing. A good heuristic is to spend 80% of your time on the actual porting, and 20% on the testing.
AI编程工具激战:Claude Code、Gemini Cli崛起· 1089 条信息
#Claude
#无限循环
#代码移植
#React到Vue
#自动化开发
分享
评论 0
0
九原客
1个月前
Kimi官方对OpenRouter上不同的供应商的 Tool Calling能力做了Benchmark,发现有些供应商提供的模型服务有较大问题。 可能是推理Bug,也可能是不合理的量化。 另外 1. 使用的2000条Tool Calling 测试集没有开源。 2. 可以在 OpenRouter配置中排除掉某些供应商。
#Kimi
#Openrouter
#tool calling
#Benchmark
#模型问题
分享
评论 0
0
九原客
1个月前
文档识别模型,我一般就用这个图测试。 大家可以猜猜哪个模型最好,也可以自己测试下。
#文档识别
#模型测试
#模型对比
分享
评论 0
0
九原客
1个月前
目前个人测试中文效果最好的 端到端文档识别小模型 是腾讯的 POINTS-Reader(比小红书的dots.ocr 还要好一些)。 做了如下小小的工作: 1. 合并了官方的PR到sglang 0.5.3 版本,可以高效推理。 2. 基于TRL的模型训练代码,可以进行训练。训练只需要图片和对应的markdown文本。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 125 条信息
#腾讯
#POINTS-Reader
#文档识别
#小模型
#sglang
分享
评论 0
0
九原客
1个月前
推荐一个LLM数据集处理、合成、过滤用的库:DataFlow。用在最近多个模型训练数据集处理过程中,最大处理100M条SFT语料。 优点是封装较少,代码简洁明了(相比于类似的其他库),可以方便复用算子和自定义算子。 缺点是预设算子有些性能上、模型上还是需要定制,好在结构简单定制很快。
#LLM
#数据集处理
#DataFlow
#模型训练
#SFT语料
分享
评论 0
0
九原客
1个月前
免费 GPU 或廉价算力推荐,可用于学习10B以内模型微调训练,我会给学员推荐这些环境练习模型训练。
#免费GPU
#廉价算力
#模型微调训练
#10B模型
#学员推荐
分享
评论 0
0
九原客
3个月前
Vibe Coding 心得 - 正式项目(需要持续维护的),每次只生成少量代码+人工Review。 - 一次性项目。人工确定选型(包括框架、依赖库等)和设计后,使用vibe coding 完成。放下代码完美主义,能跑就行。 三生不幸,来做ToB,不需要讲什么可维护性,完美适合vibe coding。
分享
评论 0
0
九原客
3个月前
问数先不提技术的坑,就说最本质的目标客户。 如果给不懂SQL的业务部门(or领导)使用且自由提问,核心问题是无法信任模型输出,且不懂SQL也无法核查正确性。 问答也有类似问题,但有引文做信任基础。 现在 Text2SQL 更多还是辅助数据工程师,减少工作量,而不是做成终端产品交付给业务部门。
分享
评论 0
0
九原客
3个月前
有人指控Pangu Pro MoE 模型其实是沿自Qwen2.5-14B(大小不一致没关系,可以通过复制参数的方式实现) 几个证据: 1. 毫无理由出现在Pangu Pro MoE代码库里的Qwen License 2. QKV偏置分析、激活值分布特征等统计结果 3. 架构和超参数的选择 建议自high可以,谨慎开源。
分享
评论 0
0
九原客
3个月前
(1/3)【论文推荐】DeepResearch 是我最近研究的重点方向,推荐3篇文章: (好一些的综述) (过于求全反而缺乏洞见的综述) (评估方法,从报告质量和引用精度两个角度评估)
分享
评论 0
0
九原客
6个月前
HellaSwag 评测集99分代表什么华为一堆博士不懂么?这个评测集里自然错误率很高的。 刷分也刷的太过了,第二个图更是通用模型吊打推理模型。
分享
评论 0
0
九原客
6个月前
来自一亩三分地的爆料。
#一亩三分地
#爆料
分享
评论 0
0
九原客
7个月前
是最适合由Sonnet 生成的流程图、架构图格式。 比svg增加了可编辑,比mermaid、plantuml 漂亮。
#sonnet
#流程图
#架构图
#SVG
#编辑
#mermaid
#plantuml
#图形设计
分享
评论 0
0
九原客
7个月前
目前我日常使用的模型(非广告~) (日常用): - (Grok3 真的很好) - (Qwen2.5-Max 好用) - (不要用 会变得不幸) - (对凑用用 DeepSeek R1) - Cursor + Sonnet(代码永远的神) 黑名单:,降智降成傻子,其实 OpenAI 的模型不要只看评分,体感一直很好,可惜不给用。 (API 用): - (测试各种奇怪的模型,没必要自己部署) - (虽然被背刺,但是embedding之类的模型托管的平台不多) - (只用来跑 DeepSeek R1/V3 批量和在线推理)
#模型
#Grok3
#Qwen2.5-Max
#DeepSeek R1
#Cursor
#sonnet
#OpenAI
分享
评论 0
0
九原客
7个月前
最近两三周给很多客户反复提及的忠告: 用模型一定要用最好的那个,如果想省钱,请在你的场景下微调,而不是用一个低能力的通用模型,然后试图靠 Prompt 或者工程努力去拯救它。 比如 DeepSeek 的那一堆蒸馏模型是很好的场景级推理模型的Base,但是不要直接用,真的很差。
#模型选择
#微调
#场景应用
#Prompt
#工程努力
#DeepSeek
#蒸馏模型
#推理模型
分享
评论 0
0
九原客
8个月前
DeepSeek 满血版在国产硬件上贫瘠的推理性能基本告别生产级应用。 四台8卡晟腾910B 单用户推理速度才10+ tokens/s,花五百万就买个这?
#DeepSeek
#国产硬件
#推理性能
#生产级应用
#晟腾910B
#单用户推理速度
分享
评论 0
0
九原客
8个月前
杨立昆锐评某些硅谷公司(deepseek 翻译) —— - 硅谷某些圈子中的一种常见病:一种错位的优越感。 - 晚期症状:认为自己的小团体垄断了好主意。 - 末期症状:认为来自他处的创新是通过欺骗手段获得的。 科技进步在更多有才华的人参与并*分享*他们的创新时发展得更快。 事实上,这就是原因: - 科学界围绕出版物和工具共享进行组织 - 开发者社区围绕开源组织 - 专利制度存在(尽管对于软件和服务来说已经过时且适得其反):你可能会获得政府对发明使用的短期独占权,但作为交换,你必须披露足够的信息,以便他人能够复制并在其基础上进行构建。
#硅谷
#科技创新
#优越感
#科学共享
#开源
#专利制度
分享
评论 0
0
九原客
8个月前
国内大模型玩家小评: 智谱:技术很不错,专攻ToB、ToG,但是新公司想踩透ToB的弯弯绕,得先吃点亏。 讯飞:垃圾模型,但是讯飞在国资委很有影响力,应该还能拿单。 阿里:Qwen 持续开源领先,ToB 躲在后面让集成商中标干苦力活。 腾讯:反正外面没人用,开源了捧个人场。 字节:豆包主要还是服务自家 ToC 场景,API 赚不到钱也没什么人用。 百度:专心做ToC 场景吧,然后做做ToB的单子,闷声不被骂。 华为:专心做昇腾生态,卖昇腾服务器,前途广大。 Kimi:被豆包干死。
#智谱
#讯飞
#阿里
#腾讯
#字节
#百度
#大模型
#ToC场景
#ToB市场
#开源技术
分享
评论 0
0
九原客
9个月前
有人说DeepSeek R1 的 RL 范式也没啥创新,其实点不在这里。 o1出来后纷纷开始复刻,OpenAI 也不说怎么实现的,也不展示COT数据。所以说蒸馏o1纯属扯淡,OpenAI 防的死死的。 RL 论文上百篇方法几十种,最后 DeepSeek 肯定不是第一家试出来的(比如Google 的 gemini flash 2.0 thinking 就很好),但它是第一家说出来的,善莫大焉。 为全球降低试错成本,就是开源最大的价值,节约的是全人类的资源。 另外 Kimi 的论文也不错,在数据和Reward方面比DeepSeek 更详细一些,也推荐看看。
#DeepSeekR1
#RL范式
#OpenAI
#COT数据
#geminiflash2.0
#论文创新
#DeepSeek
分享
评论 0
0
1
2
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞