时政
财经
科技
虚拟货币
其他
登录
#大模型
关注
lencx
4小时前
假期来临,大模型扎堆发布,咋这么卷呢?OpenAI 似乎正在另辟蹊径,搞产品(如 ChatGPT Pulse、AI 电商、家长控制、或将发布 Sora 2)。
#大模型
#OpenAI
#ChatGPT Pulse
#Sora 2
#AI电商
分享
评论 0
0
yihong0618
10小时前
以后中国一过大节,大哥们就发大模型,会不会成为传统。
#中国
#大节
#大模型
#传统
#科技
分享
评论 0
0
Limbo
2天前
不要对大模型太苛刻,连顶级模型都这样了。
OpenAI GPT-5发布引发用户不满,阿尔特曼回应质疑· 78 条信息
#大模型
#顶级模型
#苛刻
#技术
#中性
分享
评论 0
0
Geek
3天前
这些供应商对大模型进行了前脑叶白质切除术🤣
#大模型
#前脑叶白质切除术
#供应商
#负面
#AI
分享
评论 0
0
Tw93
3天前
微软开源的这个mcp-for-beginners,对入门者的大模型上下文协议 MCP 课程值得细看,相比每次听 USB 概念,不行系统看看。
#微软
#MCP
#开源
#大模型
#入门
分享
评论 0
0
dontbesilent
4天前
用大模型的多模态,向“普通人”展示:AI 竟然还能这么用 ⬆️ 这句话可以让我抖音涨粉 50w~100w 之后每用这个方法做一条视频,我就转一下这条推文 #flag
#大模型
#多模态
#AI应用
#抖音涨粉
#内容创作
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
4天前
当我们说“大模型是预制菜”时,我们不是在“陈述”一个事实,我们是在“指导”一种“认知”。 这个隐喻,像一个“认知棱镜”,强迫我们从一个全新的角度,去审视一个复杂的现象。 这,是“认知 (Cognition)”的力量
#大模型
#预制菜
#认知棱镜
#认知指导
#隐喻
分享
评论 0
0
lencx
5天前
今天微信上有个朋友想拉我技术入伙,搞企业客服 Agent。宣称 “Benchmark 上 99% 的拒绝回答率,完全没有幻觉问题,而且不是基于微调不锁定模型”。我虽然不知道咋实现,但总感觉哪里怪怪的... 我对大模型的理解还停留在它本身就是个不确定的东西,99% 拒绝有点超出认知,是不是存在过度拒绝或伪拒绝?
#企业客服Agent
#大模型
#拒绝回答率
#幻觉问题
#技术
分享
评论 0
0
Salonbus
6天前
大模型是未来的军事领导力+科技领导力+下一代技术定义的权力。 已经是不可比避免的投入所有资源去竞争的制高点
中国战机闪耀巴黎,歼-20量产提速· 74 条信息
#大模型
#军事领导力
#科技领导力
#权力
#竞争
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
6天前
王慧文说“大模型是预制菜”,我用微波炉热了热,然后悟了。
#王慧文
#大模型
#预制菜
#微波炉
#科技
分享
评论 0
0
向阳乔木
6天前
有传言称 Gemini 3.0 Pro 和 Claude 4.5 Sonnet 可能在本周发布... 看看新的大模型SOTA会有什么惊喜。
Google Gemini 2.5发布引发AI模型性价比热议· 201 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 519 条信息
#Gemini 3.0 Pro
#Claude 4.5 Sonnet
#大模型
#发布
#SOTA
分享
评论 0
0
Olivert
1周前
大模型五大经典论文PDF,送给喜欢钻研的兄弟。 链接:
#大模型
#经典论文
#PDF
#学习资源
#技术
分享
评论 0
0
Olivert
1周前
一小时了解大模型,从函数到Transformer!一路大白话彻底理解AI原理。 非常适合入门。有了总体框架之后再去学习具体的知识点。 点击链接,一键跳转微信免费领取大模型全套资料:
#大模型
#transformer
#AI原理
#入门
#免费资料
分享
评论 0
0
嗯哒嘿
1周前
新买了一台Mac mini M4Pro的丐版,24G的统一内存能跑哪些大模型? 先说大方向的结论,4B和7B的随便跑,无论是4bit还是8bit量化都可以。14B开始吃力只能跑4bit并且速度明显变慢。20B的勉强,24B以上悬,基本上跑不了。 速度结果如图,我对具体模型评价见评论↓
#Mac mini M4Pro
#大模型
#4B/7B模型可流畅运行
#14B模型吃力
#20B模型勉强
分享
评论 0
0
yetone
1周前
一个朋友把他 Vibe Coding 的作品给我帮他查问题,说是他实在迭代不动了,越迭代问题越多 我拉下他的代码沉吟片刻后瞬间就像大模型之神上身一样疯狂给他说明这些 bug 该怎么改,他说我也不会你来改吧,然后我就像复述着神的低语一样给他改着代码 所以程序员们也不需要害怕,你是未来唯一能听懂和传达神谕之人,是时候建立个 Vibe Coding 邪教了 —— 拜大模型会
AI编程工具激战:Claude Code、Gemini Cli崛起· 890 条信息
#Vibe Coding
#大模型
#bug
#程序员
#邪教
分享
评论 0
0
初码
1周前
强烈要求全球立法,严惩大模型的降智行为,降智一次罚款10亿美金!妈的服务器一不够用,就随机偷懒分配到垃圾节点,这VIP是白冲了!
OpenAI GPT-5发布引发用户不满,阿尔特曼回应质疑· 78 条信息
#大模型
#降智
#罚款
#垃圾节点
#VIP
分享
评论 0
0
盐粒 Yanli
1周前
本期 pycon 的另一个 talk 的文字稿 梳理了一下当前常见的大模型应用形态和交互模式
#pycon
#大模型
#应用形态
#交互模式
分享
评论 0
0
Olivert
1周前
作者“生姜”的 《线性代数不难》上下册,66话题. 学习大模型必备。
#线性代数
#生姜
#大模型
#学习
#教材
分享
评论 0
0
Geek
1周前
🦙 llama.ui 一个极简的本地 AI 助手界面,支持连接多种大模型使用。
#llama.ui
#AI助手
#本地应用
#极简界面
#大模型
分享
评论 0
0
Olivert
1周前
如果你现在还不抓住大模型的机会,只能说是因为你自己菜了
#大模型
#机会
#危机
#负面
#个人能力
分享
评论 0
0
Viking
1周前
不知道大家怎么看 E2E 的,之前我觉得是没啥大用,结构经常变,测试经常崩,速度又慢,最后还不如手动测试。 有了大模型以后,稍微改观了一些,试验了一个小项目,为了验证 AI 的结果,我现在用 Playwright MCP 来写 e2e,让大模型在做功能的同时就让它去写 e2e,对比验证,这个 MCP 提供了一大堆的tools 去操控 Playwright,工具也是排名非常高的,很好用 有了大模型其实写 E2E 比原来简单很多了,都是自然语言描述然后就生成对应的测试脚本了,还可以生成快照进行对比,测试速度是比原来快了。如果是新项目的话,完全可以试试看。 我在想是不是要给自己之前的项目添加,但是一想到那么多的场景就有些头疼。
#E2E测试
#大模型
#Playwright MCP
#AI辅助测试
#测试效率提升
分享
评论 0
0
ginobefun
1周前
#BestBlogs 看我如何用 Prompt 工程将大模型调教成风控专家 | 京东技术 文章详细阐述了如何通过循序渐进的 Prompt 工程,将通用大模型调教成精准识别复杂电商风控风险的 AI 专家。 摘要: 文章作者作为交易风控算法工程师,分享了将大语言模型(LLM)引入电商风控工作的实践经验。通过四个阶段的“Prompt 工程心法”,作者将一个通用大模型从“什么都懂一点”的初级分析员,逐步培养成能精准识别复杂电商风控风险的“AI 专家”。这包括:第一阶段的角色扮演和结构化输入输出,实现自动化;第二阶段注入业务常识和“豁免规则”,显著降低误报率;第三阶段提升分析深度,教会 AI 识别协同作案的“行为指纹”;第四阶段引入“双假设裁决框架”和“硬链接”证据,使 AI 能在模糊信息中做出审慎判断。文章总结了“始于模仿,终于框架”、“规则是骨架,背景是血肉”等心法,强调 Prompt 工程是连接领域专家与 AI 的创造性交叉学科。 主要内容: 1. 通过角色扮演和结构化 I/O,将通用大模型训练成初级风控分析员。 -- 设定 AI 为资深风控专家,定义分析维度,并规范 CSV 输入和 JSON 输出,实现风控分析流程的自动化和初步结构化。 2. 注入业务常识和“豁免规则”,显著提升大模型对业务复杂性的理解和准确性。 -- 针对高折扣、随机串用户 ID 等业务中正常现象的误判,明确业务背景知识,有效降低误报率,使模型更具业务敏感性。 3. 提升大模型分析深度,教会 AI 识别团伙级协同风险的行为指纹。 -- 通过拓宽风险定义,从订单级提升到团伙级,识别如远超个人合理消费范畴的低价值快消品和“购物车一致性”等行为模式,发现更深层次的隐蔽风险。 4. 引入“双假设裁决框架”和“硬链接”证据,使大模型能在模糊信息中做出审慎判断。 -- 要求 AI 在“协同风险团伙”和“良性特征客群”两个假设间权衡,并以“硬链接”作为决定性证据,从而区分真假聚集,实现法官式的终极裁决。 文章链接:
#电商风控
#Prompt工程
#大模型
#AI专家
#风险识别
分享
评论 0
0
邓聿文
1周前
由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上《自然》封面。与1月的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。Nature对DeepSeek-R1评价是:目前几乎所有主流大模型都未经过独立同行评审,该空白“终于被DeepSeek打破”
深度学习模型升级引发AI能力大跃进,行业迎新变革· 94 条信息
#DeepSeek-R1
#梁文锋
#Nature封面
#大模型
#同行评审
分享
评论 0
0
马东锡 NLP
1周前
学习 NLP 的我,怎么也不会想到 LLM 发展到今天: 1. 输入输出 Token 可以直接卖 2. Test time scaling 可以包装成思考卖 3. Efficient Test time scaling 可以包装成不同档位思考卖 看看大模型 PM 们,下一步会把什么东西卖给我
#NLP
#LLM
#大模型
#PM
#商业化
分享
评论 0
0
初码
1周前
说到左与右,在大模型公司上也有意识形态的差别,可以说道几句,几家大的都买了Pro会员,就我这半年的使用体验来看,OpenAI是极左,Anthropic偏左(整体还是中立的),Grok很右,Gemini中间骑墙。这里说Grok偏右其实是给其他家台阶下,客观的说,Grok那是相当客观,这种客观,从简单的使用反馈上就能感受到,背后有一种贯穿软件工程全链路的健康方法论和价值观。下面说说我对大模型左与右的理解和认知。 一、OpenAI的崛起和即将迎来的溃败,和近些年来左派的兴衰起落有着微妙的相互映照暗合之妙 你要问我日常用啥,首选肯定还是GPT,原因是: 1)知识面广,知识理解深 2)推理速度超级快 3)深度思考模式做解决方案更加全面 其实吧,以上3个原因,归根结底,都只有1个原因,那就是钱,只要有钱 1)可以大手笔买下全世界的知识库,特别是各行各业的垂直信息,这对补全AI认知的边角非常有帮助。 2)可以请全世界最优秀的行业专家,来进行特别精细化的微调,来补足知识理解的深度。 3)可以无穷无尽的买服务器,提升训练推理速度,甚至自己做专用芯片来实现几倍效率。 但是呢,在ChatGPT的使用过程中,最困扰的事情,就是意识形态干预,你会有一种感觉,他要管着你,甚至有些时候,有一种无处不在的喘不上气的憋闷感。特别是意识形态领域,色情、LGBT、地缘政治、肤色、心理健康等等,他会以预设的立场模板为不可修改的基石,反复引导你甚至强制中断你。 左派最大的本事,就是以关心你的名义,以宏大叙事的名义,以集体一致性的名义,来剥夺你的权利,来强迫你接受他的理念,无论是共产主义,还是民进党,又或是民主党和左媒,都是如此。 更牛逼的是,这种无往而不利的意识形态动员,总能在车轮推进中募集并获取到巨大的私利,进而进行进一步二次分配,从这个角度看,OpenAI的发迹路线真是完美践行了这一方法论。 但是,随着大模型工程领域的顶层玩家越来越多,黄埔军校的第一波学生早已毕业,开源和人才流动并行之下,OpenAI在原始算法、工程能力以及数据积累上,都会越来越丧失优势,达到某个临界点的时候,左派意识形态会导致越来越多的客户流失。 二、那么什么才称得上客观公正的大模型呢 答案很简单,总结就是:软件工程端遵循100%的客观,价值观和价值引导只耦合在业务层面 没有工程感觉的人,一时间可能很难理解这句话,我举个特别容易懂的例子大家都明白了,比如DeepSeek,他的某些内容输出,内容审查的模块并不在推理代码里,而是在推理完成后,加了一层前端检查代码,所以很多时候会看到其实他已经输出完成了,但是最后一闪而过并清空屏幕提示无法回答。 千万不要小看这样的做法和直接输出无法回答之间的差别,这差别可大了,背后反映了从老板到架构师再到产品经理的温和价值观。 真正的右派(客观派),是有真理洁癖的,他们不愿意被管制被管控,哪怕向审查低头,他们也会选择可以最大程度把真理和业务进行彻底解耦的方式,他们不仅不希望被价值观和意识形态绑架,他们希望能够想办法对存量数据中的意识形态化的东西进行摒弃,他们也会积极主动的建立起专业委员会、投票机制等,来对清洗、预处理、标注、增强等过程进行客观工程化的管理。 甚至我可以大胆的说一句,伟大的大模型,道德审查、隐私审查等模块,一定是和主体部分强解耦的,一定是主动强开源的,这才是真正的人权!
#大模型
#意识形态
#OpenAI
#客观公正
#软件工程
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞