时政
财经
科技
虚拟货币
其他
登录
智能推荐信息源
李老师不是你老师
关注
德潤傳媒
关注
悉尼閑人
关注
联合早报 Lianhe Zaobao
关注
DW 中文- 德国之声
关注
ABC中文
关注
Gancheng Wang
关注
Ignatius Lee
关注
《议报》
关注
网易新闻-红星新闻
关注
由 AI 根据您的兴趣偏好筛选
事件跟踪
热点事件
最新话题
实时新闻
勃勃OC
4个月前
又开始炒deepseek了 上一次炒deepseek的时候 美股一个月后立刻暴跌 这次,会有什么不同吗? 谢谢大家
DeepSeek数据泄露:德国下架,信任崩盘· 446 条信息
#DeepSeek
#美股暴跌
#炒作
#风险预警
分享
评论 0
0
Kai
4个月前
llm 搜索 和 RAG 确实像 摄像头 vs 激光雷达 之争 “设计精妙的搜索系统” 不如 “尽可能把接口和系统暴露给大模型”,后者更符合第一性原理,只是更费 token,也更依赖于模型的智能程度
谷歌Deep Research:AI操作系统雏形?· 145 条信息
#LLM
#搜索系统
#RAG
#摄像头
#激光雷达
分享
评论 0
0
Lex Tang
4个月前
作为穷人,我希望 Claude Code 用 API 的时候可以多问一嘴: 您的这个改动需求大概要消耗 $2,您的账户余额是 $30,是否继续执行?5s (Y/n) ____ <- 此处的 5s 是个倒计时自动输 Y 按回车
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#穷人
#Claude Code
#API
#余额不足
#确认提示
分享
评论 0
0
Cell 细胞
4个月前
让 AI 先听了遍,641 和 don 哥的直播⬇️ 【直播精华|普通人破局的 8 条硬逻辑】 1)先做“文字MVP”:在X上连续输出可复用的观点→再改编为小红书图文→再升级短视频→最后用“连线直播”做转化闭环。 2)选项目“三步筛”:有利润|看得懂|能模仿;再加一条——敢执行。 3)对标找增量:以10×目标选标杆,做1/10体量的确定性业绩。 4)摆脱内卷靠“不可复制”:要么直播连线实时诊断,要么极致高产流程化,要么做独家方法论。 5)内容“杠铃”策略:10%迎合算法拿流量,90%系统化沉淀做付费。 6)平台认知:小红书难在“标题与封面”,但仍是素人起步门槛最低的公域;文字→短视频→直播,转化率依次走高。 7)AI用法三层:用户提示词|系统提示词|“原提示词”(让AI帮你写系统提示);把AI藏进场景,按使用计费。 8)资金与人力:先跑通利润自闭环,再谈资本杠杆;在AI时代,人力可能是负杠杆——试试“AI助理联盟”的轻组织。
#阶层固化:求变之路,殊途同归· 976 条信息
#AI
#直播
#商业逻辑
#个人成长
#内容创作
分享
评论 0
0
面条
4个月前
DeepSeek 是真便宜,用 Claude Code 消费了 28M Token 才花了 17 块钱。
DeepSeek数据泄露:德国下架,信任崩盘· 446 条信息
#DeepSeek
#Claude Code
#Token消费
#低价
#AI
分享
评论 0
0
赵纯想
4个月前
别吵,影响我使用XCode26(母公司技术下放受益者)了
iOS 26 Beta 2:流畅优化难抵卡顿发热· 190 条信息
#Xcode26
#母公司技术下放
#受益
#技术
#软件
分享
评论 0
0
howie.serious
4个月前
万物皆可quizgpt!🧠 quizgpt 使用场景:看完了半小时长度的一个知识视频/talk?立刻quiz一下! 上万字的文稿,使用quizgpt咒语,立刻生成flashcards🤣 同理,公众号文章、Wikipedia词条、论文……万物皆可quizgpt!
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#quizgpt
#知识视频
#flashcards
#学习工具
#效率
分享
评论 0
0
howie.serious
4个月前
chatgpt最新咒语:quizgpt 🪄 除了study mode,chatgpt 还偷偷上线了(天然内置ai所以秒杀传统闪卡的) flashcard 功能! 使用这条咒语,你可以立刻 quiz 一切: > quiz me with QuizGPT:{主题,或任何prompt} 例如,quiz LLM基本概念,quiz 《春江花月夜》……一切知识,一切内容。 甚至,你可以quiz你和chatgpt刚讨论过的话。或者在prompt下面复制粘贴你要quiz的文本。考虑到gpt-5巨大的context window,使用场景巨大。 quizgpt 是openai对这个功能的代号,使用quizgpt这个关键词就可以激活。偶尔失败的话,可以直接指明工具名称,像这样: > quiz me with QuizGPT(ecosystem_demo.flashcards) 每次测试,chatgpt会自动生成难度从低到高的多套flashcard,先是基础,然后是进阶,然后是大师,然后是宗师…… chatgpt flashcard(quizgpt),因为内置于最顶级的llm,和之前的flashcard工具在本质上是完全不同的。我玩了好久,感觉可以成为一个日常使用频率很高的利器。大家赶紧测试起来~~
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#ChatGPT
#quizgpt
#flashcard
#学习工具
#人工智能
分享
评论 0
0
Inty News
4个月前
蘋果已對一名員工提起訴訟,指控其竊取了與 Apple Watch 相關的商業機密,並將其分享給了他的新雇主——中國智慧型手機製造商 Oppo,而 Oppo 對此知情。
苹果Liquid Glass:开发者适配陷两难,AI助力AR或成未来· 104 条信息
#苹果
#商业机密
#诉讼
#OPPO
#Apple Watch
分享
评论 0
0
Inty News
4个月前
重磅消息:马斯克开源了AI大模型 Grok 2.5
马斯克Grok再升级,4代直播发布引爆AI· 41 条信息
#马斯克
#Grok 2.5
#开源
#AI大模型
#科技
分享
评论 0
0
勃勃OC
4个月前
我可以用智能家居App提前把家里的灯打开 😅😅😅😅
#数字科技引领未来:链博的魔法开关与全球连接· 43 条信息
#智能家居
#App
#灯
#打开
#心情好
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
4个月前
我能理解为啥最近好几个中文研究机构都出来用AI来发现AI的研究论文了: 上海人工智能实验室:AI科学发现基座模型 上海创智学院:AI模型算法架构发现 香港大学:AI科学发现
AI高考数学测试:O3意外落后,Gemini夺冠引发热议· 67 条信息
#AI
#人工智能
#研究机构
#上海
#香港大学
分享
评论 0
0
kevinzhow
4个月前
时隔数月回来用 VSCode 发现产品细节进步很大,这周可以深度体验下,也许 Cursor 的优势已经没那么大了
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#VsCode
#Cursor
#产品体验
#软件开发
#竞品分析
分享
评论 0
0
向阳乔木
4个月前
未来一切流程可能都会变成AI Agent。 现在,可以先制作成任务清单。 每次按顺序执行就好,大脑是懒惰的,不想思考。
#AI浪潮:重塑就业,风险暗涌?· 140 条信息
#AI Agent
#任务清单
#流程自动化
#效率提升
#技术趋势
分享
评论 0
0
LiUgOd
4个月前
google这个暗网监测功能还是挺好用的,我的资料都被卖了这么多次了。。。
谷歌Deep Research:AI操作系统雏形?· 145 条信息
#Google
#暗网
#信息泄露
#负面
#隐私
分享
评论 0
0
Gorden Sun
4个月前
AI资讯日报,8月23日:
AI技术引发伦理争议,专家呼吁加强监管· 167 条信息
#AI
#资讯
#8月23日
分享
评论 0
0
阑夕
4个月前
基于nano-banana模型非常优秀的改图能力,把平面动画角色转成3D手办的玩法这几天很火,不过我自己在LMArena测试了一会儿,发现它对纯血二次元图片的转化其实不太理想,改出来的成品都更像是亚克力的吊牌而不是手办,反而让我抽到的Qwen-Image出图效果意外的好。 比如图1是原图,图2是nano-banana的,图3是Qwen-Image的,差距很明显。(1/n)
AI视频井喷:Midjourney领跑,多模态混战· 337 条信息
#nano-banana模型
#Qwen-Image
#二次元图片转化
#3D手办
#改图效果
分享
评论 0
0
Compute King
4个月前
DeepSeek的UE8M0 FP8优化:国产AI与半导体协同的战略转折点 在人工智能训练和推理加速的竞赛中,浮点数(Floating Point)的表示方式正成为关键突破口。作为计算机中用于表示小数的核心手段,浮点数由三部分构成:符号位(Sign)、指数(Exponent)和尾数(Mantissa)。符号位决定正负,指数决定小数点的位置,尾数则影响精度。内存位数越多,浮点数的表示精度越高,但同时带来的计算和存储开销也更大。 如下图为浮点数据类型的结构。所有显示的值(在 FP16,BF16,FP8 E4M3和FP8 E5M2中)都是最接近数值0.3952的表示形式。 在主流硬件生态中,NVIDIA GPU目前支持E4M3与E5M2两种FP8格式,并通过绑定硬件和软件的深度优化提升了其适用性。例如,NVIDIA引入了per-tensor scaling,per-block scaling等动态缩放策略,以解决FP8动态范围不足,容易溢出的难题。同时,在Tensor Core中也专门增加了FP8指令集,使得FP8在H100 GPU上能够充分释放算力。 在新一代Blackwell架构中,NVIDIA更进一步提出了“微缩浮点格式”(Microscaling formats),涵盖MXFP8(8位)、MXFP6(6位)、MXFP4(4位)等多种新型表示方式。研究显示,在高质量数据集上,一个8亿参数的模型若采用MXFP8-E4M3格式,并配合优化的数值转换策略,训练结果几乎可与传统的BF16持平。这意味着在Blackwell平台上,MXFP8正在成为兼顾性能与精度的最佳选择。 与之相比,中国团队DeepSeek在V3.1模型中提出的UE8M0 FP8格式,走了一条完全不同的道路。UE8M0采取极简设计:8位全部用于指数(Exponent),尾数(Mantissa)为零。换言之,它牺牲了精度,以换取更大的动态范围。在这种格式下,最接近刚才图片内提到的数值0.3952的表示形式为0.5。可以很明显地看出来,精度差异较大,但是这种“极端化”的方案不仅减少了硬件实现复杂度,也为未来中国技术栈在模型训练、部署和推理中的数值优化提供了新的可能性。 1,FP8/UE8M0的优势与权衡 🔹 显存与带宽显著节省:相较于FP16和BF16,8-bit表示可将内存占用与传输成本大幅降低,有利于支持更大规模模型、更高并行度或更多批处理。 🔹 吞吐与能效提升:更窄的数据通路意味着在相同内核与内存带宽下,系统可处理更多算子,整体吞吐率和能效显著提升。 🔹 成本与部署门槛下降:低精度带来更高的性价比,对于数据中心及国产算力环境尤为重要,使大模型在受限带宽或成本条件下的部署成为可能。 🔹 软硬件协同优化:当模型与硬件围绕低精度格式协同设计时(如DeepSeek专门针对“国产芯片优化”),能够释放软硬件一体化的性能潜力。 但需要注意的是:更低位宽必然带来精度与鲁棒性下降,尤其是UE8M0这类极端“无尾数”设计,更依赖于训练、量化、校准等算法补偿,以及硬件支持机制。FP8在训练与推理端的应用边界,仍是学术界和工程界研究的活跃话题。 2,UE8M0的战略思维:软件先行推动硬件适配 UE8M0的“发起”方式具有鲜明的战略意义。不同于传统由硬件厂商先定义数据格式,DeepSeek选择在模型端率先采用并公开声明使用UE8M0格式,将其训练与scale策略与该精度绑定。 这等于由大模型端主动提出标准,迫使硬件和工具链进行适配。媒体普遍认为,这一举措是“模型先行推动硬件协同”的里程碑事件,加速了国产软硬件一体化的生态建设。 3,战略协同:AI与半导体的一体化生态 诚如笔者浅见:DeepSeek的高明之处在于其战略协同。公开资料显示,已有超过15家国内企业正在调整硬件以适配DeepSeek模型,覆盖电信、汽车、移动科技等多个领域,其中包括华为、中国移动等行业巨头。 这种合作并非单向: 🔹 对半导体厂商而言,DeepSeek模型成为性能与效率的标杆,推动其改进设计。 🔹 对DeepSeek而言,合作确保了其AI工具的落地基础,开发者与企业正在加速采用。 结果是形成一个自我强化的正反馈生态:软件与硬件同步演进,速度甚至可能超过美国碎片化的“AI公司依赖外部芯片”模式。 至此,看我推文比较久的小伙伴们或许还记得,我曾写过一篇解读DeepSeek论文的文章:《洞见 —— 硬件与模型协同设计,突破Scaling挑战》()。如今,看到国内AI企业在这条道路上迈出关键一步,实在令人欣喜。 4,国产芯片代表:寒武纪与华为的FP8路径 🔹 寒武纪(Cambricon)690系列 据多家媒体报道,寒武纪MLU370、思元590及最新的思元690均已支持FP8或“Block FP8”。其NeuWare软件栈在低精度支持上提供了完整的工具链,包括量化、混合精度调度以及对主流框架的适配。 在硬件层面,寒武纪的MLU架构通过算子引擎、片上缓存和张量内核优化,实现了高吞吐的低精度计算。媒体称思元690在低精度算力与能效上提升明显,已能够兼容DeepSeek模型。 需要强调的是,公司公开资料并未披露是否支持UE8M0这类极端格式,实际效果依赖SDK与模型方的适配验证。 🔹 华为(Ascend/昇腾) 华为提出了HiFloat8(HiF8)方案(),不同于E4M3/E5M2,而是一种“渐进式(tapered precision)”设计,根据数值区间动态分配指数与尾数,以在范围与精度之间取得平衡。 华为的Ascend系列已在OptiQuant、Atlas等平台上支持量化和混合精度,并将HiF8作为未来关键方向。与寒武纪偏重推理优化不同,华为强调同时支持训练的前向与反向传播,力图构建更通用的FP8训练方案。 5,大局观:AI已是国家战略 中国的AI发展早已超越实验室阶段,成为国家战略的重要组成部分。通过将AI软件与国产半导体深度结合,北京正在减少对外部技术的依赖,并为未来创新绘制蓝图。 DeepSeek的UE8M0 FP8优化,不仅是数值表示的一次尝试,更是中国在AI软硬件协同上的战略突破。 对投资者而言,启示清晰: 🔹 AI的未来不仅仅是算法,而是完整的生态系统。 🔹 DeepSeek与国产半导体生态的绑定,正在塑造这一趋势。 最终,问题不是中国能否实现AI自主,而是多块能够实现。而凭借UE8M0 FP8优化与深度产业整合,DeepSeek无疑是目前最值得关注的AI企业之一。
DeepSeek数据泄露:德国下架,信任崩盘· 446 条信息
#DeepSeek
#UE8M0 FP8
#国产AI
#半导体协同
#战略转折
分享
评论 0
0
在悉尼和稀泥
4个月前
AI 都找不到合适的,还怎么找女朋友 AI 都管不好,还怎么管人 AI 都不会压榨,还怎么当资本家
AI技术引发伦理争议,专家呼吁加强监管· 167 条信息
#AI
#找不到女朋友
#管人
#压榨
#资本家
分享
评论 0
0
在悉尼和稀泥
4个月前
Claude Code 使用技巧 4/n 请为我生成一个文档,这份文档必须是一个待办事项的清单。 每一个待办事项,都必须是完整的,可执行,可运行,可提交,相对独立。 这些待办任务的顺序,需要按照依赖和优先级的方式排列。 每一个待办事项,请按照单个任务不超过2小时自然时间来进行切分。 每一个待办事项,都包含一个简要明确的标题,以及可以直接用来复制粘贴到 Claude Code 里的提示词。 每一条提示词,如果可以的话,请遵循下面的要求: - 在开头明确 Claude Code 需要扮演的身份,例如“你是一位资深的设计师,” - 如果可以的话,请提供范例代码 - 明确约束和风险,清晰的告诉 Claude Code 不要做什么 - 输出请按结构化的方式输出 - 为需要ultrathink模式的任务添加ultrathink关键词 注意,上述提示词的要求,只是建议,请只在适用且你能因此更好工作的情况下再进行采用。 并将这份清单保存到"Claude-Context"文件夹中。 ultrathink
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude Code
#待办事项清单
#任务分解
#提示词优化
#ultrathink模式
分享
评论 0
0
上一页
1
...
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
...
248
下一页
AI 实时热榜 (24小时)
智能算法加权排行
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞