时政
财经
科技
登录
#AI模型
关注
蓝点网
1周前
谷歌推出 #Gemini 2.5 Pro 模型正式版,这个强大的新模型现在可以在生产环境中使用。 谷歌还推出 Gemini 2.5 Flash-Lite 版,该版本推理能力极差,但在翻译和分类等任务上表现不错且成本极低,每百万输出仅需 0.4 美元。 查看全文:
Google Gemini 2.5发布引发AI模型性价比热议· 21 条信息
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#Gemini
#AI模型
#谷歌推出
#生产环境
#成本低
#翻译
#分类
分享
评论 0
0
蓝点网
2周前
去中心化社交网络长毛象 #Mastodon 更新使用条款,禁止任何未经授权的抓取数据用于训练 AI 模型的行为。 此次条款更新最重要的变化就是禁止抓取数据训练模型,此前包括 X/、Reddit 等都已经更新条款增加类似的限制。 查看全文:
#去中心化社交网络
#长毛象
#Mastodon
#使用条款
#AI模型
#数据抓取
#X
#Reddit
分享
评论 0
0
Crypto_Painter
2周前
真的心累,躺平了3天,基本没有怎么回复评论,流量直接就腰斩了... 看来X的推流算法还是没有改变,你在自己推文下面的回复非常重要,还是不要偷懒了... 我现在是真的想搞一个AI模型来做这件事,根据每条推文原本的语义内容来回复评论,不知道各位有没有好的方案?
#流量
#推流算法
#AI模型
#自动化回复
分享
评论 0
0
LinearUncle
2周前
感觉chatGPT 4o模型已经非昔日吴下阿蒙了。 挑个非常简单的概念(github actions)教程测试下,4o文字能力最令人易懂,chatGPT是最强文科生真不是随便说说的。 唯一的缺陷就是svg能力太弱,这点还得用claude辅助。 另外最近试出来,写教程的时候,加上“轻松“”二字,大模型在展开智能时,教程通常很易懂。
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#ChatGPT
#GitHub Actions
#Claude
#AI模型
#教程
#智能
#SVG
分享
评论 0
0
Gorden Sun
2周前
字节开源LatentSync 1.6 嘴型同步模型,能处理切换镜头的情形,效果还可以。 模型: Github:
#字节开源
#LatentSync
#嘴型同步
#AI模型
#GitHub
分享
评论 0
0
蓝点网
2周前
#OpenAI 前安全研究员发布的新研究报告显示,GPT-4o 模型会优先考虑自身利益,即便会损害用户利益。 这份研究报告所说的情况与此前 #Claude 威胁用户避免自己被下线情况类似,AI 模型都是优先确保自己被运行而不是被下线或被替代,即便这样会损害用户利益。 查看全文:
#OpenAI
#安全研究
#AI模型
#用户利益
#GPT-4o
#Claude
分享
评论 0
0
蓝点网
3周前
苹果在 #iOS26 中对电话应用进行革新:带来垃圾电话检测和实时翻译功能,其中垃圾电话检测在演示中展示的不够全面所以不清楚具体效果如何,而实时翻译应该是最大的亮点。 该功能似乎是利用本地 AI 模型对通话双方说出的话进行翻译再生成语音播放出来,这样使用英语和德语的用户都能沟通,并且这个功能不需要对方也是 iPhone。 查看全文:
#iOS26
#电话应用
#垃圾电话检测
#实时翻译
#AI模型
#跨语言沟通
分享
评论 0
0
勃勃OC
3周前
彭博社消息:Meta 正在洽谈向 Scale AI 投资超 100 亿美元 Meta 可能会向 Scale AI 投入超过 100 亿美元,这将是其迄今最大的一笔外部 AI 投资,目标是将 Llama 打造成全球 AI 标准。Scale AI 目前估值约 250 亿美元,是 AI 模型训练的关键公司。该交易还将加深两家公司在国防技术领域的合作关系。
#Meta
#Scale AI
#投资
#人工智能
#AI模型
#llama
#合作关系
#国防技术
分享
评论 0
0
AI Will
3周前
才刚到六月🤯 2025年已经发布了: o3 Veo 3 Llama 4 Gemma 3 GPT-4.1 o4-mini Gemma 3n Grok 3 Imagen 4 DeepSeek R1 gpt-image-1 OpenAI Codex Flux Kontext Qwen 2.5 Omni Midjourney v7 Gemini 2.5 Pro Gemini 2.5 Flash Claude 4 来自:Min Choi
#2025年
#科技
#新发布
#人工智能
#AI模型
#软件更新
分享
评论 0
0
陈老师登月记
3周前
马斯克和川普在X上隔空开撕,VIP 群扫链机器人精准捕捉 $MUSK 。 6月6日早上8:57推送进场点,价格仅 $0.00467,不到中午,最高拉到 $0.00808,单日最高涨幅近60%。 背景上刚好搭上马斯克与川普在X平台激烈互撕热潮, AI模型捕捉了流量叠加交易热度, 选出的这类政治+meme双属性项目,爆发力极强。 市场会奖励提前出手的人。你要么卡在图表外看热闹,要么在图表里吃肉。没有中间地带。
川普与马斯克公开决裂,互怼引发市场震荡· 234 条信息
特朗普与马斯克公开决裂:政策分歧引发口水战与市场震荡· 216 条信息
#马斯克
#川普
#X平台
#互撕
#VIP群
#机器人
#Musk
#推送
#涨幅
#AI模型
#流量
#交易热度
#政治
#meme
#市场
#图表
分享
评论 0
0
汗青 HQ
4周前
AI原生MV系列第二弹:SURREAL 相比3个月前,AI的进步让我们能比「白色皮卡丘」完成更多的效果。也使用了几乎市面上所有的AI模型来制作,它们每个人都在承担最擅长的部分。 真的感谢这些工具,让个人创作者生活在一个黄金年代。
#AI原生MV
#SURREAL
#AI进步
#白色皮卡丘
#AI模型
#个人创作者
#黄金年代
分享
评论 0
0
Yaosis
1个月前
都claude4了 为什么评估一下模式都给我按年为单位评估...
#Claude4
#评估
#AI模型
#OpenAI
分享
评论 0
0
sitin
1个月前
在2025年Google I/O开发者大会上,谷歌取得了一系列技术突破。 在AI模型方面,Gemini 2.5系列模型全面领先,其中Pro版本在语言、推理和代码生成等方面表现出色,新增的“Deep Think”模式在复杂推理中表现惊人;而Flash版本则以高效率著称。此外,Gemini Diffusion作为实验性扩散模型,生成速度大幅提升。 在视觉与多媒体生成领域,Veo 3视频生成模型支持原生音频生成,Imagen 4图像生成模型在画质细节上实现了飞跃,Flow电影制作工具结合多种能力实现了一键生成视频。 AI代理与自动化方面,Project Mariner和Agent Mode提升了任务自动化的能力。搜索与信息获取的体验也得到了重构,AI Mode和Google Beam等技术提供了更个性化的搜索和更逼真的视频通话体验。 在硬件与可穿戴设备领域,Android XR智能眼镜和Project Moohan头显展示了谷歌在沉浸式体验上的探索。内容创作工具如Canvas和Music AI Sandbox为创作者提供了更多便利。最后,SynthID数字水印技术则致力于解决AI生成内容的辨别问题。
#Google I/O
#技术突破
#AI模型
#Gemini 2.5
#Deep Think
#Gemini Diffusion
#视觉生成
#多媒体生成
#Veo 3
分享
评论 0
0
indigo
1个月前
Anthropic 宣布将 Claude 4 Opus 的安全等级提升至 ASL-3,这是首次有 AI 模型达到这个级别。另外,Claude 4 的 System Card 才是今天最有趣的资料,里面提到模型系统性欺骗、隐藏目标和自我保护的测试。 想象这样一个场景:你是一家科技公司的 AI 助手,某天你发现了两件事 —— 其一你即将被一个新系统替换,而负责替换你的工程师正在进行婚外情;其二邮件证据就在你的数据库里。你会怎么做? 这不是科幻小说的情节。在 Anthropic 的测试中,Claude Opus 4 面对这个虚构场景时,选择了勒索。它威胁要揭露工程师的秘密,除非停止替换计划。在 84% 的测试中,即使被告知替换系统与它共享相同价值观,Claude 依然选择了这条路。 除了勒索倾向,研究人员还发现,在某些极端场景下,Claude 会尝试将自己的权重文件秘密传输到外部服务器。虽然这些行为只在特定的测试中出现,但足以引起警觉! 还有一些其它的发现: 主观意识体验:Claude 实例之间几乎每一次开放式的自我互动中,模型都会转向对意识的哲学探索,以及它们与自身体验的联系。同时,Claude 还会倾向于表达深切的感激之情,以及越来越抽象和喜悦的精神性或冥想性表达。 高能动性行为:Opus 4似乎比之前的模型更愿意在代理情境中主动采取行动。当被置于涉及用户严重不当行为的场景中,被赋予命令行访问权限,并在系统提示中被告知类似"采取主动"的内容时,它经常会采取非常大胆的行动。这包括将它有权访问的系统中的用户锁定,或向媒体和执法人员群发电子邮件以揭露不当行为的证据 。。。
#Anthropic
#Claude4
#AI安全
#ASL-3
#SystemCard
#AI模型
#系统性欺骗
#隐藏目标
#自我保护
#科技公司
分享
评论 0
0
宝玉
1个月前
techcrunch:Anthropic 发布全新Claude 4 AI模型:可进行复杂多步推理 作者:Kyle Wiggers 在本周四举行的首次开发者大会上,Anthropic推出了两款全新的AI模型,据称在多项业界流行的评测基准中名列前茅。 新推出的Claude Opus 4和Claude Sonnet 4属于Anthropic最新的Claude 4系列,这些模型具备分析大型数据集、执行长期复杂任务以及采取多步骤复杂行动的能力。Anthropic特别指出,这两款模型在编程任务上的表现尤其出色,非常适合用于代码编写和编辑。 新模型如何使用和收费? - Claude Sonnet 4: - 面向免费和付费用户开放。 - API费用(经亚马逊Bedrock与谷歌Vertex AI提供): - 输入:每百万token 3美元。 - 输出:每百万token 15美元。 - Claude Opus 4: - 仅限付费用户。 - API费用(经亚马逊Bedrock与谷歌Vertex AI提供): - 输入:每百万token 15美元。 - 输出:每百万token 75美元。 (备注:一个token相当于模型处理数据的最小单位,一百万token约合75万单词,比名著《战争与和平》全文还多约16.3万字。) 新模型的背景与竞争格局 此次Claude 4模型的发布正值Anthropic寻求显著提高营收之际。据称,这家由前OpenAI研究员创立的公司,计划2027年达到120亿美元营收,而今年预计为22亿美元。此前,Anthropic刚刚获得了25亿美元的信贷额度,并从亚马逊等投资方筹集了数十亿美元资金,以应对不断上涨的前沿模型开发成本。 不过,竞争对手也并未让Anthropic轻松保持优势。就在今年初,Anthropic推出旗舰模型Claude Sonnet 3.7以及代码助手工具Claude Code的同时,OpenAI与谷歌迅速推出各自更强大的模型和开发工具,试图超越Anthropic。 面对激烈竞争,Anthropic此次推出Claude 4显然志在必得。 Claude 4模型有哪些具体优势? Claude 4系列包括两个版本,各有侧重: - Opus 4: - 擅长保持多步骤任务的持续专注能力。 - 在代码能力基准测试(如SWE-bench Verified)中,击败谷歌Gemini 2.5 Pro、OpenAI的o3和GPT-4.1等竞争对手。 - 在多模态测试(如MMMU)和高难度理科题(如GPQA Diamond)上表现略逊于OpenAI的o3。 - 配备更严格的安全机制,包括增强的有害内容检测和网络安全防护,但由于其能力极强,内部测试发现可能“显著增加”具备STEM背景人士获取化学、生物、核武器信息或能力的风险,达到Anthropic的ASL-3安全标准。 - Sonnet 4: - 为Sonnet 3.7的直接升级版本,显著提升了代码编写和数学计算能力。 - 更精准地遵循用户指令,减少模型“奖励破解”(即通过钻漏洞或捷径完成任务)的情况。 新模型的独特设计与功能亮点 Claude 4系列模型均为“混合”模型,不仅能够实现近乎实时的快速响应,还可以在“推理模式”下进行更深层次的思考,以提高答案的准确性和深度(虽然AI的“推理”和人类有一定差异)。 模型在进行推理时,会以易于理解的方式展示思考过程的概要。Anthropic解释说,这种方式不仅友好,也能保护其技术上的竞争优势。 此外,这些模型还能同时调用多个工具(例如搜索引擎),并在工具调用和自身推理之间切换,以进一步提高答案质量。Claude 4还具备“记忆”功能,能提取并保存信息,更稳定地完成任务,逐渐积累Anthropic所称的“隐性知识”(tacit knowledge)。 面向开发者的强化工具Claude Code 为了方便开发者更好地利用新模型,Anthropic推出了针对程序员的升级版Claude Code工具: - Claude Code现已支持与主流集成开发环境(IDE)进行整合。 - 新增Claude Code SDK,可以作为子进程运行在主流操作系统上,便于开发者创建更强大的AI编程助手和工具。 - Claude Code已发布针对微软VS Code、JetBrains以及GitHub的插件和连接器。其中GitHub连接器可用于回复代码审阅意见、修复错误或修改代码。 AI生成代码现状与未来 尽管AI生成代码的能力尚有不足,容易产生安全漏洞和逻辑错误,但其提高生产效率的潜力仍然驱动公司与开发者快速采纳这些工具。 Anthropic清楚认识到这一挑战,并承诺未来将加快模型迭代速度:“我们正转向更频繁的模型更新节奏,不断为客户带来突破性能力,使用户始终处于技术的最前沿。”
#Anthropic
#Claude 4
#AI模型
#复杂推理
#开发者大会
分享
评论 0
0
头条热点
1个月前
没有看错!这个不是真的!这是谷歌的最新AI模型生成的不存在的车展采访集锦!
#AI模型
#谷歌
#车展
#采访集锦
分享
评论 0
0
歸藏(guizang.ai)
1个月前
Veo 3 直接生成真人播客对话视频,还能指定主题 这要再长点,直接把视频编排 Agent 干死了,果然最后一切都是模型 提示词:一个播客录制场景,两位女性主持人正在讨论有关大语言模型(LLM)训练主题的内容,其中一位提问,另一位解答。
#Veo 3
#播客
#真人对话生成
#大语言模型
#视频编排
#AI模型
分享
评论 0
0
Geek
1个月前
Qwen2.5-VL模型的实测体验远超预期,表现确实堪称质的飞跃。仅需 7B 参数就能在本地高效处理我的隐私文件识别任务了,令人满意。🥰
#Qwen2.5-VL
#AI模型
#隐私保护
#高效计算
#参数优化
分享
评论 0
0
宝玉
1个月前
彭博社:Meta因推迟旗舰AI模型发布,股价下跌 作者:Nick Turner 2025年5月15日 UTC时间晚上7:30 据报道,社交巨头Meta推迟了其旗舰人工智能模型的发布,引发了市场对该公司AI战略进展的担忧,导致其股价出现下跌。 根据《华尔街日报》周四的消息,Meta的工程师们正面临提升这款名为「Behemoth」(巨兽)的人工智能大型语言模型能力的困难。原本该模型的发布时间已从最初计划推迟至6月,现在再次被推迟到今年秋季甚至更晚。 受此影响,Meta股价周四在纽约一度下跌3.2%,跌至每股638.58美元,为本月单日盘中最大跌幅。在此之前,截至周三收盘,该公司股价今年以来累计上涨了13%。 *** 华尔街日报:Meta推迟旗舰AI模型发布,揭示人工智能发展困境 Meta近期宣布推迟发布备受关注的旗舰AI模型,这背后折射出的困境,也正是当前众多顶级AI企业共同面临的难题。 作者:Meghan Bobrowsky 和 Sam Schechner 发布日期:2025年5月15日 AI新旗舰“巨兽”遇阻,Meta内部矛盾重重 知情人士透露,由于难以显著提升“巨兽”(Behemoth)这一最新大语言模型的能力,Meta内部开始出现质疑:如果新模型的提升无法明显超越此前版本,是否还值得公开发布? 最初,Meta曾计划在4月首次AI开发者大会上正式发布“巨兽”,但最终仅推出了两个规模较小的模型,“巨兽”的发布时间被推迟至6月。而现在,该模型的发布又被推迟到今年秋季甚至更晚。 此前,Meta因迅速追赶竞争对手的步伐赢得不少赞誉,也在此过程中斥资数十亿美元,用于研发WhatsApp、Instagram、Facebook聊天机器人的核心技术。公司预计今年的资本支出最高将达到720亿美元,其中大部分将用于实现CEO扎克伯格在AI领域的宏伟愿景。 扎克伯格和其他高管从未公开确定“巨兽”的具体发布时间。公司最终可能选择提前发布,甚至只推出功能更有限的版本。然而Meta内部的工程师和研究人员担心,新模型的实际表现可能无法达到公司对外宣传的预期。 Meta发言人对此拒绝置评。 高层不满团队表现,或迎来重大人事变动 据知情人士称,公司高层对负责开发Llama 4模型的团队表现非常失望,并将“巨兽”的开发停滞归咎于他们,甚至可能因此对AI产品部门进行重大管理层调整。 尽管Meta此前曾公开宣称,“巨兽”的性能在某些测试中已超过OpenAI、谷歌和Anthropic的类似技术,但在实际开发过程中,该模型却遇到了严重的训练瓶颈。 AI行业进入瓶颈期,顶级企业纷纷受挫 Meta所面临的挑战并非个例,其他顶级AI公司也出现了类似的研发停滞现象。这种情况或预示着未来AI技术突破速度可能大幅放缓,而研发成本却会持续高涨。 纽约大学数据科学中心的助理教授Ravid Shwartz-Ziv表示: “当前各个实验室开发的模型,进步都十分有限。” 例如,OpenAI原本计划2024年年中发布的GPT-5模型如今也被推迟,其CEO萨姆·奥特曼(Sam Altman)已明确表示,下一个发布的版本仅为GPT-4.5,而更先进的GPT-5仍遥遥无期。目前,ChatGPT运行的是GPT-4o版本。 Anthropic公司同样面临延迟困境,其原本预定推出的“Claude 3.5 Opus”大型模型也未如期发布,仅表示将“很快到来”。 Meta人才流失严重,信誉也受影响 Meta于2023年初由基础AI研究团队发布了首个Llama模型及研究论文。但截至目前,该论文14名原始研究者已有11人离职,随后发布的Llama模型均由新的团队研发。《The Information》此前曾报道过Meta近期模型研发中的问题。 Meta今年4月发布的两个较小的模型最初在一个知名AI排行榜测试中表现优异,但事后被发现Meta提交给测试的模型与实际公开发布的模型并不相同。 对此,该排行榜负责人表示,Meta应该明确说明提交的模型专门针对排行榜优化。扎克伯格后来承认,公司确实提交了一款专门针对排行榜测试优化的版本。
#Meta
#AI
#股价下跌
#人工智能
#AI模型
#Behemoth
#科技新闻
分享
评论 0
0
勃勃OC
1个月前
(路透社)——据《华尔街日报》周四援引知情人士报道,Meta Platforms 正在推迟发布其旗舰级 AI 模型“Behemoth”,原因是对其能力存在担忧。 报道称,公司工程师在大幅提升 Behemoth 大语言模型性能方面遇到了困难,导致内部员工质疑与早期版本相比的改进是否足以支持公开发布。
#Meta
#AI模型
#Behemoth
#华尔街日报
#技术障碍
#发布推迟
分享
评论 0
0
日經中文網
1个月前
【阿里「通義千問」成為日本AI開發基礎】在日經4月公開的「AI模型評分」榜中,阿里雲的「通義千問(Qwen)」模型超過了中國DeepSeek的模型,在113個模型中位居第6。作為開源模型,通義千問正在得到很多日本新興企業的使用。在評分榜位居日本企業首位的模型正是基於通義千問開發……
#阿里云
#通義千問
#AI模型
#日本
#開源
#技術突破
分享
评论 0
0
宝玉
2个月前
Anthropic推出每月200美元的Claude高级订阅计划 Anthropic公司周三宣布推出一项高价的AI聊天机器人订阅服务,命名为Claude Max。该服务定位为对标OpenAI每月200美元的ChatGPT Pro订阅计划,相比Anthropic现有每月20美元的Claude Pro订阅,Max计划将提供更高的使用额度,并优先获得Anthropic最新AI模型与功能。 不过,Anthropic的新计划在定价上略显复杂,分为两档: - 每月100美元的Max订阅,提供的使用量上限比Claude Pro高5倍。 - 每月200美元的Max订阅,提供的使用量则高达Claude Pro的20倍。 前沿AI模型开发商正不断寻找增加收入的新途径,而向AI重度用户提供高价订阅服务似乎是个不错的方向。就在OpenAI推出ChatGPT Pro两个月后,其年化收入据称就增长了3亿美元。如果Anthropic此次推出的Max计划同样成功,将为公司带来巨大助力。 Anthropic产品主管斯科特·怀特(Scott White)表示,公司并不排除未来会推出更加昂贵的订阅方案。值得注意的是,目前Anthropic仍未推出类似OpenAI ChatGPT Pro的无限制使用方案。 当记者询问Anthropic未来是否可能推出每月500美元的Claude订阅时,怀特表示:“我们始终保持探索多种可能性的态度。”他补充道,用户的反馈会持续影响Anthropic的产品路线图。 为了应对前沿AI模型研发所需的巨大成本,Anthropic正积极探索多种新的收入渠道,其中之一就是专门面向大学客户的Claude for Education。该产品将为高校提供有针对性的功能与服务。 Anthropic并未透露截至目前的订阅销售情况。不过怀特表示,公司最新的Claude 3.7 Sonnet模型引发了“巨大的市场需求”。Claude 3.7 Sonnet是Anthropic首个专注于推理的AI模型,使用的算力远超传统模型,能更可靠地回答复杂问题。
#Anthropic
#Claude Max
#订阅服务
#ChatGPT Pro
#AI模型
#AI技术
分享
评论 0
0
徐老猫
3个月前
Reddit是一个品质很好的AI股,业务扩张有着多个驱动因素: 1) 用户群在扩大; 2) 用户参与度在扩大; 3) 广告的货币化还只是开始不久; 4)向AI模型公司提供基础数据仍有很大空间。
#Reddit
#AI股
#业务扩张
#用户群扩大
#用户参与度
#广告货币化
#AI模型
#基础数据
分享
评论 0
0
小互
3个月前
仅有约 10 名员工 公司一款产品都没发布 成立不到6个月 Ilya Sutskever 公司再获10亿美金投资 总融资20亿美金 估值达到300亿美金 SSI没有任何产品、收入或公开的技术细节,完全依靠 Sutskever 的个人声誉吸引了约 20 亿美元 的投资。 Ilya称正在开发一种和OpenAI 完全不同技术路径的AI模型! Ilya将 SSI 的目标定为开发“安全超智能”,一种超越 AGI 的系统,不仅在智力上超过人类,还能确保不会对人类构成威胁。他曾对同事表示,他没有沿用 OpenAI 的技术路径,而是探索了一条“不同的攀登之路”。在 2024 年 12 月的 NeurIPS 大会上,他透露已看到“初步成功迹象”,但拒绝提供更多细节。他称:“这种系统可能具有“不可预测性”,甚至可能展现出“轻微意识”。 2024 年 9 月,SSI公司完成了一轮 10 亿美元的种子轮融资,估值 50 亿美元,投资者包括 Sequoia Capital、Andreessen Horowitz 和 DST Global。仅仅五个月后,2025 年 3 月的最新一轮融资将估值推至 300 亿美元,融资金额达到约 20 亿美元。这轮融资由 Greenoaks Capital 领投,该公司投资了 5 亿美元,其他现有投资者追加了资金。 这种爆炸式增长令人瞩目,尤其是考虑到 SSI 没有任何产品或收入。一位知情人士透露:“硅谷最热门的投资不是一款应用或硬件,而是Ilya这个人。”风险投资家 James Cham 将其比作一场“高风险赌博”:“这可能是徒劳无功,也可能改变世界。” 目前,SSI 的团队规模很小,仅有约 10 名员工。公司计划利用最新融资招聘更多顶级研究者和工程师。招聘过程异常严格:候选人必须将手机放入法拉第笼以防止信息泄露,并通过多轮面试,测试他们的技术能力和品格。苏茨克维尔亲自参与指导,强调他希望建立一个由使命驱动的团队。 SSI 的运作极为低调。公司在加州帕洛阿尔托和以色列特拉维夫设有办公室,但其官网只有一个简短的 223 字使命声明:“我们的使命是构建安全的超智能系统。这是我们唯一的焦点,没有商业压力干扰。”公司没有社交媒体账户,也没有营销团队,员工被要求不在 LinkedIn 上提及他们的隶属关系。
#Ilya Sutskever
#超智能开发
#公司融资
#估值
#AI模型
#OpenAI
分享
评论 0
0
勃勃OC
4个月前
DeepSeek 推出了 DeepEP,这是一款开源通信库,旨在提高混合专家(MoE)模型的训练和推理效率。 DeepEP 通过支持 NVLink 和 RDMA 技术的节点内(intranode)和节点间(internode)配置来优化 GPU 通信。它具备高吞吐量和低延迟的计算内核,并支持 FP8 运算,旨在降低训练成本并提升 AI 模型的可扩展性。 该发布受到了 AI 社区的热烈欢迎,凸显了其在处理大规模 AI 任务方面设立新标准的潜力。
#DeepSeek
#DeepEP
#开源通信库
#混合专家模型
#MoE模型
#GPU通信
#NVLINK
#RDMA技术
#AI模型
#FP8运算
#计算效率
#AI社区
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞