李老师不是你老师2025-04-06 11:49:264月5日 Meta发布了其新一代开源大语言模型Liama4,其拥有超过4000亿参数,Meta宣称该模型是同类中最好的多模态模型(可以处理图像输入输出),在参数量更少运行门槛更低的情况下,编程和推理能力上和DeepSeek V3相当。 并且该模型完全免费开源,用户可以从Liama官网下载并部署在本地。 #Meta#开源#大语言模型
倪爽2025-04-06 01:59:56“一人公司”的成功案例、电商平台 Gumroad 开放了源代码(注) 它背后的技术是 Ruby 和 MySQL,功能极简,上线 10 年才支持店铺功能😂,但这不影响它的影响力:不但帮创造者获得 10 亿美元利润,还建立了庞大的创造者社区 开放源代码之后,预计会有更多的开发者来扩展功能,类似 WordPress 那种大家一起赚钱的生态 --- 最有意思的是 Gumroad 创始人写了一本可能#Gumroad#开源#电商平台
海拉鲁编程客2025-04-02 22:47:02「去除 AI 味 Prompt」开源放到 Github 上啦(地址见评论区) 人工手写稿子被「朱雀大模型」判定为 50% 的 AI 生成。让我一度怀疑我自己是个套壳机器人。 老婆说你只是像,但并不是。 于是我悬着的心放下来了,一口气研究了去除 AI 味的一些方案,最终在 Gemini 2.5 Pro 上调通了这个 Prompt #AI#人工智能#去除AI味
AIGCLINK2025-03-29 16:54:06这两天闹的沸沸扬扬的朱啸虎唱衰具身智能的言论部分认同: 1. 当前具身智能领域大都还在走传统的路线,犹如2023年之前AI1.0时代的NLP和CV路线,后来transformer出现后将原先语言和视觉路线干废。具身智能也需要经历一次这样的临界点,当前还处于1.0时代,未来VLA模型成熟后,必然会将门槛极大的降低下来,泛化性能增强。 2.当前国内的大多数具身智能公司,很多都是用国外开源的路线二开#朱啸虎#具身智能#AI1.0
safari2025-03-27 13:06:21关闭的是 Android系统的公开开发进程,为的是减少合并分支时的冲突,不是开源本身 …… 新闻学到这个份上,没必要,真的没必要。 #Android#公开开发进程#开源
杀马特副教授2025-03-19 13:36:57最近辛顿认为开源的deepseek大模型类似把核武器给了普通人。 先不说这个比喻合不合理,其实这个比喻的背后有个更根本的问题:“谁有资格拥有核武器”? deepseek的模型是开源的,但是训练模型的方法并没有全部开源,到目前为止,利用deepseek提供的思路训练出来的大模型比如QWen QWQ,能够思考,“有点意思”,但是又“差点意思”。 不过客观的说,现在基于transformer le#辛顿#核武器#DeepSeek
李老师不是你老师2025-03-13 22:15:12$LI 社区项目🚨 () - 你的境遇,掷地有声 🚨 我们刚刚 开源 了网站代码,欢迎任何人在 确保自身安全 的前提下 镜像 “牛马.icu” ,让更多中国人看到彼此的境遇。 Github 仓库: 📖 镜像教程: 🔗 GitHub指南: 🌐 镜像站点示例: ⚠️ 安全警告 ⚠️ 如果你在中国或其他受限地区创建镜像,请务必注意: ❌ 不要 使用需要实名认证的国内服务器 ❌ 不要 #开源#网站镜像#安全注意
w8ay2025-03-03 10:28:45腾讯混元安全团队-朱雀实验室发布了AI-infra-guard大模型基础设施评估工具,检测AI系统潜在安全风险。 目前已在GitHub开源,支持检测30种AI组件,200+安全漏洞数据库,包含朱雀实验室发现的Nvidia Triton,Pytorch,ComfyUI与Ray等知名AI组件漏洞。 #AIsecurity #腾讯#混元安全#朱雀实验室
Gorden Sun2025-03-02 21:57:18olmOCR:可能是目前最好的开源OCR模型 基于微调后的7B视觉语言模型,微调数据为260000页PDF页面,完全开源,包括模型权重、数据和训练代码、推理代码,4090可以本地运行。 Github: 模型: 在线使用: #开源#OCR#视觉语言模型
辉小志2025-02-27 21:25:21开源R2Uploader🥳,现在有工作了,有了收入来源,不需要靠这个赚钱,因此决定开源。我半途而废了好多,这个算是完成度稍微高一点的产品了,但距离优秀的收费产品还有好多距离。希望我终有一日能做出真正赚钱的产品,我也会持续分享我的技术爱好和赚钱探索🥰#R2Uploader#开源#技术分享
karminski-牙医2025-02-26 09:13:05DeepSeek 开源周的3号炸弹来啦!DeepGEMM! 这是个FP8 通用矩阵乘法库,该库用 CUDA 编写,安装时无需编译,并且内置了JIT(真的牛逼)!官方数据最大性能获得了2.7倍的提升。 要知道在早些年高性能的BLAS库可是要收费的,并且卖得很贵。 地址: #DeepSeek #DeepSeek#DeepGEMM#FP8
NanYi2025-02-25 14:35:13字节系所有免费的大模型产品(豆包、扣子、trea、剪映等)的协议中都是明确了会“无条件的、永久的、不受限”收集数据(包括所有输入和输出)。trae也是几个vscode套壳AI工具里唯一一个不支持隐私模式也不承诺不使用用户工具的产品。 所以内部系统开发时除非达到开源的程度,不然都不建议用。#字节系#豆包#扣子
勃勃OC2025-02-24 15:16:28DeepSeek 推出了 FlashMLA,这是一款专为 Hopper GPU 设计的新解码内核,标志着其开源周的开始。FlashMLA 旨在提高 AI 模型的效率,支持 BF16,采用 64 块大小的分页 KV 缓存,并在 H800 GPU 上实现 3000 GB/s 的内存带宽和 580 TFLOPS 的高性能。 该内核针对可变长度序列进行了优化,大幅降低计算需求,同时提升 AI 任务的速度#DeepSeek#FlashMLA#HopperGPU
央视网-央视网2025-02-24 11:34:29DeepSeek 发布开源第一弹!让大模型在GPU上跑得更快2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。#DeepSeek#开源#大模型
央视网-央视网2025-02-23 20:22:58国产大模型加速迭代 开源渐成“必选项”据艾瑞咨询研究院预测,到2028年,中国人工智能产业的规模有望达到8110亿元,人工智能和机器人等新兴产业将释放出巨大的市场潜力和发展空间。#国产大模型#开源#人工智能
初码2025-02-23 20:11:51去年我还傻乎乎的认为需要通过泄露OpenAI等牛逼模型的权重文件来实现大跃进,至少Llama3没让我觉得他那二进制有啥价值,但DeepSeek真的扭转了这一局面,OpenAI离开源真不远了。并且,我们可以再次做出预测,2025年开始,会出现一个超级大善人,出资10亿美金以上,买很多设备,免费让各个社区里的聪明人也能轻松研究训练过程,这样的话,到2026年,大模型全生命周期所有软件工程都实现开源,又#OpenAI#Llama3#DeepSeek
背包健客2025-02-21 20:43:40生物学DeepSeek来了 2025年2月19日,Arc 研究所的 Patrick Hsu 和 Brian Hie 团队联合斯坦福大学、加州大学伯克利分校、加州大学旧金山分校以及英伟达的科学家,发布了有史以来最大的生物学人工智能模型——Evo-2,其在规模上堪比当前最强大的生成式人工智能大语言模型,但其训练仅使用了 2000 多个英伟达 H100 GPU,且该模型完全开源。 该模型训练了从单细#生物学#DeepSeek#Evo-2
orange.ai2025-02-19 07:49:33这这这。。。原来还可以把思想钢印抹掉? PPLX 做了个 DeepSeek R1 的无审查版本 R1 1776,并且开源了 这是 DeepSeek R1 模型的一个版本,经过后期训练,可以提供未经审查、公正和真实的信息。 为了让模型在敏感话题上“不受审查”,创建了一个包含 1000 多个示例的多样化、多语言评估集。 #思想钢印#无审查版本#开源
新浪新闻-新浪网2025-02-18 15:42:00从被动接入到主动开源,车企开启新一轮AI大模型之争车企AI大模型之争迈入开源阶段。接入爆火的DeepSeek,是春节后车企开启AI大模型竞争的首个风向标,但显然不是终局。..._新浪网#AI大模型#车企#开源