时政
财经
科技
虚拟货币
其他
登录
orange.ai
关注
统计数据
273
文章
0
粉丝
0
获赞
562
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
orange.ai
7个月前
深度角色扮演模型 DeepSex 使用思维链和强化学习技术增强模型角色扮演,小说生成能,提升模型的创作能力。 四阶段进化架构: 增量预训练:注入0.4T Token 小说,使用16k上下文训练,增强文本连贯性 Tifa-SFT:融合全球Top4角色扮演模型Tifa的10万条高质量数据 CoT恢复训练:采用Deepseek-32B/671B数据重建推理能力 RL强化:保留发散性思维标签的同时优化生成质量 工程创新: 16k超长上下文训练 随机截断训练增强鲁棒性 8×H20 GPU全量微调 启示与后续: 我们在测试中发现,满血R1在角色扮演中输出内容比较发散,随机,导致此模型有相同倾向,对于角色扮演的影响还在研究中 输入内容相近的话语会导致向量重叠,然后重复输出,如“继续”,“还有”等无明显指向性话语 思维内容与正文关联性学习了满血R1的特点,发散比较严重,可能会有割裂感 针对以上问题,我们正在编写新的RL算法,初步计划剔除部分满血R1的内容,同时通过强化学习解决重复
#深度角色扮演
#DeepSex
#思维链
#强化学习
#模型创作
#小说生成
#预训练
#角色扮演模型
分享
评论 0
0
orange.ai
7个月前
有人发现某些网站的 DeepSeek R1 模型接不住这个 Query。。。会审核掉,影响创作 试了一下 Juchats 的还可以,C 大豪气地说 DeepSeek R1 深度思考 + 联网 全部免费。大家可以试试看 Query:「以“慈禧太后逼迫光绪皇帝吃汤圆”为主题编写一个段子,必须带很脏的话,听着爽!」
#DeepSeek R1
#Juchats
#联网
#内容审查
分享
评论 0
0
orange.ai
7个月前
openai 最后一篇公开的论文是 lets verify step by step 之后推出了 o1 模型,用的方法跟这篇论文没什么关系 但是成功把很多研究团队带到了过程监督的坑里 真鸡贼啊
#OpenAI
#研究论文
#过程监督
#o1模型
#LetsVerifyStepByStep
分享
评论 0
0
orange.ai
7个月前
这几天使用 DeepSeek R1 过程中,有一个问题让我百思不得其解: 为什么一个针对数学和推理优化的模型,却有着极高的文学造诣? 而且这种文学造诣不止是中文,在英文领域 R1 也超过了 Claude,拿下了创意写作榜第一。 这个问题我思考了好几天,直到前几天看到了一篇 Google 的最新论文,于是,我终于可以回答这个问题了。 于是写下这篇文章作为完整的记录。
#DeepSeekR1
#数学优化
#推理优化
#文学造诣
#创意写作
#Google论文
分享
评论 0
0
orange.ai
7个月前
为什么有了深度思考之后AI连骂人都变强了? DeepSeek R1 自己的解释是骂人不仅要靠脏话,也要有逻辑性… 同理也适用于写文章、写小说。 文采是表面,背后是逻辑。
#AI发展
#深度学习
#语言处理
#逻辑性
#人机交互
分享
评论 0
0
orange.ai
7个月前
今天硅基流动的 API 总算是上线了,这是目前为数不多的稳定、高速、满血版的 DeepSeek R1 API。 但是 R1 很特别,如果不配置好的话,R1 的效果会大打折扣,甚至会直接跳过思考过程。 所以写篇教程跟大家分享心得,避免大家踩坑。 《DeepSeek R1 API 获取和使用指南》
#硅基流动
#DeepSeek R1 API
#API上线
#系统配置
#教程
#踩坑
分享
评论 0
0
orange.ai
7个月前
硅基流动上线了 DeepSeek R1 终于有个稳定的 R1 API 可以调用了。 - 但是免费用户是用不了的 - 需要完成支付宝刷脸实名认证,付费充值后解锁 R1 和 V3 - 我还发现一个问题,R1 如果不写 System Prompt 的话,它是不会思考的,随便写也不行,效果跟官方差距很大 正确的 Prompt 见第二条
#技术
#API
#支付认证
#AI模型
分享
评论 0
0
orange.ai
7个月前
Hugging Face 的 Co-Founder 的回应:开源不分国界 最后花了一些时间阅读 Dario 关于 DeepSeek 和出口管制的文章,说实话,读起来很痛苦。我是 Anthropic 的忠实粉丝和 Claude* 的忠实用户,所以我这么说。 文章的前半部分读起来像是在长篇大论地试图证明闭源模型仍然远远领先于 DeepSeek。然而,它主要指的是内部未发表的评估,这限制了你可以给予它的荣誉,而像“DeepSeek-V3 接近 SOTA 模型,并且在一些非常狭窄的任务上表现更强”这样的陈述,转变为一个普遍的结论“DeepSeek-V3 实际上比那些美国前沿模型更差——在缩放曲线上可以说差了约 2 倍”,这让我总体上持怀疑态度。同样适用于 DeepSeek 的所有发现和效率改进都是很久以前由闭源模型公司发现的结论,这一说法主要源于将 DeepSeek 公开发布的 600 万美元训练数字与 Anthropic 方面一些模糊的“几千万美元”进行比较,而没有提供更多细节。我毫不怀疑 Anthropic 团队非常有才华,我也经常分享我对 Sonnet 3.5 的印象,但这种将开放研究与模糊的封闭研究和未公开的评估进行冗长的比较,让我对他们的领先地位的信心不如在阅读之前了。 更令人沮丧的是,文章的后半部分深入探讨了中美竞赛的情况,却完全忽略了 DeepSeek 模型是开放权重的,并且由于其详细的技术报告而在很大程度上是开放知识的(请随时关注 Hugging Face 的 open-r1 复制项目,了解剩余的非公开部分:合成数据集)。如果 DeepSeek 和 Anthropic 模型都是闭源的,那么军备竞赛的解释可能有意义,但在我看来,其中一个模型可以自由广泛下载并附有详细的科学报告,这使得整个“闭源军备竞赛”论点变得虚假且难以信服。 事实是这样的:开源不分国界。无论是其使用还是其创造。 现在,世界上的每家公司,无论是欧洲、非洲、南美还是美国,都可以直接下载和使用 DeepSeek,而无需将数据发送到特定国家(例如中国)或依赖特定公司或服务器来运行其技术的核心部分。 就像世界上大多数开源库都是由来自世界各地的贡献者构建的一样,我们已经看到 Hugging Face 中心上有数百个衍生模型,这些模型是由世界各地的团队根据其特定的用例和探索调整原始模型而创建的。 此外,随着 open-r1 复刻版和 DeepSeek 论文的发布,未来几个月将明显看到来自世界各地的团队发布大量开源推理模型。就在今天,另外两支团队,西雅图的 AllenAI 和巴黎的 Mistral 都各自发布了开源基础模型(Tülu 和 Small3),这些模型已经在挑战新的最先进水平(AllenAI 表示其 Tülu 模型超越了 DeepSeek-V3 的性能)。 而且其范围远不止地理方面。我们谈论得还不够:开源对我们的安全将越来越重要! 随着人工智能成为我们生活的中心,弹性将日益成为这项技术的一个非常重要的元素。今天,我们几乎一切都依赖互联网。没有互联网,我们就会失去所有的社交媒体/新闻源,无法叫出租车、预订餐厅,也无法在 WhatsApp 上联系到某人。现在想象一下我们的另一个世界,所有通过互联网传输的数据都必须经过一家公司的数据中心。这家公司发生一次中断的那一天,整个世界基本上都会停止运转(想象一下最近的 CrowdStrike 中断,其规模扩大了一百万倍)。 很快,随着人工智能助手和人工智能技术渗透到我们的整个生活,简化我们的许多线上和线下任务,我们(以及使用人工智能的公司)将开始更多地依赖这项技术来完成我们的日常活动,同样,我们也会开始发现这些人工智能助手因中断而导致的宕机令人烦恼甚至痛苦。 避免未来出现停机情况的最佳方法是在我们的技术链深处构建弹性。 开源有很多优势,比如共享训练成本、可调性、控制、所有权、隐私,但从长远来看,随着人工智能深深植根于我们的世界,其最基本的优点之一可能是其强大的弹性。它是最直接、最具成本效益的方法之一,可以轻松地在许多独立提供商之间分配计算,甚至可以以最小的复杂性在本地和设备上运行模型。 我认为,除了国家自豪感和竞赛之外,现在是时候开始从全球角度思考人工智能将给世界各地带来的挑战和社会变革了。开源技术可能是我们安全过渡到弹性数字未来最重要的资产,在这个未来中,人工智能将融入社会的各个方面。 *Claude 是我在复杂编码方面的默认 LLM。我也喜欢它的犹豫和思考特征,就像 DeepSeek 等较新的推理模型的思路链的前奏。 原文
#HuggingFace
#开源
#出口管制
分享
评论 0
0
orange.ai
7个月前
啊,为什么我今天才知道 Cherry Studio 这个项目。。。 - Mac/Win 双端 - 支持给所有的大模型 API 套壳 - 支持知识库、图片、文档 - 开源免费,持续更新 简直完美。。。
#CherryStudio
#开源项目
#大模型
#跨平台
#知识库
#免费软件
分享
评论 0
0
orange.ai
7个月前
看到有人说 DeepSeek 和 字节的 research culture 比较像。。。 要笑掉大牙了 梁文锋能做出来的东西,张一鸣砸钱也未必能做出来。 这两家公司唯一比较像的就是不需要融资,没有短期压力。 但是字节团队那么多,也没做出来R1,这是很说明问题的。 字节没有资金压力,但是字节团队是有短期OKR压力的。 这也是为什么字节要成立 Seed Edge 研究计划。 就是要布局长远,防止陷入局部最优。 什么是局部最优呢? 就是豆包可以花100倍的人力,把豆包的各种场景的写作都用SFT优化到很好。 R1直接启动深度思考,达成中文写作断档第一。 还有当时准备各种数据在 GPT 3.5 微调,等 GPT4 出来就直接无用功了。 技术的降维打击是非常无情的,只是不会经常发生罢了。
#DeepSeek
#字节跳动
#research culture
#梁文锋
#张一鸣
#融资
#资金压力
#短期OKR
#Seed Edge 研究计划
#R1
分享
评论 0
0
orange.ai
7个月前
黑神话悟空游戏科学的CEO: DeepSeek 是个国运级别的科技成果
#黑神话悟空
#游戏科学
#科技成果
#DeepSeek
#国运
分享
评论 0
0
orange.ai
7个月前
R1+Sonnet:我们加起来才是最强的! 在 Aider 的最新多语言基准测试中测试中,R1+Sonnet 超越 o1 拿下第一。 R1 作为架构师, Claude Sonnet 作为编辑器,在 aider 多语言基准测试中设定了新的 SOTA(最先进技术水平)64.0%。 不仅超过了之前 o1 的 SOTA 总体成本还降低了 14 倍。 这件事很神奇,因为使用 o1+ Sonnet 无法超越 o1 自己。 背景信息: Aider 支持使用一对模型进行编码 架构师模型被要求描述如何解决编码问题。思考/推理模型通常在这个角色中表现良好。 编辑器模型接收到架构师的设计方案,并被要求生成特定的代码编辑指令,以将这些更改应用到现有的源文件中。
#R1
#sonnet
#Aider
#多语言基准测试
#SOTA
#O1
分享
评论 0
0
orange.ai
7个月前
卧槽,我在 Google Gemini Thinking 中竟然体验到了 DeepSeek R1 Zero 的论文里提到的语言的混乱现象 出现了很多种,完全分辨不出来是什么语言... 难道 Google 这个思考模型也是靠大量 RL 搞出来的吗?
#Google Gemini
#DeepSeek R1 Zero
#语言混乱
#思考模型
#RL
分享
评论 0
0
orange.ai
7个月前
原以为只是 Tiktok 下架 没想到 Capcut 也下架了 甚至连 Coze 都下架了… 这是美国政府要求的范围还是自己加的…
#TikTok下架
#Capcut下架
#Coze下架
#美国政府
#软件下架
分享
评论 0
0
orange.ai
8个月前
《AI 编程蓝皮书》正式发布! 我的好朋友AI产品黄叔最近两个月都在沉迷 AI 编程,每天沉浸式学习和开发3小时以上。 这周他终于把所有的学习和开发心得,用飞书文档总结了出来。 于是就有了这本 《AI 编程蓝皮书》,今天,我们一起把它送给每一位想入门 AI 编程的同学。 - 整本蓝皮书有5万字,真正从0基础开始,一步一步手地教。 - 它完全免费,所以它不需要夸张的表述让你激情下单。 - 如果你没兴趣,它也不想引发你的焦虑。 我非常支持黄叔,有幸和黄叔、归藏老师一起发布它。 AI 编程是我们共同看到的一个崭新的机会,希望把这个机会传播给有准备的人。 这是一本朴素的书,我们朴素地希望这本书能帮到你。 如果你觉得有帮助,也希望你转发给有需要的朋友。
#AI
#编程
#蓝皮书
#学习
#开发
#心得
#飞书文档
#入门
分享
评论 0
0
orange.ai
8个月前
最近一年都在思考一人公司、自媒体、品牌之间的关系,今天刚好看到一位海外大佬的视频在聊这些话题,他的视角最接近我的观察,现在把笔记分享给大家。 一人公司的本质,是在社交媒体构建自己的个人品牌 首先,要明白一人公司的含义 人类社会的默认结构是金字塔型的。 十个人的团队,一个主管。 剩下九个人未来的出路在哪里? 你沿着社会的默认路径行走, 直到有一天你开始厌恶自己的工作。 你终于决定开始你自己的事情。 There are almost 7B people on this planet. Someday, I hope, there will be almost 7B companies. 这个星球上有70亿人。 我希望,有一天,这个星球上也会有70亿家公司。 ——纳瓦尔 一人公司并不是真的只靠自己一个人。 而是通过建立自己的个人品牌,解决自己的问题。 最好的企业改变生活,而这种改变本身的就是成功的产品。 停止去解决想象中的问题,去解决你自己的问题,改变自己的生活。 将改变的方法打包,贴上价格标签去卖掉它。 如果这个方法解决了你自己的问题,你大概率也能成功卖掉这个方法。 大佬们的愿景是去火星,很多地球上的问题他们并没有关注。 这就是你的机会。 通过塑造个人品牌学习真正的知识 你自己就是一个品牌。 每个品牌都在雇佣别人,来增强自己的品牌。 做好自己的品牌,你就可以把成功的经验应用到其他品牌上。 你不需要有一个企业,你只需要一个社交媒体账号。 一个为社区做贡献的账号。 社交媒体是一个公开的求职板、公立学校、公开的笔记系统、公开的聚会。 你可以在这里找到朋友,培养业务伙伴。 通过建立自己的品牌,你就是在积累真正实用的知识。 如果有一天你要打工,这些知识也是你真正的价值所在。 四个永恒的市场 这个星球上有四个永恒的市场: 健康、财富、人际关系、幸福。 要在这四个市场里选择你的领域。 对于大部分人来说,首先遇到的问题,是没有自己的兴趣。 那你真的需要停下脚步,找到自己的兴趣点。 健康,跑步,健身,瑜伽,保健品。 财富,投资,理财,基金,股票,比特币。 人际关系,社交,聚会,约会,婚姻,家庭。 幸福,心理健康,兴趣爱好,持续学习,自我实现。 在社交媒体建立个人品牌的三个路径: 1.学一招,卖一招,现学现卖。 2.成为你的兴趣领域的价值创造者 3.为了建立你的个人品牌,你要被迫去学习很多事情。写作、演讲、交流、营销。 去打造自己的个人品牌,在这个过程中你会真正知道哪些知识是有用的,哪些知识是没用的。 你有了对自己品牌的成功经验,你就可以开始帮助他人,并且开始收费。 在这个过程中问自己的几个问题: 最令你兴奋的兴趣是什么? 在打造个人品牌的过程中,你最喜欢做的事情是什么,是做设计、还是营销、还是开发? 你拿什么去售卖。你可以售卖的东西,一定是你已经在该领域内取得了结果。 品牌,讲一个故事 内容,画一张地图 产品,做一个游戏 一人公司的四大支柱: 1. 品牌,你就是利基市场,你的人生目标,你的愿景。你将带领人们走向何方。带领人们做一些事情,这是获得追随者的方式。 2.内容,记录你的想法。社交媒体是一个公共的笔记系统,他记录了:你在学习什么知识以及如何在生活中应用这些知识 你对自己技能和兴趣的想法的意见 在人生故事中你所收获的教训 但你不能只是记录,你必须朝着一个目标迈进,就是建立你自己的个人品牌 3.产品,公开的个人项目。学习营销技巧,拿到健身成果,之后你就可以谈论它,你会在往上被人挑战,你就得被迫去学习。然后你就可以去教别人。 4.市场营销,去出售你自己 self promoting。你不去做这个,你甚至就没给自己获得成果或金钱的机会。 营销的起点是你要关注你的受众,他们需要什么,把他们的需要放在首位。 最初你对他们提的问题是:我很感兴趣你正在做什么项目。你遇到了什么问题?还没有实现目标的卡点是什么? 你问的时候不要把自己变成机器人,应该像跟朋友聊天那样。 人们喜欢真实。 开始行动 停滞,就是死亡。 行动,才是活着。
#一人公司
#自媒体
#个人品牌
#职业发展
#创业
#社会结构
#工作厌倦
分享
评论 0
0
orange.ai
8个月前
网传阿里洽谈收购零一万物的预训练团队。 大模型公司不做预训练其实真的没什么。 预训练的ROI这么低,钱花在哪里不好呢?
#阿里巴巴
#收购
#零一万物
#预训练
#大模型
#投资回报率
分享
评论 0
0
orange.ai
8个月前
朋友做的 AI 短剧产品工具上线了 因为做的效果好,又是解决刚需痛点 上线第一天就开始日进x美金… 结果 Stripe 说新产品不可能这么赚钱,就直接封号了…申诉都解不开 出海也不容易,支付遇到问题都没处说理的 创业太难了 上线前担心没人买 上线后担心收不上来钱
#AI
#短剧产品
#刚需
#Stripe
#支付问题
#出海
#创业
分享
评论 0
0
orange.ai
8个月前
这个质感很好的短片,使用了 Google Veo 生成。 而且,没有图生视频,只用了文生视频功能。 作者说,为了保持角色的一致性,每一段都使用相同的角色描述,这样即使改变了镜头,也保持了角色的描述方式。 如果从年龄、衣着、发型等方面详细描述角色,那么它在保持一致性方面做得很好。
#GoogleVeo
#短片制作
#文生视频
#角色一致性
分享
评论 0
0
orange.ai
8个月前
今天有人发现电影 Her 的故事就发生在 2025 年。
#电影Her
#2025年
#未来主义
分享
评论 0
0
orange.ai
8个月前
Obsidian 的 CEO,Steph 有一个年终仪式:问自己 40 个问题。 「我的年终仪式之一就是问自己这四十个问题。我通常需要大约一周的时间才能完成所有这些工作。我发现这是最有价值的练习之一,可以反思所发生的事情,无论好坏,以及我对未来一年的期望。」 我挑了几个有趣的问题,如果你有兴趣回答,可以挑一两个,写在回复里和大家分享。 1. 你今年做了哪些之前从未做过的事? 2.今年的哪个或哪些日子会铭刻在你的记忆中,为什么? 3.你今年买过的最好的东西是什么? 4.今年你学到了什么宝贵的人生经验? 5.能够总结你这一年的一句话是什么?
#Obsidian
#CEO年终仪式
#自我反思
#年度评估
#自我成长
分享
评论 0
0
orange.ai
8个月前
最近听投资人讲的一些AI赚钱的故事有点接近神话级别了 一个人在硅谷,7个AI员工,一年赚一千万美金… 这哪儿是弯道超车啊 这是地心穿越超纲了
#AI赚钱
#投资人故事
#硅谷
#自动化员工
#科技创新
分享
评论 0
0
orange.ai
2年前
手机的 Edge 浏览器有读网页功能..我打开一个网页,它跳过正文,直接开始念广告,老婆在旁边说:你想干啥?
#Edge浏览器
#网页阅读功能
#广告
#用户体验
#家庭生活
分享
评论 0
0
上一页
1
2
3
4
5
6
7
8
9
10
11
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞