时政
财经
科技
虚拟货币
其他
登录
#模型优化
关注
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
3天前
看懂meta对GPRO的优化就能搞清楚后训练的90%了吧
#Meta
#GPRO
#后训练
#模型优化
#技术分析
分享
评论 0
0
素人极客-Amateur Geek
1个月前
nano-banana的更新,是一个AI创新的历史性节点。 这个模型揭开了一块AI行业的一块遮羞布。 所有能打的AI绘画模型,不是产品的原因, 仅仅是因为不懂业务,只看需求! 他们认为,客户的需求很重要, 于是追求完成这个需求。 但是完成这个需求,需要扎实的业务功底。 和一个巨长的业务执行流程,整个路径非常复杂。 相当于让一个种地的老汉,去米其林后厨做一份牛排。 大厂同行:都在追求炫酷的简单输入,炫技输出。 领导很兴奋,员工跑断腿,效果打折,周期创作周期巨长。实际在业务上,能解决的问题非常有限,业务识别空缺,导致模型产品化路径的曲折。 总是研究的放后面,能引发话题的放前面。 废了一百年的努力,做出来一个半吊子东西。 结果:小白骂娘,从业者骂娘,营销号捧上天,消费者寥寥无几。 小厂同行:技术实力不足,资源不足,使了大劲满足一点点需求,还需要强大的知识探索欲,技术实践成本高,花几个月时间,巨大资金成本解决一个小问题。有一部分使用基础,熊瞎子劈苞米,消费者丢一群再拉一群。迭代根本没法持续覆盖。 结果:学会的用烦了,没学会的又很难学会。 开源同行:应用做了七七八八,精神世界满足开花,加起来服务没几十万人,全都是赚到钱没给开源创作者花。模型迭代一次,坟头高一尺,没准哪个模型出来,过去的技术根本没有迭代的必要。 结果:有道义的同行人,纷纷跳坑,只剩下几个孤儿。 懂业务,是做AI的前提。 我很早就说过,2023年我之所以用AI绘画, 是因为我要画分镜,我们花了大量的努力, 在2024年初就实现了和名人合影,训练一致性模型。 很多现在简单的功能在一年多前都可以实现, 不懂业务的人,连看都看不懂。 今天nano-banana每一个功能都是直切业务核心点的。 他不是单纯的一个模型技术的更新。 论修改,其实有很多了,方法也有很多。 但是这个模型,一次性把所有的业务关窍打通了。 其实sora已经很厉害, 但是sora对业务的覆盖没那么全面。 几个月前,很多谷子店类的供应商, 都开始用sora做业务内容了。 但限制很多,可是从我们对模型理解来说, 开源模型是技术瓶颈, 但是对于sora这些模型,有些业务细分, 不应该是这个模型的瓶颈。 举个简单的例子,让柯南从空手到拿一枝花没有问题。 但是你让一个手办,手上多一个东西却非常难。 从业务的角度讲,这件事其实一点不难。 可sora就是不给你优化, 是技术不到位吗?MJ那么简单的操作,实现不了吗? 完全就是对业务理解的偏差。 那么我们再举一个MJ的例子, 这个模型的审美水平强不强? 说实话,一年以前, 我们就可以用这个模型来实现多视角服装模特了。 还有仿真人的虚拟真人角色创建。 但是技术实现上非常讨巧, 至今可能没人能做到, 我们也不愿意把这些东西传播出去。 但大多数人的视野里,是看不到MJ模型本身的能力的。 MJ公司追求的什么我也不知道, 就知道他们在不断的做,跟业务贴边的东西, 就是不好好优化,导致这个模型的二次修正特别多。 我再说一遍,上面两个问题,不是模型能力不行, 就是公司对各行各业需求的业务不理解。 谷歌证明给你们看了,谁也不需要反驳, 站着挨打就完事了。
#AI创新
#nano-banana
#业务理解
#AI绘画
#模型优化
分享
评论 0
0
Mr Panda
1个月前
GPT-5 对模型进行统一设计, 想必背后最重要的动机是为了节省成本。 它采用内部类似路由的系统用来决定问题的特点,例如: 如果是简单问题,可以选择路径成本低的4o 之类的模型 如果是复杂的推理问题, 可以是自动选择 o3 诸如此类, 一定会大降低 OpenAI 算力成本。 对于我这样的用户来说 ,平时用 o3 多, 屁大的事,我都要用o3 deep think 一下, 等模型思考片刻再给我答案, 这其实很浪费算力。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 521 条信息
#GPT-5
#成本节约
#模型优化
#算力
#OpenAI
分享
评论 0
0
orange.ai
1个月前
OpenAI 开源的两个模型 gpt-oss 并不是说它们有多强(接近 4o-mini 水平肯定是有一点的) 而是优化得比较极致 一个能跑在高端笔记本上 一个能跑在高端手机上 听牛逼的 不过极致的优化下,一般都会带来严重的缺陷和降智 需要一点时间来看看
#OpenAI
#gpt-oss
#模型优化
#高端设备
#潜在缺陷
分享
评论 0
0
henu王凯
2个月前
非常感叹,我读了两遍ChatGPT Agent的公告:ChatGPT Agent不是用的已有模型,是OpenAI专门优化过的模型。 世界上做模型最厉害的公司专门为Agent优化了模型,这个模型就算后续开放API给Agent创业者,你怎么在ChatGPT Agent场景覆盖内和其竞争呢?
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 521 条信息
#ChatGPT Agent
#OpenAI
#模型优化
#竞争
#技术
分享
评论 0
0
蓝点网
3个月前
基准测试显示降价 80% 后的 OpenAI #o3 模型在性能上与原始版本没有区别,OpenAI 并未通过替换模型来降价。 OpenAI 回应开发者担忧价格下降的同时模型能力也下降,OpenAI 称通过优化服务堆栈降价,模型完全相同。独立基准测试社区 ARC Prize 经过测试后发现 o3 模型性能确实没有下降。 查看全文:
OpenAI大幅降价,o3模型API调用费用骤降80%· 6 条信息
#OpenAI
#o3模型性能
#价格下降
#模型优化
#ARCPrize基准测试
分享
评论 0
0
夜谈
4个月前
昨天读的论文是关于ai驱动的全自动科研 今天的论文是关于ai的全自动量化算法开发 微软亚洲研究院的最新论文提出了一种全新的“数据驱动、多智能体协同”的量化研究与开发(R&D)自动化框架 RD-Agent(Q),实现了量化金融因子和模型的端到端联合优化。 以下是论文主要内容的中文解读:🧵
#AI自动化
#科研自动化
#量化算法
#多智能体协同
#数据驱动
#微软亚洲研究院
#量化金融
#量化研究
#模型优化
分享
评论 0
0
小径残雪
7个月前
这几天在倒腾把Deepseek 7b模型装到本地的M1上,感觉token吐得有点慢,效果也比较差。今天看见清华的ktransformer,大幅提升推理速度,搞不好能直接单机运行DS满血版。等高手跑通以后搞一搞。
#DeepSeek
#模型优化
#清华ktransformer
#M1
#推理速度
#单机运行
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞