歸藏(guizang.ai)

统计数据

438
文章
0
粉丝
0
获赞
4509
阅读

热门文章

1

TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...

145 32
avatar
歸藏(guizang.ai)
4个月前
他们还搞了“50块就能包月爽用GLM-4.5,调用量无上限”的活动,50 块钱就能爽用! 扫码就行,名额有限,先到先得朋友们!
#GLM-4.5 #包月 #50元 #促销活动 #名额有限
avatar
歸藏(guizang.ai)
4个月前
Wan 2.2 视频模型开源 ! 大幅提升电影美学控制和复杂运动质量,ComfyUI 已经支持。 是我见过的第一个使用 MoE 架构的视频模型,高噪声专家(负责整体布局)和低噪声专家(精细调整细节) 5B 版本采用高压缩 VAE,优化显存使用,相比 2.1 版本数据大幅升级。
AI视频井喷:Midjourney领跑,多模态混战· 337 条信息
#视频模型 #开源 #电影美学 #MoE架构 #高压缩VAE
avatar
歸藏(guizang.ai)
4个月前
腾讯开源了一个 3D 世界模型,支持沉浸式漫游和交互 只需一句文字或一张图片,几分钟内即可生成高质量、风格多样的3D场景 采用语意层次化3D场景表征及生成算法,实现前景与背景、地面与天空的智能分离 无建模经验的普通用户也能通过简单指令或图片,快速生成360°沉浸式视觉空间
AI视频井喷:Midjourney领跑,多模态混战· 337 条信息
#腾讯 #3D世界模型 #开源 #沉浸式漫游 #AI生成
avatar
歸藏(guizang.ai)
4个月前
Veo3 这个提示词写法太好玩了,可以实现对画面的精确控制 把需要执行的提示词和顺序写在对应的位置,然后跟他说抹掉标记按顺序执行就行 试了两个案例都执行的很好
#Veo3 #提示词 #画面控制 #精确 #AI
avatar
歸藏(guizang.ai)
4个月前
宇树发布 Unitree R1 机器人,5900美元,相较之前的型号便宜很多。 25公斤,集成了多模态大语言模型可以交流
#宇树 #Unitree R1 #机器人 #多模态大语言模型 #5900美元
avatar
歸藏(guizang.ai)
4个月前
试了一下阶跃的智能视频通话的多模态能力,真的超强。 响应很迅速(为了观看效果有剪辑),识别效果相当准确,常见的画面内容都能识别还能进行一定的推理。 看了一下这个视频理解又快又准确的原因,可能涉及他们刚发布的 Step-3 背后多项多模态积累,这个视频通话属于多模合一能力。 今晚阶跃发布的Step3核心创新点在于,通过模型-系统协同设计,实现了极高的解码效率和成本效益。 在Hopper GPU上,Step-3的解码吞吐量高达4039 tokens/s/GPU,远超DeepSeek-V3的。 同时他们将注意力和FFN分别部署在不同GPU组,采用高效的流水线和通信机制,实现低延迟高吞吐。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 143 条信息
#阶跃 #Step-3 #多模态 #视频通话 #AI
avatar
歸藏(guizang.ai)
4个月前
通义 wan2.2 视频模型要来了
AI视频井喷:Midjourney领跑,多模态混战· 337 条信息
#通义 #视频模型 #wan2.2 #AI #科技
avatar
歸藏(guizang.ai)
4个月前
Claude Code 发布子 Agent 功能,输入 /agents 命令开启 现在提示词里可以指挥各种嵌套的 Agent 执行任务了 子 Agent 允许你创建一组专门处理不同任务的定制Agent。 比如专门用来设计功能的或者专门用来审查代码的 每个子 Agent 有独立的上下文和对话历史。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude Code #子 Agent #Agent 功能 #嵌套 Agent #任务执行
avatar
歸藏(guizang.ai)
4个月前
昨晚看 Lovart 发了正式版,就赶紧试了一下 这个 ChatCanvas 强的离谱,基本上定义了创意类 Agent 的交互范式 ​昨天刚说完 ax 就来了这么一个完美案例 你现在有一个不知疲倦指哪打哪的 AI 创意员工了 👇下面是详细的介绍和体验
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Lovart #ChatCanvas #AI创意员工 #交互范式 #完美案例
avatar
歸藏(guizang.ai)
4个月前
ChatGPT Plus 用户也开始推送 Agent 模式了 想尝试的朋友可以看看你的账号是不是也有了
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#ChatGPT Plus #Agent 模式 #推送 #用户
avatar
歸藏(guizang.ai)
4个月前
我之前个人聊天的时候一直在说 Vibe Coding 产品还有很多可以做的事情,各种专门为 AI 调用优化过的脚手架以及后端数据库和支付,今天终于有产品开始注意这个问题了。 过去我们说“独立开发者”,指的是一个人搞定产品、设计、开发、运营、商业化全流程的超级个体。但现实中,99% 的“独立开发者”都卡在了“我不会后端”、“我不会支付”、“我不会部署”这些环节上。 现在 MiniMax Agent 把这些环节全部抽象成了一句话的指令。
#AI调用 #独立开发者 #MiniMax Agent #后端 #支付
avatar
歸藏(guizang.ai)
4个月前
中间他遇到了 AI 都会遇到的问题,他发现自己的 Gemini 模型没办法调用翻译内容。 然后他开始自查发现是模型幻觉了,自己编造了 Gemini 的模型名称,这里他自己用 API 拉取了所有的模型名称,最后成功调用了 Gemini。 这才是我们理想中的 Agent 发现错误以后会自己寻找问题,然后自己尝试解决。
#Gemini模型 #模型幻觉 #agent #自我纠错 #API调用
avatar
歸藏(guizang.ai)
4个月前
然后由于现在我们有后端服务了,终于可以跑一些定时任务了,其中最常见的需求当然就是要求 AI 帮你监控某一类的信息。 我这里就让他监控最核心的三个 AI 公司的信息,Open AI、Anthropic 和谷歌的 Deepmind。 先看结果:
#AI #定时任务 #OpenAI #Anthropic #DeepMind
avatar
歸藏(guizang.ai)
4个月前
最后的结果非常令人惊喜,他几乎一次性完成了所有主要的核心流程,包括八字和六爻的计算,试用逻辑、支付弹窗以及登录注册逻辑。 我刚开始测试的时候基本没有管真人预约这部分,我就没想他能做,结果没想到,他这都做好了,在填写完信息之后他会告诉你预约成功了,工作人员会跟你联系。
#八字 #六爻 #预约 #核心流程
avatar
歸藏(guizang.ai)
4个月前
在做好左右准备之后他就直接开始设置数据库和构建对应的算法和项目了,这部分没什么好说的。 然后在完成项目之后他会主动进行代码测试和利用 Browser use 进行可视化测试,去点击每个网页的按钮查看实现效果和逻辑完整性。
#数据库 #算法 #代码测试 #可视化测试 #项目构建
avatar
歸藏(guizang.ai)
4个月前
完成了核心算法之后,他开始最难的两部分了,如何存储用户信息以及如何加入支付逻辑和支付系统。 这时候数据库 MiniMax Agent 用的是常见的 Supabase ,但是整个数据库创建和连接过程及其优雅. 直接在新建页面登录账号后点击授权按钮,就结束了不需要你寻找各种 API 和翻看后台。 Stripe 也是类似,只需要你填写你的 Stripe API Token 就行,完全不需要跳出页面就可以搞定。
#数据库 #支付 #API #授权
avatar
歸藏(guizang.ai)
4个月前
刚开始他很清楚自己不会算八字和六爻,所以非常谦虚的开始了学习,这要是其他类似的 Agent 估计就开始瞎编了。 八字这里他直接找了一个开源项目学习他的算法,六爻因为比较简单,本质是随机数,他就直接写了。
#开源项目 #八字 #六爻 #算法 #学习
avatar
歸藏(guizang.ai)
4个月前
如果对 AI 算命感兴趣的话可以来试试,每个用户会有 3 次试用机会,3 次试用结束会要求登录。 另外支付逻辑是写好的,但是我没有申请自己的 Stripe 账户,所以会支付失败。 你可以在这里尝试天机神算:
#AI算命 #试用机会 #支付失败 #天机神算
avatar
歸藏(guizang.ai)
4个月前
Vibe Coding 产品的时代变了朋友们 MiniMax Agent 获得大幅更新,现在支持前端和后端服务一起生产了 我一句话就搞定了一个完整的 AI 算命产品。 支持登录注册、两种算命方式、还能预约真人大师和购买会员 下面是具体的过程和其他案例🧵
#AI产品 #MiniMax Agent #前后端服务 #AI算命 #产品更新
avatar
歸藏(guizang.ai)
4个月前
Dia 浏览器的 Agent 模式也快上线了 他们这个 AI 在操作浏览器的时候很有意思,AI 会操作另一个鼠标箭头,跟你自己的不冲突,你可以 AI 可以各点各的
#AI浏览器 #agent模式 #鼠标控制 #人工智能 #浏览器自动化
avatar
歸藏(guizang.ai)
4个月前
K 2 的技术报告也发布了 专家数量:384个专家,每次前向激活8个,提升了稀疏性和性能。 注意力机制:采用多头潜在注意力(MLA),隐藏维度7168,注意力头数64(相比同类模型减少一半,提升长文本推理效率)。 优化器:创新性地提出了MuonClip优化器,将高效的Muon算法与QK-Clip权重裁剪机制结合,解决了大规模训练中的不稳定问题,防止注意力logit爆炸。 数据处理:预训练数据覆盖Web文本、代码、数学和知识四大领域,采用合成重写(rephrasing)技术提升token利用率,尤其在知识和数学领域通过多样化重写增强泛化能力。 训练规模:预训练总计15.5万亿高质量token,采用4096-token上下文窗口,后期通过YaRN方法扩展到128k上下文。 稀疏性Scaling Law:实验表明,在激活参数数固定的情况下,增加专家总数(提升稀疏性)能显著降低训练和验证损失,提升模型表现。 推理优化:减少注意力头数,降低长文本推理的计算开销,提升实际应用效率。 硬件:基于NVIDIA H800 GPU集群,采用多级并行策略和高效的激活存储与重计算技术,保证大模型训练的可扩展性和稳定性。
#K 2 #多头潜在注意力 #MuonClip优化器 #权重裁剪 #大规模训练
avatar
歸藏(guizang.ai)
5个月前
相较于 Open AI 的 Agent 模式,我觉得昨晚最重要的发布是这个 DecartAI 发布了 MirageLSD:世界上首个实时直播视频模型,可以将摄像头的画面实时转换为其他风格和内容的视频。 延迟只有 40 毫秒,而且支持无限长度视频生成!
#DecartAI #MirageLSD #实时视频模型 #视频生成 #低延迟
avatar
歸藏(guizang.ai)
5个月前
ChatGPT 录音模式向所有 Plus 用户推出 可以长时间录制会议内容并且生成对应的转录和总结,你也可以进行对话
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
avatar
歸藏(guizang.ai)
5个月前
今晚又有 OpenAI 直播了
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#OpenAI #直播 #技术 #发布会
avatar
歸藏(guizang.ai)
5个月前
4o 图像模型 API 获得更新,现在人脸、徽标等精细元素的还原度变高,他们终于把没阉割过的 4o 模型换回来了
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#4o模型 #图像API #人脸识别 #徽标识别 #模型更新
© 2025 news.news. All rights reserved. 0.05991 秒. v1.0.46
我的评论