Gorden Sun
4小时前
RynnVLA-002:整合的视觉-语言-行动和世界模型 阿里达摩院开源的模型,整合了VLA的世界模型。世界模型用于生成场景图片,VLA模型用于生成动作,同时也支撑世界模型生成图片。除了用于可交互的世界场景外,更适用于机器人任务。在评测数据集的表现上,接近闭源模型。 模型:
小樱💞|实用工具分享
1天前
🚀 Nano Banana 2.0 这哪里是升级,这是掀桌子! 真的做到了:一图生世界 我生成的 18 个绝佳案例 ⬇️ 🏗️ 建筑图 → 实物渲染图 👗 小红书穿分析图 📷 照片光影调节 📐 股定理动图 / 原理解说图 📱 产品架构图…… 全部收录在: