时政
财经
科技
虚拟货币
其他
登录
#视频生成
关注
sitin
2小时前
sora2 可还行哈哈哈哈🤣
#Sora2
#人工智能
#视频生成
#科技
#乐观
分享
评论 0
0
歸藏(guizang.ai)
4小时前
整个新玩法,直接将电影台词放进 Sora 2,这不库库起量! 这里我是把《一代宗师》的台词放进去搞得,提示词只有台词和控制画面风格的词,不涉及任何画面内容 结果出来的效果非常好,一致性也很强,剪到一起就可以用了
#Sora 2
#电影台词
#一代宗师
#AI
#视频生成
分享
评论 0
0
vbarter
16小时前
现在不用app,不用翻墙,也可以访问Sora2了。国内直接访问。注册直接可以生成20次视频,小范围测试!
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#Sora2
#国内访问
#无需APP
#无需翻墙
#视频生成
分享
评论 0
0
howie.serious
21小时前
原来还有一个 sora 2 Pro 效果可能是朝着pro 级视频生成去的,prompt 也详细到到吓人(图3) chatgpt pro用户可以用。但估计也只是尝鲜,多用的话即使200美金pro会员也包不住,也得额外付费。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 524 条信息
#Sora 2 Pro
#视频生成
#ChatGPT Pro
#额外付费
#技术尝鲜
分享
评论 0
0
Gorden Sun
1天前
一直想做这个,现在Sora可以直出
#Sora
#AI
#视频生成
#科技
#创新
分享
评论 0
0
小互
1天前
🚨OpenAI 发布全新多模态生成模型:Sora 2 这次不只是生成视频,还能同步生成语音、环境音,甚至把你“插入”视频当主角! 模型亮点: - 支持多个镜头的连续生成 - 动作更物理真实、世界状态可控 - 真人Cameo登场,只需录一次就能随时穿越进任意场景 - 支持写实、动漫、电影等风格切换 - 新版 iOS App 已上线,支持 remix、个性化推荐、青少年保护等功能 👀 OpenAI 表示:Sora 2 是视频界的“GPT-3.5 时刻”! 下一步,还将开放 API 接入,可能成为生成式视频的“iPhone 时刻”。 📱目前仅限美国/加拿大 iOS 用户试用,全球上线敬请期待!
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#OpenAI
#Sora 2
#多模态生成模型
#视频生成
#AI
分享
评论 0
0
Gorden Sun
1天前
差一点点就完美 #Sora2
#Sora2
#AI
#视频生成
#技术进步
#期待
分享
评论 0
0
Gorden Sun
1天前
用上Sora 2了,Plus会员也能生成视频。这团体舞质量还挺高,就是画面很糊。 进这个频道,左侧的Sora2话题,有人会分享邀请码,每个人可以生成1个,能邀请4个新人。让我想起了clubhouse。
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#Sora 2
#视频生成
#Plus会员
#邀请码
#画面质量
分享
评论 0
0
小互
4天前
Google 研究揭示:Veo 3 达到了视觉AI领域的“GPT-3”时刻 Google DeepMind 通过对Veo 3进行18,384个最简单的视频生成任务测试后,发现: Veo 3,除了生成视频,还能在没有训练的情况下,自动完成各种复杂的视觉任务,比如找物体、修照片、玩迷宫、解数独。 它可以: - 看懂图像:自动识别边缘、轮廓、物体位置、颜色、形状等; - 理解物理:知道什么会漂浮,什么会下沉;知道光是怎么反射的; - 动手编辑图像:可以“自动P图”,像移除背景、添加文字、转成油画风格等; - 自己“推理”:比如看一张迷宫图,它可以画出走迷宫的路线! 研究认为,Veo 3 可能达到了视觉AI领域的“GPT-3”时刻!
智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限· 9 条信息
#Veo 3
#视觉AI
#GPT-3时刻
#Google DeepMind
#视频生成
分享
评论 0
0
sitin
1周前
国产 Wan 2.5 首发上线 这款国产模型不仅在体验上直追甚至超越 Veo 3,价格更是只有对手的几分之一。 它把视频生成的门槛压缩到“一键生成”,从文字到画面、从声音到口型、从单人到多人场景,全都能一步搞定,彻底改变了创作者的生产方式。 Wan 2.5 的核心优势 更实惠 谷歌 Veo 3 依然昂贵,限制了大规模应用。Wan 2.5 则更轻量化,极具性价比,让更多中小团队和个人创作者都能负担得起。 一步生成,端到端同步 只需输入提示词,即可同时生成视频画面、配音和精准口型同步。无需再单独录音、剪辑或对齐,大大简化了制作流程。 多语言支持 不仅能完美处理中文提示,还支持小语种生成,真正面向全球市场。相比之下,Veo 3 在中文场景下经常出错,而 Wan 2.5 在中文和多语言上的表现更加稳定。 更自然的镜头语言 在运镜、镜头切换和画面构图上,Wan 2.5 表现出了电影级的水准,让生成的视频不仅“能看”,而且“好看”。 风格与场景丰富 支持双人互动、复杂场景、人物特征还原,还能渲染吉卜力风格的动画效果,兼顾写实与艺术化需求。 实用场景 营销推广:新品发布、广告宣传、产品演示,快速生成高质量视频,节省拍摄和后期成本。 跨国企业:多语言视频一键生成,帮助企业轻松完成本地化内容制作。 创作者/YouTuber:沉浸式剧情视频、短片、动画,快速输出高质量内容,提升粉丝粘性。 企业培训:培训教程、流程演示,风格统一,输出高效,学习体验更生动。 教育与在线课程:低成本制作多样化教学视频,提高学生理解和参与度。 自由创作者/工作室:从宣传片到社交媒体内容,随时实验不同风格,效率与创意双提升。 实际效果示例 中文语义理解:能准确识别并渲染中文元素。 口型与语音同步:数字人、访谈场景都能做到自然流畅。 多角色生成:支持双人对话场景,保证互动自然。 运动与音效结合:运动场景中的音画同步更加真实。 风格化渲染:吉卜力风格等动画质感,满足创作者的艺术表达。
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#国产模型
#Wan 2.5
#视频生成
#性价比高
#多语言支持
分享
评论 0
0
向阳乔木
1周前
Veo3最强平替来了 没想到阿里一口气发布了300多个不同的模型。 最喜欢 Wan 2.5 preview 视频生成模型,5s-10s 1080P,音画一体,中文支持完美。 刚测试了个美女转身对口型,表情控制极其好,甚至有皱眉等小细节.. 阿里夸克造点、通义平台的wan 2.5视频排长队... 地址见评论区,后续更新各模型能力评测
阿里开源Wan-Animate,角色动画与替换技术引发热议· 8 条信息
#阿里
#Wan 2.5
#视频生成
#AI
#平替
分享
评论 0
0
Gorden Sun
2周前
HuMo:专注生成人物的视频框架 支持文本、图片、语音输入,生成人物为中心的视频。后续会开源HuMo-17B和HuMo-1.7B视频模型,目前也可以用Wan-2.1作为视频模型。 项目地址: Github:
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#HuMo
#视频生成
#人物视频
#开源模型
#Wan-2.1
分享
评论 0
0
Steven W.
1个月前
大家有没有试过用grok生成视频的功能? 看大佬分享的案例感觉效果不错啊🧐
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#Grok
#视频生成
#AI
#体验分享
#积极
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
如果说LLM的元认知和文本生成能力把需要我们的思考解决的NP类问题,变成了P类问题,让我们变成了一个验证者; 那精确的图像生成和视频生成则同样会替代了我们的想象,我们天马行空的空间想象与创造,意味着什么?
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#LLM
#元认知
#文本生成
#图像生成
#视频生成
分享
评论 0
0
Gorden Sun
1个月前
X的图片可以一键用Grok生成视频了,很顺滑
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#X
#Grok
#视频生成
#一键
#顺滑
分享
评论 0
0
Gorden Sun
1个月前
Stand-In:保持生成视频的角色一致性 微信开源的项目,用于AI视频模型的插件,可以保持生成视频的角色一致。 项目地址: Github:
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#角色一致性
#AI视频模型
#微信开源
#Stand-In
#视频生成
分享
评论 0
0
Gorden Sun
1个月前
StableAvatar:音频驱动生成视频 图片+音频,生成唱歌或说话视频,支持生成无限时长的视频。 Github:
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#音频驱动
#视频生成
#唱歌
#说话
#GitHub
分享
评论 0
0
Austin
1个月前
我整理了25 个 AI 工具,帮助你全方位提效。 1. Figma(设计) 2. Jitter(动画) 3. Framer(正在学习) 4. Bolt(界面探索) 5. Streamline(图标) 6. Creative Market(样机) 7. Midjourney(图像 + 视频生成) 8. Runway(电影级视频生成) 9. Veo 3(视频 + 声音生成) 10. ChatGPT 4o(全能) 11. Claude(编程辅助) 12. Astra(4K 视频放大 + 细节增强) 13. Bloom(图像放大 + 细节增强) 14. Landbook(落地页灵感) 15. Pinterest(通用设计灵感) 16. Pixel Buddah(Photoshop 特效) 17. Contra(品牌收款) 18. Stripe(代理开票) 19. Loom(客户沟通) 20. Screen Studio(屏幕录制) 21. Artlist(音效) 22. Restream(直播推流) 23. Figma Slides(幻灯片) 24. Trello(项目管理) 25. Spark(邮件)
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#AI工具
#效率提升
#设计
#视频生成
#图像处理
分享
评论 0
0
nicekate
1个月前
刚发现 Gemini Pro Flow 有 1000 积分,居然能生成 50个 Veo 3 - Fast 视频 而且视频放大到 1080P 居然不要花积分,谷歌太良心了
Google Gemini 2.5发布引发AI模型性价比热议· 204 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 524 条信息
#Gemini Pro Flow
#Veo 3
#视频生成
#1080P
#谷歌良心
分享
评论 0
0
Crypto_Painter
1个月前
用AI生成的视频,素材来自我可爱的宝贝echo! 感觉接下来可以搞很多东西了!
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#AI
#宝贝echo
#视频生成
#积极
#家庭
分享
评论 0
0
Gorden Sun
1个月前
Grok的视频生成。。。还得是马斯克 另外生成图片快到感受不到时间,一边下划一边出图,跟刷小红书一样。。。
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#Grok
#马斯克
#视频生成
#快速
#小红书
分享
评论 0
0
Gorden Sun
1个月前
Grok可以生成视频了,速度特别快,效果一般,大概可灵1.5的水平。 操作交互乱的一批,完全不知道咋操作。
#Grok
#视频生成
#AI
#交互体验差
#效果一般
分享
评论 0
0
nicekate
2个月前
NotebookLM 的视频生成功能让我有付费冲动:整体质量出色。 我用《Andrej Karpathy: Software Is Changing (Again)》做了测试,除了一处音画不同步、音频被截断外,其余片段的同步都很到位。 它的幻灯片页设计也令人眼前一亮——简约但不简单;看多了 Manus 一类的页面,再看这种清新风格格外舒服。 字幕是我加的
AI视频井喷:Midjourney领跑,多模态混战· 198 条信息
#NotebookLM
#视频生成
#Andrej Karpathy
#软件变革
#用户体验积极
分享
评论 0
0
黄赟
2个月前
Coze 一键生成旅游有声笔记,搭配 seedream 3.0 生图模型。大家来看看,能不能慰藉下 lsp,哈哈哈哈哈哈 其实,还可以: 1/ 旅拍广告宣传 2/ 旅游攻略 3/ 朋友圈装杯 明天试试 seedream 3.0 的视频生成。翻了一天火山引擎的文档,头都快炸了
#Coze
#旅游有声笔记
#seedream 3.0
#火山引擎
#视频生成
分享
评论 0
0
黄赟
2个月前
这份剪映草稿生成包,可以全自动完成视频生成和混剪。甚至你可以: 1/ 提供 Coze 插件 2/ 售卖 API Key 这两天在做 coze 视频全自动工作流,我甚至为它付费了
#剪映
#Coze
#视频生成
#自动化
#工作流
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞