#视觉生成

10个月前

在2025年Google I/O开发者大会上，谷歌取得了一系列技术突破。在AI模型方面，Gemini 2.5系列模型全面领先，其中Pro版本在语言、推理和代码生成等方面表现出色，新增的“Deep Think”模式在复杂推理中表现惊人；而Flash版本则以高效率著称。此外，Gemini Diffusion作为实验性扩散模型，生成速度大幅提升。在视觉与多媒体生成领域，Veo 3视频生成模型支持原生音频生成，Imagen 4图像生成模型在画质细节上实现了飞跃，Flow电影制作工具结合多种能力实现了一键生成视频。 AI代理与自动化方面，Project Mariner和Agent Mode提升了任务自动化的能力。搜索与信息获取的体验也得到了重构，AI Mode和Google Beam等技术提供了更个性化的搜索和更逼真的视频通话体验。在硬件与可穿戴设备领域，Android XR智能眼镜和Project Moohan头显展示了谷歌在沉浸式体验上的探索。内容创作工具如Canvas和Music AI Sandbox为创作者提供了更多便利。最后，SynthID数字水印技术则致力于解决AI生成内容的辨别问题。

#Google I/O #技术突破 #AI模型 #Gemini 2.5 #Deep Think #Gemini Diffusion #视觉生成 #多媒体生成 #Veo 3

11个月前

用 AI 把照片变成钥匙扣人偶形象注意： - 上传一张照片 - 本图是 sora 生成提示词：保持原人物清晰的面部特征、表情和姿势，将人物整体转化为一个精致完整的3D人偶，采用可爱的Q版风格，人偶细节丰富，色彩饱满明亮。人偶顶部带有条钥匙链，由一只手轻轻捏着钥匙扣环悬空展示。人偶下方是虚化的室内暖色木质桌面背景，环境光线柔和温暖，营造温馨舒适的氛围。

#AI #照片转化 #钥匙扣人偶 #3D人偶 #Q版风格 #可爱风 #照片上传 #视觉生成