时政
财经
科技
登录
#视觉生成
关注
sitin
1个月前
在2025年Google I/O开发者大会上,谷歌取得了一系列技术突破。 在AI模型方面,Gemini 2.5系列模型全面领先,其中Pro版本在语言、推理和代码生成等方面表现出色,新增的“Deep Think”模式在复杂推理中表现惊人;而Flash版本则以高效率著称。此外,Gemini Diffusion作为实验性扩散模型,生成速度大幅提升。 在视觉与多媒体生成领域,Veo 3视频生成模型支持原生音频生成,Imagen 4图像生成模型在画质细节上实现了飞跃,Flow电影制作工具结合多种能力实现了一键生成视频。 AI代理与自动化方面,Project Mariner和Agent Mode提升了任务自动化的能力。搜索与信息获取的体验也得到了重构,AI Mode和Google Beam等技术提供了更个性化的搜索和更逼真的视频通话体验。 在硬件与可穿戴设备领域,Android XR智能眼镜和Project Moohan头显展示了谷歌在沉浸式体验上的探索。内容创作工具如Canvas和Music AI Sandbox为创作者提供了更多便利。最后,SynthID数字水印技术则致力于解决AI生成内容的辨别问题。
#Google I/O
#技术突破
#AI模型
#Gemini 2.5
#Deep Think
#Gemini Diffusion
#视觉生成
#多媒体生成
#Veo 3
分享
评论 0
0
宝玉
2个月前
用 AI 把照片变成钥匙扣人偶 形象 注意: - 上传一张照片 - 本图是 sora 生成 提示词: 保持原人物清晰的面部特征、表情和姿势,将人物整体转化为一个精致完整的3D人偶,采用可爱的Q版风格,人偶细节丰富,色彩饱满明亮。人偶顶部带有条钥匙链,由一只手轻轻捏着钥匙扣环悬空展示。人偶下方是虚化的室内暖色木质桌面背景,环境光线柔和温暖,营造温馨舒适的氛围。
#AI
#照片转化
#钥匙扣人偶
#3D人偶
#Q版风格
#可爱风
#照片上传
#视觉生成
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞