Gorden Sun

统计数据

491
文章
0
粉丝
0
获赞
3047
阅读

热门文章

1

TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...

145 32
avatar
Gorden Sun
2小时前
AI资讯日报,12月23日:
avatar
Gorden Sun
1天前
AI资讯日报,12月22日:
avatar
Gorden Sun
1天前
AI资讯日报,12月21日:
avatar
Gorden Sun
3天前
AI资讯日报,12月20日:
avatar
Gorden Sun
3天前
用Banana Pro生成信息图,NotebookLM的风格已经视觉疲劳了。要生成更多风格也非常简单,提供一个提示词让AI改就行了。 我最喜欢第一个真实手账的风格,提示词见评论。
avatar
Gorden Sun
3天前
AI资讯日报,12月19日:
avatar
Gorden Sun
5天前
AI资讯日报,12月18日:
avatar
Gorden Sun
5天前
Claude Code系统提示词 包括Agent、助手、内置工具等40多个系统提示词,是用来学习Agent的好材料。 Github:
avatar
Gorden Sun
6天前
AI资讯日报,12月17日:
avatar
Gorden Sun
6天前
Gemini 3 Flash已经能用了 相比Pro版本,速度提升显著,前端效果基本没变,美学依旧领先于其他模型。 ZenMux首发,目前免费,使用地址:
avatar
Gorden Sun
6天前
Meta开源SAM Audio 能从音频文件中分离出指定的音频,典型的使用场景包括:从歌曲中分离出人声、从多人对话中分离出某个人说话的声音、标记出某个人的声音出现的时间段,可以说是音频编辑的基座模型,非常实用。 模型: 在线使用:
avatar
Gorden Sun
6天前
美团开源虚拟人模型LongCat-Video-Avatar 类似字节的OmniHuman 1.5和快手的Avatar 2.0,支持音频驱动照片生成视频(尤其适用于主播和MV) 项目地址: 模型:
avatar
Gorden Sun
6天前
AI资讯日报,12月16日:
avatar
Gorden Sun
6天前
英伟达发布Nemotron 3系列模型 分3个版本: Nemotron 3 Nano,30B总参数,激活3B; Nemotron 3 Super,100B总参数,激活10B; Nemotron 3 Ultra,500B总参数,激活50B; 目前30B模型已开源,另外2个明年上半年开源。同时开源了训练数据集。 模型:
avatar
Gorden Sun
1周前
One-to-All Animation:让照片动起来 能让照片人物,按参考视频的动作动起来,基于Wan2.1训练,效果比Wan2.2 Animate还好一些,支持大幅度的动作复刻。 Github: ComfyUI工作流:
avatar
Gorden Sun
1周前
AI资讯日报,12月15日:
avatar
Gorden Sun
1周前
阿里通义开源Fun系列音频模型 Fun-CosyVoice3-0.5B:TTS模型,支持生成9种语言的音频,支持克隆声音,支持流式输入输出。 模型: Fun-ASR-Nano:语音识别模型,支持31种语言,支持方言识别,支持实时听写。 模型:
avatar
Gorden Sun
1周前
AI资讯日报,12月14日:
avatar
Gorden Sun
1周前
AI资讯日报,12月13日:
avatar
Gorden Sun
1周前
效果没那么稳定,但是Banana Pro确实能把毕加索的立体主义变成现实。
avatar
Gorden Sun
1周前
AI资讯日报,12月12日:
avatar
Gorden Sun
1周前
国内直连版Banana Pro,无需VPN,填写key就能用,操作简单,适合小白。买了可以给别人用,搭个人情也不错。 所有分辨率都是3毛一张,极具性价比,也可以同时使用我做的AI PPT功能。Banana Pro已经是工具,其他AI绘画还只是玩具。 在线使用地址: 在线使用AI PPT: 体验Key(共100次):sk-BFLb7Mgol9oCGkXTCm22xSNNIpUSLVDmM1JCSAfziQp8Q0Hi
avatar
Gorden Sun
1周前
AI生成裸眼3D图 点开大图,离屏幕远一些,盯着孙悟空看。
avatar
Gorden Sun
1周前
AI资讯日报,12月11日:
avatar
Gorden Sun
1周前
NSFW警告,不要在公开场合外放视频 没想到浓眉大眼的谷歌竟然审核也这么松。谷歌的TTS也已经Next Level了,跟11Labs v3差不多的水平。语气自然、情感丰富,能发出拟声词的音。 音频由Gemini 2.5 Pro TTS,这个模型现在对文本和音频都没有审核,且玩且珍惜。 使用地址: 官方介绍:
...
© 2025 news.news. All rights reserved. 0.04367 秒. v1.0.46
我的评论