时政
财经
科技
虚拟货币
其他
登录
Gorden Sun
关注
统计数据
410
文章
0
粉丝
0
获赞
2928
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
Gorden Sun
5个月前
FLUX.1 Kontext修复老照片非常神奇,基本上达到了之前ComfyUI一串非常复杂的工作流的效果,而且实现方法只需要一句提示词:Restore and colorize this image. Remove any scratches or imperfections.
#FLUX.1
#照片修复
#图像处理
#人工智能
#图像上色
分享
评论 0
0
Gorden Sun
5个月前
AI资讯日报,5月31日:
#AI乱象不止:内容注水,隐私堪忧· 203 条信息
分享
评论 0
0
Gorden Sun
5个月前
AI资讯日报,5月30日:
#AI乱象不止:内容注水,隐私堪忧· 203 条信息
分享
评论 0
0
Gorden Sun
5个月前
FLUX.1 Kontext:GPT-4o图片编辑的绝对竞争者 效果相当好,我认为比GPT-4o更强。 改图时可以保持人物一致性,指令遵循强,即使连续迭代一张图,图片质量降低的也很小。你可以试试用GPT-4o连续改一张图,人物会改的面目全非。 从低到高分dev、pro、max三个版本,pro就够用,dev小范围开源中。 图1:原图; 图2:改背景; 图3:继续改发型; 图4:继续改衣服;
#FLUX.1
#图片编辑
#AI技术
#竞争
#开源
分享
评论 0
0
Gorden Sun
5个月前
AI资讯日报,5月29日:
#AI乱象不止:内容注水,隐私堪忧· 203 条信息
#AI
#资讯
#日报
分享
评论 0
0
Gorden Sun
5个月前
Lemon AI:开源通用智能体 写的是全栈通用智能体,但是目前看起来就是调用LLM+搜索API+经验库,来实现类似Deep Research的功能。 Github: 手册:
#Lemon AI
#开源
#通用智能体
#全栈智能
#LLM
#搜索API
#经验库
#Deep Research
分享
评论 0
0
Gorden Sun
5个月前
DualParal:生成1分钟长度的视频 使用分布式推理策略,可以让DiT视频模型生成1分钟长度的视频。 项目地址:
#DualParal
#分布式推理
#DiT视频模型
#视频生成
分享
评论 0
0
Gorden Sun
5个月前
DeepSeek R1小版本升级 虽说是小版本,代码能力提升明显,前端审美大幅提升。 我就说要炫酷的网页,就做出这样的效果。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 133 条信息
#DeepSeek
#软件更新
#前端设计
分享
评论 0
0
Gorden Sun
5个月前
AI资讯日报,5月28日:
分享
评论 0
0
Gorden Sun
5个月前
OmniConsistency:DiT绘画模型通用插件 适用于Flux等DiT绘画模型,能在保持主体一致性的同时,实现风格泛化,且与现有的LoRA兼容。效果非常好,风格化接近GPT-4o的水平,人物一致性的保持比GPT-4o好。 在线使用: 模型:
#绘画模型
#OmniConsistency
#DiT
#Flux
#主体一致性
#风格泛化
#LoRA兼容
#风格化
#GPT-4o
#在线使用
分享
评论 0
0
Gorden Sun
5个月前
HunyuanVideo-Avatar:语音驱动视频生成 通过音频,生成人物说话的视频,人物有肢体和头部动作,有表情,支持多角色。适用于虚拟人的场景。 模型:
#HunyuanVideo
#语音驱动
#视频生成
#虚拟人
#多角色
分享
评论 0
0
Gorden Sun
5个月前
AI资讯日报,5月27日:
#AI乱象不止:内容注水,隐私堪忧· 203 条信息
分享
评论 0
0
Gorden Sun
5个月前
AI资讯日报,5月26日:
#AI
#资讯日报
#科技动态
分享
评论 0
0
Gorden Sun
5个月前
AI季度报告 由Artificial Analysis出品,可以明显看出,Google在AI全领域、全模型都处于前列位置。 PDF地址:
#AI
#季度报告
#Artificial Analysis
#Google
#全领域
#全模型
分享
评论 0
0
Gorden Sun
5个月前
AI资讯日报,5月24日:
#AI乱象不止:内容注水,隐私堪忧· 203 条信息
#AI
#资讯
#日报
分享
评论 0
0
Gorden Sun
5个月前
AI资讯日报,5月24日:
#AI乱象不止:内容注水,隐私堪忧· 203 条信息
#AI
#资讯
#日报
#5月24日
分享
评论 0
0
Gorden Sun
5个月前
Veo 3好哇
#Veo 3
分享
评论 0
0
Gorden Sun
5个月前
谷歌新发布的Gemini 2.5 Flash Exp Audio模型,是原生多模态模型,支持文本、图片、语音输入,支持文本、语音输出。 输出的语音支持各种语气和声音,也能唱歌和RAP,虽然中文有时会有发音错误,但整体也非常不错了,ASMR的少女声音,让人感觉又恋爱了。 下方视频第一段:少女ASMR 下方视频第二段:唱歌和RAP
#谷歌
#Gemini
#多模态模型
#语音技术
#唱歌
#RAP
#ASMR
分享
评论 0
0
Gorden Sun
5个月前
AI资讯日报,5月23日:
分享
评论 0
0
Gorden Sun
6个月前
还是多模态的模型好,GPT-4o可以同时兼顾绘画和语义。
#多模态模型
#GPT-4o
#绘画
#语义能力
分享
评论 0
0
Gorden Sun
6个月前
Google AI Studio升级 最大的亮点是新增了很多Starter Apps,包括GIF Maker(生成动图)、Co-Drawing(辅助绘画)、Video Toys(基于视频创建教育应用)等许多有趣的小应用。 官方介绍:
#Google AI Studio
#Starter Apps
#GIF Maker
#Co-Drawing
#Video Toys
#教育应用
分享
评论 0
0
Gorden Sun
8个月前
Mistral OCR:目前最佳OCR模型 支持多种语言,评分全面超过Gemini 2.0 Flash,支持在Le Chat使用和API调用。 调用API的话,别忘了之前ElevenLabs的大礼包,里面送25美元的Mistral API金额,免费领取地址: 在线使用: 官方介绍:
#Mistral OCR
#OCR模型
#语言支持
#API使用
#elevenlabs
#免费使用
分享
评论 0
0
Gorden Sun
8个月前
olmOCR:可能是目前最好的开源OCR模型 基于微调后的7B视觉语言模型,微调数据为260000页PDF页面,完全开源,包括模型权重、数据和训练代码、推理代码,4090可以本地运行。 Github: 模型: 在线使用:
#开源
#OCR
#视觉语言模型
#模型权重
#微调
#PDF
#GitHub
#4090
分享
评论 0
0
Gorden Sun
8个月前
阿里开源Wan 2.1很不错,效果接近可灵1.5,需要抽卡,手部有时出问题。 在Fal上可以使用,支持图生视频、文生视频,每个视频耗费0.4美元,地址: 在ElevenLabs的免费大礼包里,可以免费领取50美元的Fal额度,可以用体验Wan 2.1和Google Veo 2。领取地址:
#阿里Wan 2.1
#图生视频
#文生视频
#Fal
#elevenlabs
分享
评论 0
0
Gorden Sun
9个月前
灰度到了微信的AI搜索,很好用
#微信
#AI搜索
#灰度测试
分享
评论 0
0
上一页
1
...
6
7
8
9
10
11
12
13
14
15
16
17
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞