时政
财经
科技
虚拟货币
其他
登录
Gorden Sun
关注
统计数据
266
文章
0
粉丝
0
获赞
642
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
Gorden Sun
2周前
X的图片可以一键用Grok生成视频了,很顺滑
AI视频井喷:Midjourney领跑,多模态混战· 149 条信息
#X
#Grok
#视频生成
#一键
#顺滑
分享
评论 0
0
Gorden Sun
3周前
Music Video Made by AI 一首《大吉大利》送给大家,给大家拜个早年
AI视频井喷:Midjourney领跑,多模态混战· 149 条信息
#AI音乐
#大吉大利
#拜年
#音乐视频
#人工智能
分享
评论 0
0
Gorden Sun
3周前
AI资讯日报,8月24日:
AI技术引发伦理争议,专家呼吁加强监管· 71 条信息
#AI
#资讯
#8月24日
分享
评论 0
0
Gorden Sun
3周前
nano banana邪修宝典,抽中概率提升到2/3 nano banana编辑图片的效果超级好,基本能够100%保持人物和构图一致性,但是要在LMArena那么多模型里抽卡,怎么破? 全网独家邪修抽卡大法,能把抽中nano banan的概率提升至2/3 ! 偷偷收藏使用!知道的人多了也许就被官方封了! 使用方法: 一句话版本:始终保证上传2张图片。 具体操作方法:不管你是文字生成图片,还是编辑单张图片,还是编辑多张图片,始终上传2张图片作为提示词的一部分。 文字生成图片时,上传2张尺寸非常小的透明图片,然后正常输入你的提示词(直接输中文就行)。 编辑1张图片时,上传正常要编辑的图片,再上传1张尺寸非常小的透明图片,然后正常输入提示词。 编辑2张及以上图片时,正常上传多张图片,正常输入提示词。 如此操作之后,能参与比赛就只有nano banana、Gemini 2.0 Flash preview image generation和GPT-1-image,极大概率抽到nano banana。原理也非常简单,因为只有这3个模型的API支持传入多个图片,而且透明图片的token对生成内容完全没影响,所以缩小了抽卡范围。 nano banana和Gemini 2.0 Flash preview image generation出图速度非常快,20秒之内就能出结果。GPT-1-image基本上需要60秒以上才能出结果。所以如果超过20秒还没出结果,建议直接开新的对话重新抽。 我可以很明确的说,nano banana就是Gemini 2.0 Flash preview image generation的正式版,有时候他俩出图的效果一模一样,只是nano banana的细节更丰富。 nano banana不擅长以下画风:日本动漫、像素风、多面体、剪纸等,在写实和名人艺术家的风格还原上,堪称完美。
#nano banana
#Gemini 2.0 Flash
#抽卡攻略
#图片编辑
#AI模型
分享
评论 0
0
Gorden Sun
3周前
AI资讯日报,8月23日:
AI技术引发伦理争议,专家呼吁加强监管· 71 条信息
#AI
#资讯
#8月23日
分享
评论 0
0
Gorden Sun
3周前
AI资讯日报,8月22日:
AI技术引发伦理争议,专家呼吁加强监管· 71 条信息
#AI
#资讯
#8月22日
分享
评论 0
0
Gorden Sun
3周前
AI资讯日报,8月21日:
AI技术引发伦理争议,专家呼吁加强监管· 71 条信息
#AI
#资讯
#8月21日
分享
评论 0
0
Gorden Sun
3周前
AI资讯日报,8月20日:
AI技术引发伦理争议,专家呼吁加强监管· 71 条信息
#AI
#资讯
#8月20日
分享
评论 0
0
Gorden Sun
3周前
AI资讯日报,8月19日:
AI技术引发伦理争议,专家呼吁加强监管· 71 条信息
#AI
#资讯
#8月19日
分享
评论 0
0
Gorden Sun
3周前
Thyme:像o3一样分析图片 视觉多模态模型,会分析用户需求,针对复杂问题写代码来辅助解决。例如识别非常小的区域内的文字,会写代码执行放大+裁剪的操作,然后再识别图像解决问题。跟OpenAI o3的操作类似。 项目地址: Github:
#Thyme
#o3
#视觉多模态模型
#代码辅助
#图像识别
分享
评论 0
0
Gorden Sun
3周前
AI资讯日报,8月18日:
AI技术引发伦理争议,专家呼吁加强监管· 71 条信息
#AI
#资讯
#8月18日
分享
评论 0
0
Gorden Sun
3周前
ToonComposer:自动上色和生成动画 输入彩色的起始帧和后续的草图关键帧,ToonComposer自动按照关键帧生成动画,同时自动上色。因为有关键帧,过程更可控,效果更稳定。 项目地址: Github:
AI视频井喷:Midjourney领跑,多模态混战· 149 条信息
#ToonComposer
#动画生成
#自动上色
#关键帧
#GitHub
分享
评论 0
0
Gorden Sun
4周前
OpenCUA:开源Computer-Use Agent框架 Kimi和香港大学联合开源的项目,适用于操作电脑的Agent框架,同时开源了用于操作电脑的模型OpenCUA 32B和OpenCUA 7B(基于Qwen 2.5 VL),目前得分最高的用于操作电脑的开源模型。 项目地址: 模型:
#OpenCUA
#开源项目
#Agent框架
#Kimi
#香港大学
分享
评论 0
0
Gorden Sun
4周前
我之前发谷歌的Opal,用户输入自然语言,由AI生成工作流节点。 有个朋友留言说Dify也有类似的功能,只不过知道的人比较少,是哪位朋友留言的来着,我想看看Dify的效果。
#AI工作流
#Opal
#Dify
#用户反馈
#产品对比
分享
评论 0
0
Gorden Sun
4周前
AI资讯日报,8月17日:
AI技术引发伦理争议,专家呼吁加强监管· 71 条信息
#AI
#资讯
#8月17日
分享
评论 0
0
Gorden Sun
4周前
ScreenCoder:复刻UI界面 上传UI截图,AI识别图片内容和布局,然后写代码复刻。 Github:
#UI界面
#AI识别
#代码复刻
#GitHub
#ScreenCoder
分享
评论 0
0
Gorden Sun
4周前
Stand-In:保持生成视频的角色一致性 微信开源的项目,用于AI视频模型的插件,可以保持生成视频的角色一致。 项目地址: Github:
AI视频井喷:Midjourney领跑,多模态混战· 149 条信息
#角色一致性
#AI视频模型
#微信开源
#Stand-In
#视频生成
分享
评论 0
0
Gorden Sun
4周前
AI资讯日报,8月16日:
AI技术引发伦理争议,专家呼吁加强监管· 71 条信息
#AI
#资讯
#8月16日
分享
评论 0
0
Gorden Sun
4周前
AI资讯日报,8月15日:
AI技术引发伦理争议,专家呼吁加强监管· 71 条信息
#AI
#资讯
#8月15日
分享
评论 0
0
Gorden Sun
4周前
DINOv3:Meta开源的基础视觉模型 CLIP的竞品,能够完成图片分类、分隔物体、追踪物体等各种视觉任务。模型大小从21M到7B,有多个版本。 Github:
#DINOv3
#Meta
#开源
#视觉模型
#CLIP
分享
评论 0
0
Gorden Sun
1个月前
AI资讯日报,8月14日:
AI技术引发伦理争议,专家呼吁加强监管· 71 条信息
#AI
#资讯
#8月14日
分享
评论 0
0
Gorden Sun
1个月前
m3-agent:带记忆的智能体 字节开源的智能体,能把多模态数据也转化成记忆,包括文本、音频、图片、视频数据。分别微调了2个模型用于记忆和执行,记忆模型基于Qwen 2.5 omni,执行模型基于Qwen 3 32B。 Github:
#m3-agent
#智能体
#字节跳动
#开源
#Qwen
分享
评论 0
0
Gorden Sun
1个月前
StableAvatar:音频驱动生成视频 图片+音频,生成唱歌或说话视频,支持生成无限时长的视频。 Github:
AI视频井喷:Midjourney领跑,多模态混战· 149 条信息
#音频驱动
#视频生成
#唱歌
#说话
#GitHub
分享
评论 0
0
Gorden Sun
1个月前
AI资讯日报,8月13日:
澎湃AI新闻合辑:未来科技与社会热点交锋· 75 条信息
AI技术引发伦理争议,专家呼吁加强监管· 71 条信息
#AI
#资讯
#8月13日
分享
评论 0
0
Gorden Sun
1个月前
M3-Agent-Control:Agent专用模型 字节悄悄放出了一个专门用于Agent的模型,基于Qwen 3 32B训练。 模型:
#M3-Agent-Control
#Agent模型
#字节
#Qwen 3 32B
#模型
分享
评论 0
0
上一页
1
2
3
4
5
6
7
8
9
10
11
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞