时政
财经
科技
虚拟货币
其他
登录
歸藏(guizang.ai)
关注
统计数据
327
文章
0
粉丝
0
获赞
4361
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
歸藏(guizang.ai)
1个月前
Cursor 也要上/命令了,也是可以自己通过 Markdown 文件创建
AI编程工具激战:Claude Code、Gemini Cli崛起· 1100 条信息
#Cursor
#Markdown文件
#命令
#文本编辑
#技术
分享
评论 0
0
歸藏(guizang.ai)
1个月前
月之暗面更新了 K2 模型的 0905 版本,我试了一下,这次 Coding 能力提升挺大。 尤其 3D 房屋展示那个案例比我前几天用 Claude 4.1 写的时候轻松好多。 从公告来看这次升级将上下文提升到了 256K,在编码 Agent 下 Coding 能力也有所提升,前端代码美观度有所提升。 我拿之前测试 GPT-5 那个巨长要求巨多的提示词试了一下效果相当不错,质量跟当时对比测评中最好的 GPT-5 有一拼。 而且这个涉及多个页面加上超长提示词也没啥问题,后来还做了一次修改,而且跟当时最好的 GPT-5 一样也加上了地址每个字段的验证,非常细致。 然后我试了一下当时 0711 那个版本没搞定的东西,当时一旦我想让他写 React 应用他就会陷入循环,而且最后没有成功,我的提示词当时比较简单,二是 React 环境构建就麻烦。 这次我让他用 React 和 R3F 框架帮我展示上次用 Nano Banana 做的 3D 模型,没想到只修改了一次就成功了,实现的非常完美,该加的材质都加上了,而且点击出现渲染图也行,坐标对齐很好,这个可比0711 我测试那个项目难多了。 作为对比我前几天演示的时候用的 Cursor 的 Claude 4.1 写的,而且写之前还跟 GPT-5 讨论了非常细的提示词,我调试了好多次才搞定,最后还是有小 Bug。 最重要的定价跟之前相同,K2 的高速版API也已经自动升级到了 0905 版本,输出速度也快了非常多,达到60-100 Token/s。 感兴趣可以改一下 Cluade Code 的 API 去试试。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 127 条信息
#月之暗面
#K2模型
#Coding能力提升
#256K上下文
#React和R3F框架
分享
评论 0
0
歸藏(guizang.ai)
1个月前
快手在视频上的布局越来越全面了啊,这几天开源了 Kwai Keye-VL-1.5-8B 模型 除了支持图像识别以外,视频理解能力也很强,加上 8B 的大小非常适合本地部署用来做视频标注和内容识别。 我试了一下,给了一个是描述视频画面内容以及查找分镜时间和每个分镜的内容描述都做的不错。 模型主要优势有: 短视频理解:在Video-MME的短视频子集测试中,Keye-VL-1.5-8B获得81.2的高分,超过了GPT-4o及同类模型。 视频定位能力:能够在一个26秒的短视频中,将目标物(如包)出现的时间段精确定位到0.1秒级别 视觉推理能力:能够理解视频中相对复杂的行为动机比如论文案例里面可以从两只狗的行为推测动机。 模型核心创新主要有下面几个方面: 针对视频内容动态且信息密集的特点,Keye-VL-1.5 提出了一种新颖的“Slow-Fast”视频编码策略,以有效平衡空间分辨率和时间覆盖率。 慢速通路以高分辨率处理视觉变化显著的关键帧,而快速通路则以较低分辨率但更高的时间覆盖率处理相对静态的帧。 另外模型采用了精心设计的四阶段渐进式预训练流程,系统性地将模型的上下文长度从8K扩展到128K,可以理解更加复杂的视觉信息。 在后训练阶段为解决冷启动问题,模型设计了一个五步自动化流水线来生成高质量的长链思考数据,包括数据收集、问题重写、多路径推理生成、双层质量评估和人工指导改进。 引入了“渐进式提示采样”机制来处理困难样本,即当模型多次回答错误时,在提示中给予不同层级的提示,以提高训练效率和模型推理能力
#快手
#Kwai Keye-VL-1.5-8B模型
#视频理解
#开源
#人工智能
分享
评论 0
0
歸藏(guizang.ai)
1个月前
丝之歌不开放预载导致 Steam Ps Switch Xbox 全平台支付系统一起崩溃,太离谱了
#丝之歌
#Steam
#PS
#Switch
#Xbox
#支付系统崩溃
分享
评论 0
0
歸藏(guizang.ai)
1个月前
最近高产之后啥牛鬼蛇神都出来了,疯狂抄袭和洗稿我和 ZHo 的 Nano Banana 内容 甚至连照片都用我的,有段话一个字都没改,不知道微信的原创审核干啥吃的
#抄袭
#洗稿
#nano banana
#ZHo
#微信原创审核
分享
评论 0
0
歸藏(guizang.ai)
1个月前
设计非常牛批的 Knob 键盘终于上市了,售价 439 美元,实体质感也很好
#Knob键盘
#上市
#439美元
#设计牛批
#实体质感好
分享
评论 0
0
歸藏(guizang.ai)
1个月前
放一下原图和生成后的图片
AI视频井喷:Midjourney领跑,多模态混战· 282 条信息
#原图
#生成图片
分享
评论 0
0
歸藏(guizang.ai)
1个月前
哈哈哈哈,笑死,这盛况难得一见啊
#AI整活:笑点爆梗不停,流量变现惊现· 503 条信息
#盛况
#难得一见
#笑死
分享
评论 0
0
歸藏(guizang.ai)
1个月前
Anthropic完成了新一轮130亿美元的融资,目前为止估值是1830亿美元。 他们25年初的收入是10亿美元,现在已经达到了80亿美元,确实有点离谱的编码还是强需求啊。
#Anthropic融资
#AI
#估值1830亿美元
#快速增长
#编码需求
分享
评论 0
0
歸藏(guizang.ai)
2个月前
好像现在Nano Banana手办又多了一个背后是 3D打印机的版本? 用我的汽车订单截图转了几张,确实看起来比Blender应景一些,而且还会出现正在打印的半成品效果更真实了 下面👇有提示词
#Nano Banana手办
#3D打印机
#汽车订单截图
#Blender
#半成品
分享
评论 0
0
歸藏(guizang.ai)
2个月前
大聪明(赛博禅心)刚才发了个 Nano Banana 一图读懂XXX的提示词 非常适合用来学习和解释一些概念,浅显易懂 但他那个是针对 Lovart 搞的,我优化了一下,现在单独用Nano Banana也可以稳定生成,而且排版更加一致 下面👇是提示词
#nano banana
#提示词优化
#Loart
#概念学习
#排版一致
分享
评论 0
0
歸藏(guizang.ai)
2个月前
Nano Banana 居然可以让角色摆出类似汉字的姿势? 刚才看到一个 B 站 UP 自己自己摆出类似汉字的姿势跳舞 Nano Banana 姿势参考也很强,就拿视频里面的字符试了一下,没想到真行啊,太猛了 提示词在下面
#nano banana
#汉字姿势
#B站UP主
#舞蹈
#姿势参考
分享
评论 0
0
歸藏(guizang.ai)
2个月前
谷歌在 AI Studio已经把 Gemini 2.5 Flash image的名字改成了 Nano Banana,确定按钮都改成黄色了,真会整活 模型代号取代原本名字的模型这也是第一个了
Google Gemini 2.5发布引发AI模型性价比热议· 250 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 608 条信息
#Gemini 2.5 Flash Image
#nano banana
#谷歌 AI Studio
#模型代号
#黄色按钮
分享
评论 0
0
歸藏(guizang.ai)
2个月前
苹果的的水端的挺平的 GPT-5 现在也可以在 Xcode 26 里面用了 也是支持直接用 ChatGPT 账号登录不需要 API
#苹果
#GPT-5
#Xcode 26
#ChatGPT账号
#水端
分享
评论 0
0
歸藏(guizang.ai)
2个月前
啊?Nano Banana 家装展示也能搞定? 从平面图生成 3D 渲染建筑俯视图,然后再生成指定视角的渲染图 指定视角的渲染图格局也是大致正确的,餐厅那个有点问题可以抽卡
#nano banana
#家装展示
#3D渲染
#建筑俯视图
#餐厅问题待修复
分享
评论 0
0
歸藏(guizang.ai)
2个月前
我去,没想到苹果真的跟 Anthropic 合作了,更没想到先从 Xcode 开始 Xcode 26 Beta 7 里面用户可以登录 Claude 账号。 使用 Claude Sonnet 4 在 Xcode 中的编码智能功能生成代码和文档、自动修复错误等。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1100 条信息
#苹果
#Anthropic
#Xcode
#Claude Sonnet 4
#编码智能
分享
评论 0
0
歸藏(guizang.ai)
2个月前
无意间用 Nano Banana 做出了 B 站这种很流行的封面效果 其实这种前景大的夸张的效果很难拍摄 我直接用广角运动相机拍手,然后让 Nano Banana 帮我拿上大香蕉再写上字 之后抠图就行,看了一下这篇小红书视频封面点击率相当高!
#nano banana
#B站封面
#广角拍摄
#小红书
#高点击率
分享
评论 0
0
歸藏(guizang.ai)
2个月前
其实早就开了 Youtube 账号,最近的视频都会同步一次,这次视频太长了,就不在推特发了 如果需要视频版本可以去下面 youtube 看
#YouTube
#视频
#推特
分享
评论 0
0
歸藏(guizang.ai)
2个月前
相同角色+不同动作参考+连续编辑+可灵 2.1 首尾帧 =高质量打斗动画
AI视频井喷:Midjourney领跑,多模态混战· 282 条信息
#高质量打斗动画
#连续编辑
#可灵 2.1
#首尾帧
分享
评论 0
0
歸藏(guizang.ai)
2个月前
Anthropic 也开始卷 AI 浏览器了,发布可以控制浏览器的 Claude 插件 可以帮你管理日历、安排会议、草拟电子邮件回复、处理日常报销以及测试新网站功能 他们邀请了 1000 个用户进行测试,如果你有权限应该会收到邮件
AI编程工具激战:Claude Code、Gemini Cli崛起· 1100 条信息
#Anthropic
#AI浏览器
#Claude插件
#用户测试
#效率工具
分享
评论 0
0
歸藏(guizang.ai)
2个月前
这个吊!Nano Banana 其实支持识别手绘内容 所以你可以通过手绘图精准控制多个角色打斗姿态! 提示词:Have these two characters fight using the pose from Figure 3.Add appropriate visual backgrounds and scene interactions,Generated image ratio is 16:9
AI视频井喷:Midjourney领跑,多模态混战· 282 条信息
#nano banana
#手绘
#姿态控制
#角色打斗
#16:9
分享
评论 0
0
歸藏(guizang.ai)
2个月前
开个帖子记录一下 Gemini 2.5 Flash Image 模型我发掘的一些用法,会持续更新,建议收藏 首先这个模型支持多图参考,为了你提示词好写,你可以给多张图片加上标记 比如这里就是 A 的背景、B 的沙发以及 C 的人物
Google Gemini 2.5发布引发AI模型性价比热议· 250 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 608 条信息
#Gemini 2.5 Flash Image
#多图参考
#A的背景
#B的沙发
#C的人物
分享
评论 0
0
歸藏(guizang.ai)
2个月前
nano banana 来了! AI Studio 上出现了一个叫 Gemini 2.5 Flash Image preview 的模型,应该就是了。 不过我用的时候跟我说 api 出问题
Google Gemini 2.5发布引发AI模型性价比热议· 250 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 608 条信息
#nano banana
#Gemini 2.5 Flash Image preview
#AI Studio
#api error
分享
评论 0
0
歸藏(guizang.ai)
2个月前
fenx 这个贴纸太好玩了,都是常见的 AI 梗。 打印了一些,到时候抽几个给大家
#fenx
#AI 梗
#贴纸
#好玩
#抽奖
分享
评论 0
0
歸藏(guizang.ai)
2个月前
最近天气最好的一天
#天气
#晴朗
#美好
#户外
#心情舒畅
分享
评论 0
0
上一页
1
2
3
4
5
6
7
8
9
10
11
12
13
14
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞