nicekate

统计数据

55
文章
0
粉丝
0
获赞
128
阅读

热门文章

1

TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...

145 32
avatar
nicekate
16小时前
不需要专门的 AI 图片应用,Roo Code + Nano Banana 能满足你的大部分生图、修图需求 Roo Code 里新增的图像功能非常好用,我用免费的 Grok Code Fast 1 模型调用 Nano Banana 模型生成图片,特别适合角色一致性创作,如果用 GPT 5、Claude 4,提示效果会更好 比调用 Replicate MCP 生成图片更方便(后者优势是模型多)
#AI图片 #Roo Code #nano banana #图像生成 #角色一致性
avatar
nicekate
1周前
也许现在做各类小红书手工课程就可以以假乱真了 大家在使用 gemini-2.5-flash-image-preview 时记得 gemini-2.0-flash-image 是能一句提示词生成多张图片展示红烧肉、印度飞饼制作过程的 下图是一句提示,gemini-2.5-flash-image-preview 生成的给自行车补胎的效果,虽然图片有很多错误,但是车子的颜色、修改工具的铁盒子、桌子的斑驳纹理都保持得相关好,一致性真的强
#小红书手工课程 #gemini-2.5-flash-image-preview #以假乱真 #图片生成错误 #自行车补胎
avatar
nicekate
1周前
非常 nice 的是 OpenRouter 也支持了 google/gemini-2.5-flash-image-preview 而且是 OpenRouter 首次上线图像模型 API 调用方式可以看文档里多模态部分
Google Gemini 2.5发布引发AI模型性价比热议· 145 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 392 条信息
#Openrouter #google/gemini-2.5-flash-image-preview #图像模型 #多模态 #API
avatar
nicekate
1周前
gemini-2.5-flash-image-preview (也就是香蕉模型) 比 gemini-2.0-flash-image 生成效果好太多了 图1 新模型,图2 旧模型 不过中文渲染还得看 Qwen Image 提示词: 巨型石窟中竖立一块被光纤勾勒的透明碑石,古老经文以激光刻在其上;风格: 东方石窟+高科技装置艺术;光影: 冷蓝体积光+碑内透光;镜头: 70mm中长焦,庄严对称;构图: 中轴对称,参观者为尺度参照;色调: 石灰灰、电子蓝、微金;材质: 岩壁粗糙、玻璃体、光纤;文字要求: 碑文清晰:‘无常即常|光可照心’(竖排)
Google Gemini 2.5发布引发AI模型性价比热议· 145 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 392 条信息
#Gemini-2.5-flash-image #图像生成 #Qwen Image #中文渲染 #高科技装置艺术
avatar
nicekate
1周前
GPT-5 Thinking 越来越懂人了,下图是1次提示,它分了3个思考展示阶段 中间自己发现缺少中文字体乱码问题,自己修复 也贴心给出png、csv文件下载,做得太细致了 GPT 代码解释是做得最早的,AI生成回复也是目前最贴心的,只有 Claude Artifact 能和它一比高下了
OpenAI GPT-5发布引发用户不满,阿尔特曼回应质疑· 41 条信息
#GPT-5 #AI #中文支持 #用户体验 #Claude Artifact
avatar
nicekate
1周前
前天测试的时候以为 DeepSeek V3.1 只是非思考模型 还好昨天问了下 DeepSeek,加上了思考模式的测试 不然做出来的视频就变成笑话了 P.s. 下图是 Qwen Image 一次提示本地生成
深度学习模型升级引发AI能力大跃进,行业迎新变革· 55 条信息
#DeepSeek V3.1 #思考模型 #Qwen Image #本地生成 #测试
avatar
nicekate
1周前
Mac 上试了下 LFM2 VL 1.6B 8bit 8BIT ,能识别中文,运行速度非常快(280t/s),但有幻觉,总体生成结果比我想象中好 对比 MiMo VL 7B RL 2508 GGUF Q8_0 ,思考 20 秒之后 44t/s ,速度较慢,但生成结果很好
#LFM2 VL 1.6B #MiMo VL 7B RL #文本生成 #速度对比 #幻觉
avatar
nicekate
1周前
测试 DeepSeek V3.1(思考&不思考)和 GLM 4.5 的写作能力,正愁如何可视化展示 使用 opencode 里 sonic 模型生成 Mermaid 图表,速度嘎嘎快 注:Cline、Cursor、opencode 现在都可以免费使用 sonic 模型
#DeepSeek V3.1 #GLM 4.5 #写作能力 #Mermaid 图表 #sonic 模型
avatar
nicekate
1周前
看来 DeepSeek V3.1 有2个版本,一个思考,一个不思考,选择深度思考会由 V3.1.2 回答而不是 R1 DeepSeek 官方限速好厉害,1分钟3次,超过次数,历史记录都看不到,我昨天体验的都是不思考的 V3.1,调用 API 速度也好慢 官方 Model card 怎么还不更新啊
深度学习模型升级引发AI能力大跃进,行业迎新变革· 55 条信息
#DeepSeek V3.1 #AI模型 #限速 #API调用 #模型更新
avatar
nicekate
1周前
Cursor 有个新模型 sonic 可以免费试用,推测是 Grok 4 Coder
#Cursor #sonic #Grok 4 Coder #免费试用 #AI模型
avatar
nicekate
2周前
不怎么看播客,但看《罗永浩的十字路口》不知不觉一小时过去了 第一期是罗永浩对话李想,老罗这类节目比他上脱口秀好,而且老罗也创办企业,所以做这类与企业家对话感觉比一般主持人与企业家对话更有深度 这类长对话节目真好(有点像看个人传记的精读版),不舍得直接看总结,而是看他们的表情,对话内容,这类体验是远超2分钟的短视频或者5000字人物专访 第一小时的收获是家庭教育和李想的管理理念
#罗永浩 #李想 #十字路口 #企业家对话 #家庭教育
avatar
nicekate
2周前
我请 Gemini 2.5 Pro、GPT 5、Grok 4 和 Q3 Coder Flash 随机生成 AI 绘图提示词 结果高度趋同:常见“蒸汽朋克”、“禅意花园”、“未来量子”、“废弃机械”等 好消息:Midjourney Explore 可以作为审美参照 下图为我在本地使用 Draw Things 搭配 Qwen-Image 模型生成的效果
#Gemini 2.5 Pro #GPT 5 #Grok 4 #Q3 Coder Flash #AI 绘图 #midjourney #Qwen-Image #蒸汽朋克
avatar
nicekate
2周前
电影 捕风追影 真好看,打戏精彩,还有 AI 助力,记得看彩蛋,期待这一部票房大卖,下一部更好
#捕风追影 #电影 #AI助力 #打戏精彩 #票房大卖
avatar
nicekate
2周前
机器人运动会上的兵马俑机器人跳舞,看着好熟悉 Claude 4 推出后,我一直在用不同模型测试生成兵马俑跳舞动画效果 现在现实版跳出来了,真好玩,期待机器人早日跳上 Breaking
#机器人运动会 #兵马俑机器人 #跳舞 #Claude 4 #breaking
avatar
nicekate
2周前
为了健康,买了无绳跳绳,咨询了 GPT 5 thinking 跳绳计划,还 Vibe 了一个应用:五五起身 应用名字和图标都是 AI 生成的 P.s. 用快捷指令设置提醒会更方便
#健康 #无绳跳绳 #GPT 5 #AI生成 #五五起身
avatar
nicekate
2周前
Theo 早期通过 API 使用 GPT-5(在 Cursor 中)体验极佳,堪称“令人难以置信”,但近期再体验,感到性能显著下降。 这与 o3 的情况如出一辙:预览版(o3 preview)实力超群,而正式版(o3)虽名称未变,实际却大幅缩水。 OpenAI 的习惯性操作,降智
OpenAI GPT-5发布引发用户不满,阿尔特曼回应质疑· 41 条信息
#GPT-5性能下降 #OpenAI降智 #Theo体验下降 #Cursor编辑器 #o3预览版缩水
avatar
nicekate
2周前
尝试让 Qwen image、即梦 3 和 3.1、GPT 分别生成Youtube 缩略图 图1 Qwen image 文字排版很好,但不理解文字的颜色 图2-3 即梦3和3.1 都能理解文字的颜色,但是文字排版一般 图4 GPT 生成的图片偏黄,排版很一般 综上,AI 生图目前还取代不了设计师 提示词: digital matrix style, 'Claude Code 使用技巧' text with matrix code streaming effect, black background with cascading green code, AI brain network visualization, digital tunnel perspective, glowing data streams, terminal interface elements, matrix-style typography, cyber reality aesthetic, 16:9 aspect ratio, razor sharp details
#Qwen Image #即梦 #GPT #AI生图 #缩略图
avatar
nicekate
2周前
9月15日续期起,Cursor Auto不再“无限免费”,改为按用量计费,并计入你已购的月度额度 怎么计费: 输入:$1.25 / 每100万 tokens 输出:$6.00 / 每100万 tokens 缓存输入:$0.25 / 每100万 tokens 编辑器和仪表盘都会实时显示 Auto 消耗了你多少已购用量。
#Cursor Auto #收费 #用量计费 #Tokens #编辑器
avatar
nicekate
2周前
四个模型调用工具的能力,谁胜出? gpt-oss 120B 4bit GLM-4.5 Air 4bit qwen3-coder-Flash 8bit Jan-v1-4B 8bit 注:一个例子不代表所有,Exa 是 gpt-oss 的默认搜索工具 模型的工具调用能力还有很大提升空间
#模型调用 #工具 #gpt-oss #GLM-4.5 #Qwen3
avatar
nicekate
3周前
Qwen 发福利了,除了魔搭每天免费 2000次的调用 还享受每天 2000 次请求 Qwen Code 免费运行(完整 Coder 模型) 算了下,现在我的电脑里已经有了 7 龙珠了 Claude Code opencode Gemini CLI Cursor CLI Qwen CLI Augment CLI Warp Codex 还没尝试 苦恼的是每家都有些特定的规则、命令,快捷方式也会有些不同,脑子不够用啦
#Qwen #魔搭 #免费调用 #Coder模型 #AI工具
avatar
nicekate
3周前
刚有个全栈编码问题,GPT 5 修复了好几次没有修复好,切换到 Claude Sonnet 4,1 次就搞定了 反之亦然,不为难自己,一个模型修不了就换另一个模型吧 Augment 现在有两个模型可选,实用性变强了
深度学习模型升级引发AI能力大跃进,行业迎新变革· 55 条信息
#GPT-5 #Claude Sonnet 4 #全栈编码问题 #模型切换 #augment
avatar
nicekate
3周前
刚发现 Gemini Pro Flow 有 1000 积分,居然能生成 50个 Veo 3 - Fast 视频 而且视频放大到 1080P 居然不要花积分,谷歌太良心了
Google Gemini 2.5发布引发AI模型性价比热议· 145 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 392 条信息
#Gemini Pro Flow #Veo 3 #视频生成 #1080P #谷歌良心
avatar
nicekate
3周前
谷歌太给力了,Jules 所有测试期用户获赠 3 个月 Google Pro 访问权 (部分地区可能受限,检查你的邮箱) 之前充值 Ultra 没享受到 Deep Think 取消了订阅, 最近谷歌好多产品功能发布 现在终于又可以用上会员服务啦
Google Gemini 2.5发布引发AI模型性价比热议· 145 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 392 条信息
#谷歌 #Google Pro #会员服务 #Jules #积极
avatar
nicekate
3周前
Grok Imagine (畅想)功能实在太强了,安卓Grok终于可以用上了 xAI 的 GPU 不要钱吗? 生成速度实在太太快了!新时代的抖音 图片生成质量不错,视频画质差点(不过速度很快,可以理解)
AI视频井喷:Midjourney领跑,多模态混战· 128 条信息
#Grok Imagine #安卓Grok #XAI #图片生成 #视频画质
avatar
nicekate
4周前
九宫格图片本身就是很好的 AI 视频提示词,Hailuo 2 干得不错 看我百变猫猫
AI视频井喷:Midjourney领跑,多模态混战· 128 条信息
#九宫格图片 #AI视频 #Hailuo 2 #百变猫猫
© 2025 news.news. All rights reserved. 0.05525 秒. v1.0.46
我的评论