时政
财经
科技
虚拟货币
其他
登录
#模型
关注
Lex Tang
23小时前
MBP 本地跑一些小一点的模型,做一些简单的文字和代码处理,还是挺爽的,延时低,也没有额度焦虑。现在后悔当时没上 128G 内存和 2T 的 SSD
#MBP
#本地计算
#模型
#文字处理
#代码处理
#延时低
#存储
分享
评论 0
0
快乐永远
2天前
买模型是为了让自己开心,不是为了给柜子里增加一个祖宗。 但是这个道理很多模型玩家没想明白
#模型
#玩家心理
#收藏
#兴趣爱好
#个人幸福
分享
评论 0
0
阑夕
6天前
爆肝两天时间,玩了下二次元生图赛道最出圈的PixAI,几乎是一个周末就把攒下来的积分全用完了,看着满满当当的成果,有种溢出屏幕的爽感。 这事的契机,源于我对AI大厂的二次元生图能力始终评价不高,包括Banana在内的很多模型,画面的精美程度倒是没毛病,但角色灵魂总有挥之不去的空洞感。 碰巧PixAI发布了Tsubaki.2的新模型,我只能说专业的事还得专业的人来干,哪怕跟Midjourney/niji这些同类产品比,PixAI的自由度可能也远超出了我的预期。 其中最明显的感受是,我甚至在Tsubaki.2的身上,体验到了一种类似于肉鸽游戏构筑BD的玩法。 什么意思呢?就是它给的模块化的可选项实在太多了,除了最常规的提示词输入和补全之外,Token预算、风格预设、LoRA参考、图片尺寸、生成数量……这些统统都是可以定制的,整个过程像搭积木一样垒出来最终的成品。 当然,由于这些默认设置基本都是取一个通用性最高的选项,所以新手也不存在什么使用门槛,稍微多用一用,掌握一些技巧还是不难的。 更何况还有提示词助手这种轮椅级别的功能,都是为了能让人最快上手。 比如我沿着社区里吹爆的光影表现,做出了这么两组风格完全不同的图,看完瞬间理解那些画师的失业焦虑了……(图1)(图2) 包括用二游相关LoRA做出来的成品,虽然背景还略显拉跨,但人物完全够格拿来当一些小厂的角色设计底板了。(图3) 更不用提最热门的二创方向,Tsubaki.2同时解决了多人物混乱和手部建模扭曲的问题,这也是过去二次元生图赛道大家公认的阿克琉斯之踵。(图5)(图6) 这也难怪PixAI近一半的用户都来自日本,作为ACG文化的老家,可能没几个肥宅,我是说二次元爱好者能顶得住开箱即用的体验。 我贴出来的这些,基本都是从一次多张生成里选出来的,没有太高的抽卡成本,如果不是非常高频,每日赠送的额度完全够用。 这多少能解释,为什么从今年开始关于「垂类模型到底有没有必要存在」的讨论声音变得越来越少了,按理来说,模型越做越强,AI生图这门生意一定会被大厂垄断。 但现实是,仍然有大量像PixAI这样的垂类平台能跑出来,说明通用模型其实很难满足真实存在的长尾需求。
#PixAI
#二次元生图
#AI大厂
#Tsubaki.2
#模型
#midjourney
分享
评论 0
0
Mr Panda
1周前
全球主流的三大模型, GPT-5.4 Pro 的价格可真是贵, 差不多是另外两家的5倍以上。
#GPT-5.4 Pro
#价格
#人工智能
#模型
分享
评论 0
0
卫斯理
2周前
通过openclaw编写skill + vibe coding搞定了飞书的语音输入 耗费了16W token,使用了ffmepg + whisper本地模型.....
#OpenClaw
#Vibe Coding
#飞书
#语音输入
#ffmpeg
#Whisper
#模型
分享
评论 0
0
indigo
2周前
Claude 最近上新频繁!今天 Max、Team & Enterprise 的 Claude Code 默认支持了 1M 的上下文。如图 Opus 4.6 和 Sonnet 4.6 在整个 1M 窗口内的准确率明显高于 GPT 5.4 和 Gemini 3.1 Pro。一个模型上下文的准确性和检索力,决定了其完成复杂任务的质量,Context 就是模型在应用层面的“持续学习”✨
#Claude
#Max
#team
#Enterprise
#ClaudeCode
#Opus
#sonnet
#GPT
#Gemini
#模型
#上下文
#检索力
#复杂任务
#持续学习
分享
评论 0
0
sitin
3周前
Hume AI 这次开源的 TADA,换了一个更务实的方向:先把不出错、够快、够轻这三件事做到极致。 传统 LLM 做 TTS,一个很大的麻烦就是:文字信息很少,但音频帧特别多,最后就容易上下文爆炸、推理变慢,甚至模型越说越跑偏。 TADA 的解法很直接,就是尽量让文字和语音“一对一锁住”往前走。你可以简单理解成,它不是先想好一大段声音再慢慢往外吐,而是每读一个 token,就同步生成对应那一小段语音。 这样做的好处非常现实:速度更快、内存更省,而且从结构上就更不容易胡说八道。我觉得这类设计比单纯堆参数、堆数据更有意思,因为它是在真正解决架构层面的老问题。 两个特点: 第一是它够轻,甚至能往手机、边缘设备上放,这意味着以后很多语音能力不一定非要走云端 API,端侧跑起来后,延迟、隐私、成本都会好很多。 第二是它开源得比较彻底,MIT 协议,商用限制也少,这种东西一出来,开发者社区肯定会很快接上,后面不管是 AI 助手、播客生成、有声书、视频配音,还是需要同步字幕的场景,都会有人开始拿它做产品实验。 但是TADA 的强项明显不在“最有情绪、最像真人”,而是在“稳”和“省”。 所以如果追求的是特别强的表演感、拟人感,那可能还是得看更高端的商业模型。
#Hume AI
#TADA
#开源
#音频帧
#上下文爆炸
#推理速度
#模型
分享
评论 0
0
Viking
3周前
感觉 Codex 已经是性价比最高的了,20美元每月,可以多端,有桌面应用,有 cli,有cloud agents,手机通过 ChatGPT 也能访问云端任务,有 code review,模型上来说 GPT-5.3-Codex / 5.4 也很能打,长任务效果也不错。介绍一个朋友用免费版,发现日常轻度使用也有不少额度。 最近几天已经没有用 Claude Code 了,封号,中转又贵。想用的时候就用我的 Cursor Legacy Plan 也可以很爽快的用 Opus 4.6。
#Codex
#性价比
#桌面应用
#手机访问
#模型
#GPT-5.3-codex
#Claude Code
#封号
#中转
#轻度使用
#code review
分享
评论 0
0
ginobefun
3周前
李宏毅老师出新课了!这次深入解剖了开源项目 OpenClaw,带你 1 小时看透 AI Agent 的运作原理。 李老师用一贯通俗易懂的语言从基本的文字接龙,讲到身份、工具调用、子智能体、记忆管理,以及让模型学会等待的心跳机制。 不仅教你原理,更手把手教你如何防范 AI 搞事、设置安全沙盒,非常值得学习。
#李宏毅
#新课
#OpenClaw
#AI Agent
#原理
#模型
#安全沙盒
分享
评论 0
0
𝗦𝘁𝗲𝘃𝗲 𝕏
3周前
FlowDown 已经可以使用 Qwen3.5-0.8B-OptiQ-4bit 模型大小仅为 618.3 MB
#FlowDown
#Qwen3.5-0.8B-OptiQ-4bit
#模型
#618.3MB
分享
评论 0
0
sundyme
4个月前
舌尖上的AI第二弹:高端的模型,往往只需要最朴素的Prompt。🍌
#AI
#舌尖上的AI
#Prompt
#模型
#香蕉
分享
评论 0
0
ilovelife
4个月前
这届网友太有才了,后面的几个模型是啥?
AI高考数学测试:O3意外落后,Gemini夺冠引发热议· 67 条信息
#网友
#模型
#才
#网络
#评论
分享
评论 0
0
Orange AI
4个月前
卧槽,banana2 这世界知识和排版都太牛逼了... 虽然中文字多了还是有问题 发了半天了,发现好像大家还是没什么动静 😂 ListenHub 真的成全网首发这个模型的了 尴尬。。。
#banana2
#世界知识
#ListenHub
#全网首发
#模型
分享
评论 0
0
yihong0618
4个月前
以前的模型顶多是 AI guys 团建,今天相当于开年会了。
OpenAI GPT-5发布引发用户不满,阿尔特曼回应质疑· 158 条信息
#AI
#模型
#年会
#团建
分享
评论 0
0
Jason Young
4个月前
Gemini3 已经在 cursor 中可用,使用方法:设置 - models - add custom model,填写“gemini-3-pro-preview”并勾选启用即可使用
Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini3
#Cursor
#模型
#可用
#设置
分享
评论 0
0
Gorden Sun
4个月前
raptor-vision-1107是什么模型,在LM竞技场刷出了这个模型,效果挺不错。
#raptor-vision-1107
#LM竞技场
#模型
#效果不错
分享
评论 0
0
吕立青_JimmyLv (🐣, 🐣) 2𐃏25 | building bibigpt.co
4个月前
“当记忆的山峰缩小时,模型的参数会收敛到泛化的山峰,从而实现顿悟。”
#记忆
#模型
#参数
#顿悟
#泛化
分享
评论 0
0
lencx
5个月前
Electron 让人又爱又恨,吐槽它,成为它。卷 AI 浏览器的越来越多,让我愈发感觉不绑定模型、提供可用 api 的浏览器会是下一个热点。
#Electron
#AI浏览器
#API
#模型
#热点
分享
评论 0
0
Jesse Lau 遁一子
5个月前
总算刷到Qwen咋进场了😃
#Qwen
#模型
#AI
#积极
分享
评论 0
0
orange.ai
5个月前
今天的markdown文件就是模型的记忆卡
独立开发者手搓新Logo,MarkTodo即将上线新版本· 112 条信息
#模型
#记忆卡
#Markdown文件
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
5个月前
interesting 我还以为是个OCR光学字符识别模型,结果貌似打通了多模态vLLM。
智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限· 21 条信息
#OCR
#多模态vLLM
#模型
分享
评论 0
0
响马
5个月前
等到大伙都学会 deepseek 的模式,这个模式就会成为被狙击的模型了。博弈是没有定式的。
DeepSeek数据泄露:德国下架,信任崩盘· 446 条信息
中国DeepSeek引发美国科技股暴跌事件· 170 条信息
#DeepSeek
#模型
#博弈
#狙击
#模式
分享
评论 0
0
nicekate
5个月前
PaddleOCR-VL 依赖下了,模型下了,突然发现 Mac 上还用不了
#PaddleOCR-VL
#Mac
#模型
#无法使用
#技术问题
分享
评论 0
0
Mr Panda
5个月前
y=f(x), f 就是模型, x 就是上下文, y 就是你要的结果。 是不是很简单。 模型差距不大的时候, 那么主要的差异就是x。 上下文x 中, 最重要的就是专有数据。 所以,拥有专有领域数据积累的公司, 也会是一家好公司。
#模型
#数据
#公司
分享
评论 0
0
dontbesilent
5个月前
做一个自动化脚本 去每一条黄推下面评论:怎么做的,用的哪个模型,提示词可以分享吗
#自动化脚本
#黄推
#评论
#模型
#提示词
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞