SleepyZone
0 关注者
karminski-牙医
22小时前
速报一波,GLM-5.1 真的猛,应该是从国产模型SOTA要跃升到真正的全球SOTA了,我的 vector-db-bench 直接刷到了第一,我已经在剪视频了,稍后马上为大家带来GLM-5.1详细评测视频~ (另, GPT-5.4-Pro(xhigh) 真的贵, 为了跑这个昨天干进去150刀....其实也算好消息, 当模型价格比我工资贵, 那它就没太多竞争力了...[允悲]) (测试在这里:)
Lex Tang
2天前
每次用完额度我就很希望小米入场做适合 agentic coding 的 LLM 模型,帮家人们把价格打下来,主打便宜管饱,质量比 GLM 好就行。只要不把广告插在代码里,全程给我刷广告我都可以接受。编码模型名字我也想好了,叫 Redme-SU-CodeOK-Max-Extra-High
Riyam
GLM 5.1 有点拖泥带水 初中生装博士的感觉 活脱脱一个王自如
sitin
6天前
Unsloth Studio 本地微调大模型一直有两个痛点:VRAM 不够、配置太复杂。 Unsloth Studio 这周上线 Beta,两个都解决了: • 开源 no-code Web UI,点点鼠标就能微调 • VRAM 占用减少 70%(一张 RTX 3090 就能调 7B 模型) • 速度比 HuggingFace 原生快 2 倍 • 支持 Llama 4、Qwen 2.5/3.5
Gorden Sun
2周前
Reka Edge:开源最佳多模态小模型 7B大小,评分超过Qwen 3.5 9B,且更省token、速度更快。Reka的创始成员很多来自谷歌DeepMind,所以继承了很多Gemini的多模态经验。 模型: