时政
财经
科技
虚拟货币
其他
登录
#小模型
关注
Leo Xiang
1个月前
利用好LLM 的prefix特性,用小模型先回复,然后大模型续上,LLM 首句延迟可以大幅降低到100ms级别。 今天vibe coding 的成果之一:
#LLM
#prefix特性
#小模型
#大模型
#首句延迟
分享
评论 0
0
Gorden Sun
1个月前
Seed-X:专门用于翻译的小模型 字节开源Seed-X,专门用于翻译的小模型,仅7B大小,在人类评分中,翻译效果接近DeepSeek R1和Gemini Pro 2.5的水平。值得一提的是,训练过程特意去掉了STEM、代码、推理的相关数据,特别专注于翻译任务。 模型:
#Seed-X
#翻译模型
#字节跳动
#开源
#小模型
分享
评论 0
0
Gorden Sun
2个月前
谷歌开源Gemma 3n 端侧运行的小模型,分2B和4B大小,支持文本、图片、音频输入,文本输出。首个在LLM竞技场获得1300的10B以下模型。 官方介绍: 模型:
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 382 条信息
Google Gemini 2.5发布引发AI模型性价比热议· 138 条信息
#谷歌
#Gemma 3n
#开源
#端侧运行
#小模型
分享
评论 0
0
wong2
2个月前
Dia的安装包有470M, Chrome只有200M,这是塞了个小模型吗
#Dia安装包大小
#CHROME
#小模型
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞