Jeff Li

Jeff Li

0 关注者

6个月前

李老师讲课,什么是大模型的蒸馏(distillation),以及我们应该如何看DeepSeek遭遇的“模型蒸馏”指控

#大模型 #蒸馏 #DeepSeek #技术讲解 #模型蒸馏指控

相关新闻

placeholder

🍀𝗛𝗮𝗽𝗽𝘆🦜𝗤𝗤💻

1小时前

响叔你要是把这个难题解决了,让 大模型知道自己的回答是正确的,你会直接干翻 OPENAI,CLAUDE 的……

placeholder

Geek

2小时前

注册送 $20 可用 GPT-5、Claude Sonnet 4、GptOSS-120b。DeepSeek 免费用至 2026-01-01,未试真假,就不放自己的推广链接了(网址见图),有需要的兄弟评论区发AFF吧

placeholder

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

10小时前

大模型时代,企业AI落地心法-从过去单纯膜拜Palantir本体工程的一堆项目尸体中重生 范友们的实践总结得真好:用LLM生成细分领域本体字典,再打标切分文档,反过来再应用生成的时候,LLM的响应就有很惊艳的效果,在准确率和提供洞察上。 这似乎是LLM用于垂直领域场景的一个正确的方向。

placeholder

yetone

16小时前

尽量把产品做得简陋一点,说不定等到下一代大模型出来的时候,你产品的简陋反倒成了你先知般的预判了呢🌚

placeholder

Datou

1天前

这个暴躁linus提示词实测有效。之前大模型vibe coding出来的代码有显存泄露的问题,让它修复它只会补丁摞补丁,又复杂又不能彻底解决问题。用上linus提示词之后大模型一下子就生猛了,重构核心函数之后问题彻底解决。而且它还很持久,20万token之后依然能保持有效输出。

© 2025 news.news. All rights reserved. 0.11702 秒. v1.0.42
我的评论