杀马特副教授
0 关注者
†101超天才酱†🇹🇼✈(571分钟不间断†升天†)
19小时前
Deepseek和豆包给我发野爹证了😃
宝玉
3天前
我个人是不喜欢用 spec-kit,不是好的上下文工程: - 小项目没必要 - 大项目描述不清楚 - 一大坨文档反而占用上下文影响生成 - 文档不保持及时更新反而会误导 Agent 好的上下文管理是针对当前上下文引导 Agent 找到合适的刚刚好的上下文,而不是不管三七二十一塞给它十几个文档!
LIN WEI
1周前
还是我爸先进,半年前就和我聊过 deepseek 的事了,这次回家就和我聊稳定币,让我 “多关注下区块链”,现在国家要在香港搞稳定币试点,这东西一旦搞起来,就会带来 “翻天覆地的变局”,所以要让我 “可以深入了解下,不要掉队”
机场候机时边上有父子两,儿子开着笔记本写代码,爹在一旁边看边问“你们搞得这个和 ai 有什么关系吗?和现在那个 deepseek 有关吗?” 儿子说 “没有” 爹又问 “那个什么 deepseek 好像原来是做量化的,你们做的是不是和量化很像啊?” ,“不像”,爹一边听着一边皱着眉头,似乎很担心自己的儿子没跟上时代
WY
DeepSeek又一次引领世界 前几天DeepSeek发布了V3.2-Exp实验性模型,虽然这次的发布没有引起太大的声量,但我仔细研究了一下,觉得实际上是又一次重大突破,很可能DeepSeek再一次在大模型高性价比技术上引领了世界。 通过全新的DeepSeek Sparse Attention(DSA)稀疏注意力机制,V3.2-Exp将大模型的推理成本从平方级直接降至接近线性。传统注意力机制的