勃勃OC2025-02-26 12:01:47DeepSeek 推出了 DeepEP,这是一款开源通信库,旨在提高混合专家(MoE)模型的训练和推理效率。 DeepEP 通过支持 NVLink 和 RDMA 技术的节点内(intranode)和节点间(internode)配置来优化 GPU 通信。它具备高吞吐量和低延迟的计算内核,并支持 FP8 运算,旨在降低训练成本并提升 AI 模型的可扩展性。 该发布受到了 AI 社区的热烈欢迎,凸显#DeepSeek#DeepEP#开源通信库
偶像派作手2025-01-28 13:04:02昨天我在使用DeepSeek的时候出现过好几次因为聊天的人太多而无法回答,这恰恰说明仍然需要大量算力,或者说大量算力+优化计算效率。 在提升了计算效率后,如果有高端芯片的话那岂不是更加如虎添翼,这样像奥特曼发推说的:“现在比任何时候都更需要算力。”#DeepSeek#算力需求#计算效率