2025-05-31 18:00:01
DeepSeek 推出了 DeepEP,这是一款开源通信库,旨在提高混合专家(MoE)模型的训练和推理效率。 DeepEP 通过支持 NVLink 和 RDMA 技术的节点内(intranode)和节点间(internode)配置来优化 GPU 通信。它具备高吞吐量和低延迟的计算内核,并支持 FP8 运算,旨在降低训练成本并提升 AI 模型的可扩展性。 该发布受到了 AI 社区的热烈欢迎,凸显了其在处理大规模 AI 任务方面设立新标准的潜力。
2025-05-31 18:00:01
2025-05-31 16:23:00
2025-05-30 20:55:37
2025-05-30 20:26:24
2025-05-30 16:17:29