安全提示:即将离开云搜,稍后自动跳转...
deepseek
deepseek-v3 / r1 推理系统的优化目标是更大的吞吐,更低的延迟。 为了实现这两个目标,我们的方案是使用大规模跨节点专家并行(expert parallelism / ep)。首先