DeepSeek公开致谢腾讯技术团队
- 0次浏览 发布时间:2025-05-08 13:46:00
5月7日,深视新闻记者获悉,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。
经测试,优化后的通信框架性能在RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。相关技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup”代码贡献。

自今年2月DeepSeek开源包括DeepEP在内的五大代码库以来,该团队便向业界展示了如何利用有限的硬件资源实现接近万卡集群的性能。在这些技术中,DeepEP凭借突破性的方法提升了300%的通信效率,成功解决了MoE架构大模型对英伟达NCCL的依赖问题。
但该技术在成本较低、适用面更广的RoCE网络环境中表现不佳,限制了其在更广泛场景的应用。这一痛点引发了开源社区的持续讨论。
腾讯星脉网络团队基于在RoCE网络领域的积累,在DeepEP开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是CPU控制面交互存在时延。
腾讯在RoCE网络优化方面的突破,首先体现在带宽分配的智能化,通过拓扑感知的多QP建链技术,智能分配数据流,优化了双端口网卡的带宽利用率,确保每条数据通道都能得到充分使用。此举避免了带宽浪费,为RoCE网络的性能提升提供了支撑。
其次,腾讯还着力解决了GPU通信中的CPU控制瓶颈问题。通过基于IBGDA技术的优化,腾讯使得“控制面”场景的操作也可以绕过CPU的“中转”,进一步降低了延迟和能耗,提升了整体通信效率。
同时,GPU直接“对话”时存在的传输顺序混乱难题,腾讯提出了“QP内时序锁”机制,使得多个GPU间的数据传输能够精准、按顺序完成,即使同时处理1000多个数据传输任务,DeepEP也能自动理顺先后顺序。
在腾讯的技术优化下,DeepEP不仅在RoCE网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原有通信效率再提升30%。

目前该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的高性能环境中,这套方案同样展现出卓越的通用性。
记者 / 谭诗靖
排版 / 谭诗靖
审校 / 毛芸
相关文章
-
1800万元!贵州理工学院单项科技成果转化交易额创新纪录
科技成果转化是实现创新价值的“最后一公里”,只有打通政策堵点,才能激活科技创新“一池春水”。2025年,贵州理工学院矿业工程学院科研团队将“一种便于搬运的折叠液压巷道支护装置”等7项专利和“煤矿巷道再造承载结构全空间协同支护技术”等2项专有技术作价1800万元,以技术许可方式向贵州理工智矿科技有限公
2025-07-27 16:35:00 -
武汉顶级医学大咖“论剑”汉江湾
湖北日报讯(记者余瑾毅、通讯员王敏、张全录)7月24日,武汉市首批核心医疗技术评审活动之“整形、甲乳、麻醉、五官、皮肤”领域答辩评审会,在武汉市肺科医院汉江湾院区举行。各三甲医院的顶级医学大咖先后亮出35项核心医疗技术。脑中风让人失去行动,眼中风却能在九十分钟内偷走光明。眼中风又名视网膜中心动脉阻塞
2025-07-25 08:31:00 -
2025 年国内十大权威网站建设公司推荐:最新榜单测评 网站设计+网站制作公司推荐
在当今数字化时代,网站已成为企业的重要线上门户,是品牌展示、客户互动与业务拓展的关键平台。选择一家优质的网站建设公司,对企业的数字化发展至关重要。为帮助企业在众多服务商中精准筛选,我们综合考量技术实力、设计水准、服务质量、行业口碑等多方面因素,为您推荐 2025 年国内十大权威网站建设公司,并按照
2025-07-23 11:22:00 -
打破国外垄断!潍柴助力中国首个柴油机油D1标准诞生
7月18日下午,中国首个柴油机油D1标准通过中央电视台央视频向全球直播正式发布。山东重工旗下潍柴作为标准制定的重要参与者在直播现场见证中国标准化事业的里程碑时刻。7月18日下午,中国首个柴油机油D1标准通过中央电视台央视频向全球直播正式发布中国工业发展的壮阔画卷中,总有一些企业以坚定的信念和卓越的行
2025-07-21 11:18:00 -
在现场|“网络身份证”,这样来申领
“您已成功申领网络身份认证凭证,您的网号为……”7月16日,石家庄市民赵女士听说能申领“网络身份证”后,迫不及待进行了申领。申领“网络身份证”时,赵女士首先在手机上下载“国家网络身份认证”App,进入主页面的“申领”选项,页面跳转进入证件类型选择。选择“居民身份证”后,赵女士将提前准备好的身份证靠近
2025-07-21 08:00:00