首页 家电百科 实时讯息 常识
首页 > 实时讯息 >

DeepSeek公开致谢腾讯技术团队

  • 0次浏览     发布时间:2025-05-08 13:46:00    

5月7日,深视新闻记者获悉,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。

经测试,优化后的通信框架性能在RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。相关技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup”代码贡献。

自今年2月DeepSeek开源包括DeepEP在内的五大代码库以来,该团队便向业界展示了如何利用有限的硬件资源实现接近万卡集群的性能。在这些技术中,DeepEP凭借突破性的方法提升了300%的通信效率,成功解决了MoE架构大模型对英伟达NCCL的依赖问题。

但该技术在成本较低、适用面更广的RoCE网络环境中表现不佳,限制了其在更广泛场景的应用。这一痛点引发了开源社区的持续讨论。

腾讯星脉网络团队基于在RoCE网络领域的积累,在DeepEP开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是CPU控制面交互存在时延。

腾讯在RoCE网络优化方面的突破,首先体现在带宽分配的智能化,通过拓扑感知的多QP建链技术,智能分配数据流,优化了双端口网卡的带宽利用率,确保每条数据通道都能得到充分使用。此举避免了带宽浪费,为RoCE网络的性能提升提供了支撑。

其次,腾讯还着力解决了GPU通信中的CPU控制瓶颈问题。通过基于IBGDA技术的优化,腾讯使得“控制面”场景的操作也可以绕过CPU的“中转”,进一步降低了延迟和能耗,提升了整体通信效率。

同时,GPU直接“对话”时存在的传输顺序混乱难题,腾讯提出了“QP内时序锁”机制,使得多个GPU间的数据传输能够精准、按顺序完成,即使同时处理1000多个数据传输任务,DeepEP也能自动理顺先后顺序。

在腾讯的技术优化下,DeepEP不仅在RoCE网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原有通信效率再提升30%。

目前该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的高性能环境中,这套方案同样展现出卓越的通用性。


记者 / 谭诗靖

排版 / 谭诗靖

审校 / 毛芸

相关文章

  • 小区违建“堵心”?金川区城管局“三步走”巧解难题

    近日,金川区龙首壹号小区和恒昌一品小区居民发现,一些让人“堵心”的违建不见了踪影,小区环境清爽了不少。这得益于金川区城市管理局创新实施的“三步走”妙招。△整改前后对比图此前,龙首壹号小区有住户在楼外私自搭了台阶,恒昌一品小区有人随意在围栏上开了口子。这些违建看着是方便了自家,却挡住了消防通道、破坏了

    2025-06-19 15:58:00
  • 400余家医疗机构云集 雄安医疗大健康技术应用大赛启幕

    400余家医疗机构云集 雄安医疗大健康技术应用大赛启幕_河北日报客户端

    2025-06-19 01:17:00
  • 国家级专家深入田间问诊把脉 助力贵州玉米单产跃升新台阶

    为深入落实国家新一轮千亿斤粮食产能提升行动部署,破解玉米单产提升瓶颈,6月14—15日,国家玉米产业技术体系首席科学家、中国农业科学院科技局局长李新海研究员,国家玉米产业技术体系栽培室岗位专家、四川省农科院副院长刘永红研究员,国家玉米产业技术体系育种岗位专家、四川农业大学玉米研究所党委书记高世斌一行

    2025-06-18 13:07:00
  • 6·18热销浪潮中的5G-A元素:一加13等用上新网,iPhone 16e还没上车

    前一段时间,有不少消费者发现,手机屏幕右上角的“5G”标志变成了“5GA”,意味着手机可以连上速度更快的5G-A网络。举例来说,如果要下载一部大小为10GB的高清电影,使用5G-A网络仅需8秒钟即可完成下载,这极大地减少了用户的等待时间。据媒体报道,目前我国运营商已经在31个省份部署了5G-A测试网

    2025-06-14 00:04:00
  • 中国工程院院士贺克斌:“一带一路”共享绿色转型机遇|院士上封面

    封面新闻记者 闫雯雯 车家竹 摄影报道6月12日,第二届“一带一路”科技交流大会科技引领“碳达峰碳中和”论坛成功举办。该论坛深入探讨科技在推动“碳达峰碳中和”目标实现中的关键作用,增进共建“一带一路”国家在碳中和领域的科技创新和产业合作。中国工程院院士、天府永兴实验室学术委员会主任、清华大学教授贺克

    2025-06-13 15:30:00