腾讯Angel获世界互联网大会领先科技奖:让通信成本降低70%

11月20日消息,腾讯2024年世界互联网大会今日在浙江乌镇开幕,获互联会领腾讯获得全新设立的世界世界互联网大会杰出贡献奖—创新突破类。

据“腾讯”公众号介绍,先科信成腾讯Angel机器学习平台也获得了本年度世界互联网大会领先科技奖。技奖

腾讯Angel获世界互联网大会领先科技奖:让通信成本降低70%

腾讯称,让通该奖项被视为科技行业的本降最高荣誉之一,在270个申报项目中,腾讯共有20个项目获奖。获互联会领

评选委员会点评腾讯Angel机器学习平台:突破万亿级模型分布式训练和推理以及大规模应用部署等难题。世界

据了解,先科信成突破主要在通信、技奖效率、让通规模三方面实现。本降

通信:

从网卡到交换机,腾讯再到路由协议,腾讯自研的RDMA网络实现了集群高速互联,单节点带宽达到3.2T,相比于同类领先产品,性能提升30%,成本降低70%。

效率:

自研了训练/推理框架,提出显存加主存的一体化机制,实现多维并行和算子优化,相比开源框架,训练性能提升2.6倍,推理速度提升2.3倍。

规模:

实现了单任务万卡的线性扩展,GPU集群加速比从50%提升到99%。

腾讯Angel机器学习平台是干嘛的,如果你手握一堆数据,想从零开始训练一个大模型,整个过程可以分成三层,Angel会在中间层发挥作用。

其中,底层GPU、云服务器等计算硬件提供算力支持,中层是机器学习平台,负责处理数据、开发算法和执行训练任务,上层是训练好的大模型。

简单来说,Angel机器学习平台可以把一堆杂乱的数据经过清洗、训练、加工等工序,变成一个强大的大模型。