前言,智能时代需要新质生产力,作为新质生产力的核心载体,智算中心(AIDC)的建设在全国各地如火如荼的进行,其在整体设计方面和传统IDC相比有很大区别,本文参考了HW新发布的《AIDC白皮书》里的内容,从业务承载、算力类型、技术架构和散热模式4个方面简单介绍。
一、承载的业务层面的差异
传统IDC:主要承载企业级应用和数据存储,如Web服务、数据库管理和文件存储等常规信息处理任务,涉及AI训练、推理类的应用很少。
新型AIDC:主要承载 AI模型的训练与推理,高效提供算力资源,并支持大数据集的处理。
二、算力类型的差异
传统IDC:以CPU为中心,适用于一般性的计算需求。
新型AIDC:以GPU类芯片为中心,提供并行计算,处理 AI 模型训练所需的大量矩阵运算。
三、技术架构上的差异
传统IDC:采用冯·诺依曼的主从架构,其中CPU 扮演指挥官的角色,负责分配任务给其他部件。这种架构在面对大规模并行计算任务时存在“计算墙”、“内存墙”和“I/O 墙”等问题,限制了性能的进一步提升。
AIDC:通常采用更加先进的全互联对等架构,允许处理器之间,以及处理器到内存、网卡等直接通信,减少了中心化控制带来的延迟,突破主从架构的算力瓶颈,实现了高效的分布式并行计算。
四、散热模式的差异
传统IDC:单机柜功率密度通常在 4~8千瓦之间,可装载的服务器设备数量有限,算力密度相对较低,一般采用传统的风冷散热。
新型AIDC:单机柜功率密度通常在 20~100 千瓦之间,主要采用液冷或风液混合的散热技术。液冷能够更有效地带走热量,保证高性能计算设备的稳定运行。
五、资料分享环节