6月20日,Intel与DBCloud深脑云举办HPC全栈产品及DBCloud深脑云液冷方案线上研讨会,会上,Intel数据中心渠道解决方案经理刘阳对Intel HPC领域的产品进行了全面介绍,并分享了下一代产品可扩展处理器的架构和性能特点,DBCloud深脑云则发布了基于Intel处理器的全新液冷解决方案,与上海科技大学林丰涵老师一同畅谈科研级别液冷方案的发展和应用。
Intel在HPC行业的全栈产品线包含了计算端的CPU、GPU、以及存储端的傲腾等产品,预计在2022年年底,英特尔将会发布第四代的至强可扩展处理器,同时也会发布一款将片上缓存内嵌在CPU芯片中的HBM型号,利用先进的封装技术和芯片创新,为高性能计算带来带宽性能与节能方面的显著提升。
2023年,Intel还计划推出一款针对于深度学习训练的GPU产品,也将是HPC领域主打的计算端产品,广泛覆盖了制造业、金融、能源、生命科学等领域。第四代至强可扩展处理器也将为高性能计算进行优化,将部分内存嵌入到CPU芯片中,为内存带宽敏感的应用提供更强的性能支持。
伴随第四代至强可扩展处理器,Intel也将发布新一代的傲腾持久内存,可以显著的提升文件系统的性能,不仅仅缩短了整体的访问时间,还能够降低存储所需要的容量。在部分真实应用场景下进行测试,整体写入性能提升了70倍。
此外,Intel还推出了基于标准统一的oneAPI软件堆栈,无论使用CPU、GPU还是FPGA进行计算,都可以通过一致的软件栈惊醒调试开发,减少重构代码的负担,解放原先的私有编程模式,释放和挖掘硬件的全部性能。
DBCloud深脑云也一同发布了面向HPC的液冷方案,采用氟化液冷却技术,通过循环压缩进行散热,在Intel铂金8368Q 高主频处理器的液冷测试当中,可以将平均运行温度控制在32摄氏度上下,
随着下半年Intel新一代CPU的发布,以及其他计算设备的更新,未来的计算密度将会越来越高,无论是CPU计算还是CPU+GPU的异构计算,设备的发热量都将会爆发式的升高,以至于目前的风冷方案将无法解决新一代计算设备的散热问题,我们的液冷方案就是为这样的场景而生。
DBCloud深脑云的液冷解决方案针对于科研场景的实际需求,发觉目前多数实验室并没有自己的机房,缺少专业的托管维护,只能根据实际情况将设备防止在普通的办公室房间。设备的发热和噪音给工作带来很大的影响,液冷恰恰可以完美解决这个问题,提供更加安静、高效、节能的散热条件。
目前,DBCloud深脑云的液冷解决方案提供了相变式双向冷却和全循环式冷却两种方式,分别解决高校实验室和大型超算中心的液冷需求,其中相变式冷却通过沸腾和冷凝,将热量传导至冷却塔凝结,重新回到冷却液当中。适合工作站的形态,通过便捷的分体式部署,在任意环境下均可使用。
而循环式的方案更加适合大型集群和超算中心使用,直接通过管道对冷却液进行循环,可以更加精准、快速的将热量带走,但部署实施相对复杂,且需要对应的机房环境。此方案单体可以支持40张GPU,组成高性能单体计算节点,不仅提升了计算性能、节约散热功耗,还可以极大的提升设备稳定性和使用寿命,经测试,相比传统风冷方案,液冷方案集群的故障率和运维成本下降了40%以上。
未来,DBCloud深脑云将会继续加深与Intel的合作,并和林丰涵老师等真实用户进行更加深入的交流,不断对新的产品和配套环境进行融合、优化,探索更加符合未来计算需求的算力方案。