文章
AMD ROCm 7.2.0 正式发布:支持多款新硬件,优化 Instinct AI 性能

AMD ROCm 7.2.0 正式发布:支持多款新硬件,优化 Instinct AI 性能

2026年1月26日 09:47·ithome

AI
AMD ROCm
Instinct

IT之家 1 月 26 日消息,AMD 上周正式发布了 ROCm 开源软件堆栈的 7.2.0 版本。这一版本新增了对多款新硬件的正式支持,并优化了 Instinct MI350 系列与 MI300X 显卡加速器的 AI 表现

具体来看,ROCm 现已正式支持 AMD Radeon AI PRO R9600D、Radeon RX 9060 XT LP、Radeon RX 7700 三款独立显卡和最近推出的锐龙 AI 400 系列处理器。

同时,这一版本在 Instinct MI355X 上显著提升了 Meta Llama 3.1 405B 模型的推理表现,通过内核级调优和内存带宽提升实现了吞吐量提升和延迟降低;优化了 Llama 3 70B 和 Llama 2 70B 在 MI355X、MI350X 上的性能;在 MI300X 上优化智谱 GLM-4.6 的 GEMM 算子性能和 DeepSeek 的 DeepEP 开源通信库表现。

ROCm 7.2.0 还包含其它一系列改进,包括提升 HIP 运行时性能、新增对多 GPU 节点的节点电源管理等。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。