Radeon Open Compute “ROCm” Stack v3.1 được phát hành với RAS cho Vega 7nm, Hỗ trợ SLURM để quản lý tài nguyên tốt hơn, nhưng Navi vẫn bị thiếu

Radeon Open Compute hoặc "ROCm" stack phiên bản mới hiện có sẵn để tải xuống. Radeon Open Compute v3.1 mang trong mình khá nhiều tính năng, nhưng kỳ lạ là vẫn thiếu hỗ trợ cho AMD Navi cũng như GFX10.

ROCm, nền tảng chung được chấp nhận rộng rãi nhất cho máy tính tăng tốc GPU, hiện đã có phiên bản 3.1. Bản cập nhật mới nhất cho nền tảng mô-đun cho phép các nhà cung cấp phần cứng xây dựng trình điều khiển hỗ trợ khung ROCm bao gồm một số tính năng được mong đợi nhiều như hỗ trợ RAS ​​cho Vega 7nm và hỗ trợ SLURM cho GPU AMD. Tuy nhiên, vì lý do chưa rõ, ROCm vẫn chưa hỗ trợ đầy đủ cho Kiến trúc AMD Navi thế hệ tiếp theo.

Có gì mới trong Radeon ROCm v3.1:

Thay đổi lớn nhất và rõ ràng nhất trong cài đặt mới của Radeon ROCm v3.1 là trong Cấu trúc Thư mục Cài đặt ROCm. Một bản cài đặt mới của bộ công cụ ROCm sẽ cài đặt các gói trong/ opt / rocm- thư mục. Trước đây, các gói bộ công cụ ROCm đã được cài đặt trong/ opt / rocm thư mục.

Phiên bản mới của ROCm đã nâng cao hỗ trợ Độ tin cậy, Khả năng truy cập và Khả năng phục vụ (RAS) cho GPU Vega 7nm. Công trình Vega 7nm này có lẽ được đặt dưới kính hiển vi vẫn cho "Arcturus" dựa trên Vega máy tính tăng tốc sẽ ra mắt trong năm nay. Hỗ trợ bao gồm:

  • UMC RAS ​​- HBM ECC (chèn lỗi không thể sửa chữa), ngắt trang, khôi phục RAS qua GPU (BACO) đặt lại
  • GFX RAS - GFX, MMHUB ECC (chèn lỗi không thể sửa được), khôi phục RAS qua GPU (BACO) đặt lại
  • PCIE RAS - PCIE_BIF ECC (chèn lỗi không thể sửa chữa), khôi phục RAS qua GPU (BACO) đặt lại

Radeon ROCm v3.1 cũng được hỗ trợ SLURM cho GPU AMD. SLURM hoặc Tiện ích Linux đơn giản để quản lý tài nguyên là một trong những hệ thống lập kế hoạch công việc và quản lý cụm được ưu tiên và sẵn sàng sử dụng cho các cụm Linux. SLURM được ưa thích hơn vì nó là nguồn mở, khả năng chịu lỗi và có khả năng mở rộng cao.

Hệ thống này hiện có thể tương tác tốt với GPU AMD. Phiên bản mới nhất 20.02.0 của SLURM bao gồm các plugin AMD cho phép SLURM tự động phát hiện và định cấu hình GPU AMD. Nó cũng thu thập và báo cáo mức tiêu thụ năng lượng của chip đồ họa. Hỗ trợ SLURM là một bổ sung hữu ích do số lượng triển khai siêu máy tính ngày càng tăng sử dụng GPU Radeon và các cụm GPU AMD lớn hơn khác.

Mặc dù bao gồm một số tính năng, vẫn không có dấu hiệu nào về việc hỗ trợ GFX10 / Navi trong ROCm. Trang GitHub cho ROCm đã được cập nhật để phản ánh tất cả các thay đổi, ghi chú cài đặt và các vấn đề đã biết.

Facebook Twitter Google Plus Pinterest