GPU NVIDIA Ampere A100 250W TDP trên PCIe 4.0 dành cho AI, Khoa học dữ liệu và Siêu máy tính được ra mắt với hiệu suất 90% hứa hẹn của mẫu 400W
NVIDIA đã chính thức ra mắt A100, một GPU tương thích PCIe 4.0 dựa trên kiến trúc Ampere thế hệ tiếp theo. Mặc dù có cấu hình TDP 250W thấp hơn, NVIDIA hứa hẹn GPU PCIe 4.0 Ampere A100 sẽ có thể cung cấp tới 90% hiệu suất của GPU A100 HGX 400W đầy đủ. Biến thể thứ ba của dòng GPU Ampere A100 đang phát triển của nó, A100 PCIe dành cho các máy chủ chạy các cụm Trí tuệ nhân tạo (AI), Khoa học dữ liệu và Siêu máy tính.
NVIDIA đã tiết lộ một biến thể PCI-Express 4.0 của GPU A100. GPU dựa trên vi kiến trúc Ampere 7nm. Ngoài ra, công ty cũng đã công bố một số hệ thống hỗ trợ A100 từ các nhà sản xuất máy chủ hàng đầu, bao gồm Asus, Dell, Cisco, Lenovo, v.v. Bộ tăng tốc GPU 250W A100 PCIe 4.0 khá giống với biến thể TDP 400W đầy đủ và NVIDIA cũng hứa hẹn hiệu suất gần như giống hệt nhau mặc dù cấu hình TDP đã giảm đáng kể.
GPU NVIDIA A100 Ampe trong PCIe 4.0 Form-Factor Với cùng cấu hình GPU A100 HGX 400W nhưng ở 250W:
NVIDIA đã công bố bộ tăng tốc GPU PCIe 4.0 A100 PCIe của mình. GPU Ampere có sẵn cho một loạt các trường hợp sử dụng công nghiệp với các hệ thống từ một GPU A100 PCIe duy nhất đến các máy chủ sử dụng hai thẻ cùng lúc thông qua 12 kênh NVLINK cung cấp tổng cộng 600 GB / s băng thông kết nối. Bộ tăng tốc GPU 250W TDP A100 PCIe không thay đổi nhiều về cấu hình lõi khi so sánh với GPU A100 HGX 400W.
https://twitter.com/storagereview/status/1275132949709688833
GPU GA100 có các thông số kỹ thuật của biến thể A100 HGX 400W với 6912 lõi CUDA được sắp xếp thành 108 đơn vị SM, 432 lõi Tensor và 40 GB bộ nhớ HBM2 mang lại cùng băng thông bộ nhớ 1,55 TB / s (làm tròn thành 1,6 TB / S). Tuy nhiên, việc triển khai gói GPU trên Tiêu chuẩn PCIe 4.0 có nhược điểm riêng của nó là làm giảm đáng kể TDP. Điều này được báo cáo có nghĩa là một hình phạt hiệu suất từ 10 đến 50 phần trăm dựa trên khối lượng công việc. Hơn nữa, biến thể 250W TDP của GPU A100 phù hợp hơn với các vụ nổ ngắn hơn là tải duy trì.
GPU NVIDIA A100 Ampe trong Hiệu suất Hệ số hình thức PCIe 4.0:
Do cấu hình TDP giảm đáng kể, có thể giả định rằng thẻ sẽ có đồng hồ thấp hơn để bù đắp cho đầu vào TDP ít hơn. Tuy nhiên, các số liệu hiệu suất mà NVIDIA đã phát hành thực sự đáng ngạc nhiên vì chúng khá gần với biến thể TDP 400W. Hiệu suất FP64 vẫn được đánh giá là 9,7 / 19,5 TFLOPs, hiệu suất FP32 được đánh giá ở mức 19,5 / 156/312 TFLOP (thưa thớt), hiệu suất FP16 được đánh giá ở 312/624 TFLOP (thưa thớt) và INT8 được đánh giá ở 624/1248 TOP ( Thưa thớt).
Phép toán đơn giản chỉ ra và NVIDIA đảm bảo, GPU A100 PCIe 4.0 250W dựa trên Ampere có thể cung cấp 90% hiệu suất của thẻ A100 HGX (400W) trong các ứng dụng máy chủ hàng đầu. Điều này là chính đáng vì biến thể mới cần ít thời gian hơn để hoàn thành các nhiệm vụ nêu trên. Tuy nhiên, các con số chỉ nên có giá trị trong khoảng thời gian ngắn. Trong những tình huống phức tạp, đòi hỏi khả năng hoạt động bền bỉ của GPU, GPU 250W PCIe 4.0 có thể mang lại hiệu suất từ 90% đến 50% cho GPU 400W A100 HGX.
Vi kiến trúc Ampere chắc chắn sẽ mang lại lợi ích cho A100 mới. NVIDIA hứa hẹn sẽ tăng hiệu suất ít nhất gấp 20 lần so với phiên bản tiền nhiệm dựa trên Volta. GPU PCIe 4.0 A100 có công nghệ GPU đa phiên bản. Điều này có nghĩa là một chiếc A100 có thể được phân chia thành bảy GPU riêng biệt để xử lý các tác vụ tính toán khác nhau. Trong khi điều này thúc đẩy phân đoạn, có NVLink thế hệ thứ 3, cho phép một số GPU được kết hợp thành một GPU khổng lồ.