Nvidia mở rộng hỗ trợ cho CPU ARM với kho phần mềm AI và HPC hoàn chỉnh của họ
Đầu ngày hôm nay, Nvidia cuối cùng đã công bố hỗ trợ cho các bộ vi xử lý với kiến trúc ARM cùng với toàn bộ phần mềm AI và HPC của mình. Nvidia rất quen thuộc với ARM vì họ đã kết hợp kiến trúc trong chip Tegra và hệ thống khác của họ trên một sản phẩm chip dành cho chơi game di động, xe tự hành, robot và điện toán AI nhúng.
Tại sao bây giờ?
ARM đã xuất hiện được một thời gian nhưng nó vẫn chưa được sử dụng trong các hệ thống HPC cho đến một vài năm. Hầu hết tất cả các hệ thống HPC đều sử dụng chip của Intel vì chúng đã có từ lâu, dẫn đến hỗ trợ thư viện và phần mềm kế thừa tuyệt vời.
Trong những năm qua, ARM đã làm việc không mệt mỏi để xây dựng một hệ sinh thái có thể biến kiến trúc của họ trở thành một giải pháp thay thế khả thi cho chip x86. Dự án Mont-Blanc là một sáng kiến lớn theo hướng này.
Những sáng kiến này cuối cùng đã thành công và các chip với kiến trúc ARM ngày càng được sử dụng nhiều hơn trong các hệ thống HPC trên thế giới.
Sở thích kinh doanh của Nvidia trong Trung tâm dữ liệu
Nvidia đã thống trị một phần lớn ngành kinh doanh GPU tiêu dùng và trong những năm qua, họ đã tạo ra một kho phần cứng và phần mềm đáng nể cho các máy trạm. Về mặt phần mềm, họ có rất nhiều giải pháp liên quan đến AI và Khối lượng công việc học sâu. Tất cả các khối lượng công việc này có thể được tăng tốc bởi GPU và đây là lúc GPU Tesla và Volta của họ xuất hiện.
Điều này đã giúp ích cho tài chính của công ty và theo một bài báo trên Fobes của tác giả Karl Freund “Trong quý 1 năm 2019 của NVIDIA, công ty một lần nữa vượt quá mong đợi, báo cáo tổng doanh thu tăng trưởng 66%, bao gồm cả tăng trưởng 71% trong hoạt động kinh doanh trung tâm dữ liệu nổi tiếng (đạt 701 triệu đô la trong quý). Đối với NVIDIA, phân khúc “Trung tâm dữ liệu” bao gồm Máy tính hiệu suất cao (HPC), đồ họa được lưu trữ trong trung tâm dữ liệu và tăng tốc AI. ”
Đây cũng là những điểm đáng nói trong bài phát biểu dành cho nhà đầu tư của Nvidia. Sau khi Nvidia mua lại Mellanox mà chúng tôi đã đề cập đây, Giám đốc điều hành Jensen Huang đã chia sẻ một số thông tin chi tiết đằng sau quyết định nêu rõ “Chiến lược đang tăng gấp đôi đối với các trung tâm dữ liệu và chúng tôi đang kết hợp và thống nhất hai nhà lãnh đạo về công nghệ máy tính hiệu suất cao. Chúng tôi tập trung vào tính toán tăng tốc cho máy tính hiệu suất cao và Mellanox tập trung vào mạng và lưu trữ cho máy tính hiệu suất cao, và chúng tôi đã kết hợp hai công ty dưới một mái nhà. Tầm nhìn của chúng tôi là trung tâm dữ liệu là những máy tính quan trọng nhất trên thế giới hiện nay và trong tương lai, khi khối lượng công việc tiếp tục thay đổi - điều này thực sự được kích hoạt bởi trí tuệ nhân tạo và phân tích dữ liệu - rằng các trung tâm dữ liệu trong tương lai sẽ được xây dựng như hiệu suất cao máy vi tính. Trung tâm dữ liệu siêu cấp thực sự được tạo ra để cung cấp dịch vụ và máy tính nhẹ cho hàng tỷ người. Nhưng trong vài năm qua, sự xuất hiện của trí tuệ nhân tạo và máy học và phân tích dữ liệu đã đặt quá nhiều tải lên các trung tâm dữ liệu, và lý do là kích thước dữ liệu và kích thước máy tính quá lớn nên nó không vừa với một máy vi tính. Vì vậy, nó phải được phân phối trên nhiều máy tính và kết nối hiệu suất cao để cho phép các máy tính này hoạt động cùng nhau ngày càng trở nên quan trọng hơn. Đây là lý do tại sao Mellanox đã phát triển rất tốt và tại sao mọi người lại nói về SmartNIC, các loại vải thông minh và mạng được xác định bằng phần mềm. Tất cả những cuộc trò chuyện đó đều dẫn đến cùng một nơi và đó là một tương lai nơi trung tâm dữ liệu là một công cụ tính toán khổng lồ sẽ gắn kết chặt chẽ - và nó sẽ cho phép nhiều người vẫn chia sẻ nó - nhưng cho phép một số ít người chạy các ứng dụng rất lớn trên chúng nữa. Chúng tôi tin rằng trong tương lai của các trung tâm dữ liệu, máy tính sẽ không bắt đầu và kết thúc tại máy chủ, mà mở rộng ra mạng và bản thân mạng sẽ trở thành một phần của cấu trúc máy tính. Về lâu dài, tôi nghĩ chúng ta có khả năng tạo ra các kiến trúc máy tính quy mô trung tâm dữ liệu.”
ARM sẵn sàng để thành công
Chip ARM cung cấp năng lượng cho hầu hết các thiết bị di động trên toàn thế giới, vì vậy kiến trúc vẫn tiết kiệm năng lượng theo thiết kế. Vì kiến trúc đã được cấp phép, nên với ARM, nhiều nhà sản xuất silicon có thể được xem xét.
Tiêu thụ điện năng vẫn là một mối quan tâm lớn đối với HPC và việc sử dụng ARM có thể giải quyết vấn đề này ở một mức độ lớn. Ngay cả với phần mềm, với các dự án Mont-Blanc, rất nhiều thư viện và công cụ khoa học đã được phát triển cho ARM, điều này đóng một vai trò quan trọng trong việc đưa toàn bộ hệ sinh thái phát triển.
Việc sử dụng ARM trong các HPC và Trung tâm dữ liệu vẫn còn nhỏ so với các hệ thống x86 nhưng Nvidia nhìn thấy tiềm năng ở đây. Đối thủ không đội trời chung của họ là AMD cũng đã bắt đầu cạnh tranh gay gắt trên thị trường HPC và Data center với bộ vi xử lý máy chủ EPYC và bộ tăng tốc GPU Radeon Instinct. Vì vậy, điều quan trọng là Nvidia phải chấp nhận ARM ngay bây giờ và cung cấp bộ phần mềm của họ (CUDA-X HPC, v.v.). Không giống như một số nhà sản xuất, Nvidia không sản xuất CPU, vì vậy họ thiếu đồng tiền CPU-GPU mà AMD và Intel có thể cung cấp.
Nhìn nhận lại, Nvidia có thể thúc đẩy quan hệ đối tác với ARM, như NextPlatform đã tuyên bố đúng “Nvidia và Arm có thể bắt tay hợp tác để cung cấp các khối IP NVLink cho những người mua giấy phép Neoverse, cho phép kết hợp chặt chẽ hơn với GPU, bao gồm nguyên tử bộ nhớ và đồng tiền bộ nhớ trên các tổ hợp tính toán CPU-GPU.”
Động thái này chắc chắn sẽ giúp ích cho trường hợp của ARM như một giải pháp thay thế kiến trúc khả thi cho các HPC x86. Chúng ta có thể mong đợi một động thái tương tự từ AMD trong tương lai khi họ tiếp tục tích cực đẩy mạnh GPU Radeon Instinct của mình.