Bộ xử lý lớn nhất từng được xây dựng với gói 1,2 nghìn tỷ bóng bán dẫn, để lại phía sau các CPU và GPU Intel và AMD hàng đầu

Một công ty đã cố gắng tạo ra con chip xử lý lớn nhất từ trước đến nay, vượt xa bất cứ thứ gì mà Intel hoặc AMD từng sản xuất. Với 1,2 nghìn tỷ bóng bán dẫn điên rồ trên tấm silicon, bộ xử lý cho đến nay là chip bán dẫn lớn nhất từng được chế tạo. Công ty đứng sau bộ vi xử lý đang có kế hoạch dành con chip này để thúc đẩy Trí tuệ nhân tạo (AI).

Cerebras Wafer Scale Engine do công ty trí tuệ nhân tạo Cerebras Systems chế tạo là chip bán dẫn lớn nhất từng được chế tạo. Bộ xử lý trung tâm hoặc CPU có 1,2 nghìn tỷ bóng bán dẫn, là các công tắc điện tử bật-tắt cơ bản và thiết yếu nhất của bất kỳ chip silicon nào. Bộ xử lý được sản xuất gần đây bởi bộ xử lý Advanced Micro Devices có 32 tỷ bóng bán dẫn. Không cần phải đề cập đến, số lượng bóng bán dẫn trên Cerebras Wafer Scale Engine vượt xa thậm chí cả CPU và GPU AMD và Intel cao cấp nhất.

Công cụ quy mô Wafer Cerebras là bộ xử lý một chip lớn nhất từng được chế tạo:

Cerebras WSE là một tấm wafer silicon khổng lồ 46.225 mm vuông chứa 400.000 lõi được tối ưu hóa bằng AI, không có bộ nhớ đệm, không có lõi tính toán và 18 gigabyte bộ nhớ SRAM cục bộ, phân tán, siêu nhanh là cấp duy nhất của bộ nhớ hệ thống cấp bậc. Trong khi đó, GPU NVIDIA lớn nhất có kích thước 815 mm vuông và có 21,1 tỷ bóng bán dẫn. Phép toán đơn giản sẽ chỉ ra Cerebras WSE lớn hơn 56,7 lần so với GPU NVIDIA cao cấp.

Băng thông bộ nhớ của Cerebras WSE là 9 petabyte mỗi giây. Nói cách khác, bộ xử lý lớn nhất thế giới tự hào có bộ nhớ trên chip, tốc độ cao gấp 3.000 lần và băng thông bộ nhớ gấp 10.000 lần. Các lõi của bộ xử lý được liên kết với nhau bằng một mạng lưới giao tiếp kết nối lưới chi tiết, tất cả phần cứng, trên chip. Do kiến trúc đơn giản hóa và kích thước khuôn lớn, kết hợp với băng thông cực cao, bộ xử lý có thể cung cấp băng thông tổng hợp là 100 petabit mỗi giây. Nói một cách đơn giản, số lượng lõi lớn của Cerebras WSE, nhiều bộ nhớ cục bộ hơn và kết cấu băng thông cao, độ trễ thấp khiến nó trở thành một bộ xử lý lý tưởng để tăng tốc đáng kể các tác vụ Trí tuệ nhân tạo.

Tại sao Intel và AMD không tạo ra những CPU và GPU khổng lồ được thiết kế riêng như vậy?

Intel, AMD và hầu hết các nhà sản xuất chip silicon khác áp dụng một cách tiếp cận hoàn toàn khác và truyền thống. Các GPU và CPU mạnh mẽ thường có trên thực tế là một tập hợp các chip được tạo ra trên đỉnh của tấm silicon 12 inch và được xử lý theo lô trong nhà máy sản xuất chip. Mặt khác, Cerebras WSE là một chip đơn được kết nối với nhau trên một tấm wafer. Nói một cách đơn giản, tất cả 1,2 nghìn tỷ bóng bán dẫn trên bộ xử lý lớn nhất đang thực sự hoạt động cùng nhau như một con chip silicon khổng lồ duy nhất.

Có một lý do khá đơn giản tại sao các công ty như Intel và AMD không đầu tư vào các tấm silicon cực lớn như vậy. Một tấm silicon duy nhất có một vài tạp chất, có thể gây ra hiệu ứng xếp tầng và cuối cùng gây ra hỏng hóc. Các nhà sản xuất chip cũng nhận thức được điều này và xây dựng bộ vi xử lý của họ cho phù hợp. Do đó, năng suất thực sự của các tấm silicon đối với các chip silicon hoạt động đáng tin cậy là khá thấp. Nói cách khác, nếu tấm silicon chỉ có một con chip duy nhất, thì khả năng bị lẫn tạp chất và hỏng hóc là khá cao.

Điều thú vị là, trong khi các công ty khác chưa tìm ra giải pháp khả thi, Cerebras đã báo cáo rằng thiết kế chip của mình trở nên thừa thãi. Nói một cách đơn giản, một tạp chất sẽ không vô hiệu hóa toàn bộ con chip, Andrew Feldman, người đồng sáng lập Cerebras Systems và là Giám đốc điều hành, lưu ý. “Được thiết kế từ đầu cho hoạt động của AI, Cerebras WSE chứa đựng những đổi mới cơ bản giúp nâng cao trình độ hiện đại bằng cách giải quyết những thách thức kỹ thuật hàng thập kỷ làm hạn chế kích thước chip - chẳng hạn như kết nối kẻ ô chéo, năng suất, phân phối điện và bao bì. Mọi quyết định về kiến trúc đều được đưa ra để tối ưu hóa hiệu suất cho công việc của AI. Kết quả là Cerebras WSE mang lại, tùy thuộc vào khối lượng công việc, hàng trăm hoặc hàng nghìn lần hiệu suất của các giải pháp hiện có ở một phần nhỏ của mức tiêu thụ điện năng và không gian ”.

Nhiệm vụ AI sẽ tiếp tục đòi hỏi chip lớn hơn:

Bộ xử lý mới được tùy chỉnh để xử lý các tác vụ AI chủ yếu vì các chip lớn hơn xử lý thông tin nhanh hơn, tạo ra câu trả lời trong thời gian ngắn hơn. Hầu hết các công ty công nghệ đều cho rằng hạn chế cơ bản của AI ngày nay là mất quá nhiều thời gian để đào tạo các mô hình. Do đó, một số nhà lãnh đạo công nghệ đang cố gắng tối ưu hóa các thuật toán AI của họ để dựa vào ít tập dữ liệu hơn. Tuy nhiên, bất kỳ AI tốt nào rõ ràng sẽ trở nên tốt hơn với các tập dữ liệu lớn hơn. Giảm thời gian đào tạo bằng cách tăng kích thước CPU là một cách để tăng cường xử lý và giảm thời gian đào tạo mà không ảnh hưởng đến chất lượng của AI.

Kết cấu giao tiếp giữa các bộ xử lý được triển khai trên Cerebras WSE cũng là một loại duy nhất. Lưới 2D có độ trễ thấp, băng thông cao liên kết tất cả 400.000 lõi trên WSE với tổng băng thông 100 petabit mỗi giây. Ngoài ra, các lõi trên bộ xử lý là Lõi đại số tuyến tính thưa thớt (SLAC), được tối ưu hóa cho các tính toán nguyên thủy của mạng nơ-ron. Cả hai khía cạnh đều đưa con chip này đi xa hơn trong các tác vụ AI. Do đó, ít có khả năng game thủ có thể mua CPU hoặc GPU mạnh nhất và mạnh nhất cho PC của họ.