Bức tranh lớn: Một trong những người hưởng lợi không thể tranh cãi nhất của hiện tượng AI tổng hợp là GPU, một con chip lần đầu tiên ghi dấu ấn với vai trò là bộ tăng tốc đồ họa để chơi game. Khi điều đó xảy ra, GPU đã được chứng minh là rất thành thạo trong việc hỗ trợ và tăng cường quá trình đào tạo các mô hình nền tảng lớn cũng như thực hiện khối lượng công việc suy luận AI.
Cho đến thời điểm hiện tại, người chiến thắng lớn trong trò chơi GPU AI tổng hợp là Nvidia, nhờ sự kết hợp giữa phần cứng mạnh mẽ và cơ sở lớn các công cụ phần mềm CUDA được cài đặt sẵn. Tuy nhiên, tại một sự kiện ở San Francisco tuần này, AMD đi ra với phần cứng GPU và CPU mới cũng như các bản cập nhật và quan hệ đối tác phần mềm mới quan trọng. Cùng với nhau, AMD tin rằng những phát triển này sẽ cho phép hãng giành được thị phần lớn hơn trong thị trường máy gia tốc AI của trung tâm dữ liệu mà hãng dự đoán sẽ đạt 150 tỷ USD vào năm 2027.
AMD đã giới thiệu chip Instinct MI300X mới như một bộ tăng tốc AI tổng hợp chuyên dụng. Nó tận dụng thiết kế chiplet cơ bản giống như Instinct MI300A đã được công bố trước đó (mà AMD hiện đang lấy mẫu), nhưng MI300X thay thế 24 lõi CPU Zen 4 trong MI300A bằng các lõi GPU CDNA3 bổ sung và Bộ nhớ băng thông cao (HBM).

Thật vậy, con chip mới này – với tổng số 153 tỷ bóng bán dẫn – có 192 GB HBM và cung cấp băng thông bộ nhớ 5,2 TB/giây. Những con số này thể hiện dung lượng bộ nhớ tăng 2,4 lần và thông lượng tăng 1,6 lần so với bộ tăng tốc H100 hiện tại của Nvidia. Mặc dù những con số này có thể áp đảo đối với hầu hết các ứng dụng, nhưng các mô hình ngôn ngữ lớn (LLM) chạy hiệu quả nhất trong bộ nhớ, cho thấy điều này sẽ chuyển thành hiệu suất trong thế giới thực vững chắc khi chip bắt đầu lấy mẫu vào quý ba năm nay.
Về mặt phần mềm, AMD đã đưa ra một số thông báo quan trọng. Đầu tiên, công ty đã trình bày chi tiết phiên bản mới nhất của nền tảng ROCm dành cho phát triển phần mềm AI, ROCm 5. Phiên bản này bao gồm các thư viện cấp thấp, trình biên dịch, công cụ phát triển và thời gian chạy cho phép khối lượng công việc liên quan đến AI chạy tự nhiên trên dòng bộ tăng tốc GPU Instinct của AMD . Đây là nền tảng cho các khung phát triển AI như PyTorch, TensorFlow và ONNX. Hơn nữa, một quan hệ đối tác mới với Quỹ PyTorch đã xuất hiện tại sự kiện của AMD. Từ PyTorch 2.0 trở đi, mọi mô hình hoặc ứng dụng AI được phát triển bằng PyTorch sẽ chạy tự nhiên trên bộ tăng tốc AMD Instinct đã được nâng cấp để hỗ trợ ROCm 5.4.2.
Sự phát triển này rất quan trọng vì nhiều mô hình AI được xây dựng bằng PyTorch và cho đến khi có thông báo này, hầu hết chỉ có thể chạy trên GPU của Nvidia. Giờ đây, các nhà phát triển và nhà cung cấp điện toán đám mây lớn có thể chọn sử dụng trực tiếp bộ tăng tốc AMD Instinct hoặc thay thế bộ tăng tốc Nvidia bằng bộ tăng tốc AMD.
Một thông báo phần mềm lớn khác liên quan đến Hugging Face, đã nhanh chóng trở thành trang web truy cập cho các mô hình AI nguồn mở. Là một phần trong quan hệ đối tác mới của họ, Hugging Face sẽ hợp tác với AMD để đảm bảo khả năng tương thích của các mô hình nguồn mở hiện có và mới được đăng trên trang web của mình với các máy gia tốc Bản năng. Họ cũng có kế hoạch nghiên cứu khả năng tương thích giữa các bộ xử lý AMD khác, bao gồm CPU Epyc và Ryzen, GPU Radeon, DPU Alveo và FPGA Versal (hoặc bộ xử lý thích ứng, như AMD đề cập đến). Điều này sẽ giúp định vị AMD như một giải pháp thay thế khả thi cho Nvidia trong một số môi trường trung tâm dữ liệu AI.

Về mặt CPU trung tâm dữ liệu, AMD đã công bố phiên bản “Bergamo” và “Genoa X” mới của họ Epyc thế hệ thứ tư bộ xử lý và gợi ý về một phiên bản khác có tên “Sienna” sẽ được công bố vào cuối năm nay. Bergamo được tối ưu hóa cho khối lượng công việc điện toán đám mây, có lõi Zen4c mới nhỏ hơn và chứa nhiều lõi nhỏ hơn này trên chip (tối đa 128). Kiến trúc tinh chỉnh tạo điều kiện thuận lợi cho các hoạt động chẳng hạn như chạy đồng thời nhiều vùng chứa hơn, dẫn đến điểm chuẩn ấn tượng mà các đối tác bao gồm AWS, Azure và Meta rất muốn thảo luận.
Mẫu Genoa X kết hợp công nghệ 3D V-Cache của AMD, lần đầu tiên được giới thiệu với dòng “Milan” thế hệ thứ ba của họ, với thiết kế CPU Genoa thế hệ thứ tư. Nó được tối ưu hóa cho các khối lượng công việc kỹ thuật và điện toán hiệu năng cao (HPC) đòi hỏi bộ nhớ đệm lưu trữ sẵn nhiều hơn và nhanh hơn.

Những phát triển CPU này, cũng như các biến thể trên bộ tăng tốc Instinct MI300, phản ánh sự đa dạng ngày càng tăng của AMD về thiết kế được tối ưu hóa cho các ứng dụng cụ thể. Tất cả những thứ này có thể tận dụng các công nghệ chính của AMD, bao gồm thiết kế dựa trên chiplet và công nghệ kết nối Infinity Fabric. Đó là một ví dụ điển hình về cách các thiết kế hướng tới tương lai có thể ảnh hưởng đáng kể đến các chiến lược tổng thể.
AMD cũng đã tiết lộ Nền tảng bản năng tại sự kiện của họ, giống như sản phẩm tương tự của Nvidia, tích hợp tám bộ tăng tốc dựa trên GPU của AMD (MI300X) vào một thiết kế phần cứng nhỏ gọn duy nhất.

Rõ ràng, Nvidia vẫn duy trì vị trí dẫn đầu đáng kể trong đào tạo AI tổng quát và giữ vị trí vững chắc trong lĩnh vực suy luận. Tuy nhiên, một khi các đối tác phần mềm và máy gia tốc mới này bắt đầu ảnh hưởng đến thị trường, chúng có thể tạo ra sự khác biệt đáng chú ý cho AMD. Trong khi nhiều công ty đánh giá cao những gì Nvidia đã đạt được đối với trí tuệ nhân tạo AI, thì không ai thích một thị trường bị thống trị bởi một thực thể duy nhất. Do đó, một số công ty có thể sẽ hoan nghênh sự xuất hiện của AMD như một giải pháp thay thế mạnh mẽ trong lĩnh vực này.
Về mặt CPU trung tâm dữ liệu, AMD đã tự khẳng định mình là một giải pháp thay thế vững chắc cho Intel. Không khó để hình dung công ty đang phát triển một hồ sơ tương tự trong các máy gia tốc AI của trung tâm dữ liệu. Mặc dù cuộc hành trình sẽ không dễ dàng, nhưng nó chắc chắn sẽ khiến mọi thứ trở nên thú vị hơn.


