Nvidia, nhà sản xuất bộ xử lý đồ họa (GPU) hàng đầu, đã tiết lộ thông tin chi tiết về chip hiệu suất cao mới nhất dành cho công việc AI, HGX H200. GPU mới này được xây dựng dựa trên sự thành công của người tiền nhiệm H100, giới thiệu những nâng cấp đáng kể về băng thông và dung lượng bộ nhớ để nâng cao khả năng xử lý công việc AI chuyên sâu.
Sự khác biệt giữa HGX H200 và H100 là gì?
HGX H200 có băng thông bộ nhớ gấp 1,4 lần và dung lượng bộ nhớ lớn hơn 1,8 lần so với H100, khiến nó trở thành một tiến bộ đáng chú ý trong bối cảnh điện toán AI. Cải tiến quan trọng nằm ở việc áp dụng thông số bộ nhớ mới, nhanh hơn có tên HBM3e, nâng băng thông bộ nhớ của GPU lên mức ấn tượng 4,8 terabyte mỗi giây và tăng tổng dung lượng bộ nhớ lên 141GB.
Việc giới thiệu Bộ nhớ băng thông cao (HBM) nhanh hơn và rộng hơn nhằm mục đích tăng tốc hiệu suất trên các tác vụ đòi hỏi tính toán, đặc biệt mang lại lợi ích cho các mô hình AI tổng quát và các ứng dụng điện toán hiệu năng cao. Ian Buck, Phó chủ tịch phụ trách sản phẩm điện toán hiệu năng cao của Nvidia, đã nêu bật những tiến bộ này trong một bài thuyết trình video.

Bất chấp những bước tiến về mặt công nghệ, câu hỏi đặt ra vẫn xoay quanh sự sẵn có của các loại chip mới. Nvidia thừa nhận những hạn chế về nguồn cung mà người tiền nhiệm H100 phải đối mặt và đặt mục tiêu phát hành chip H200 đầu tiên vào quý 2 năm 2024. Nvidia đang hợp tác với các nhà sản xuất hệ thống toàn cầu và nhà cung cấp dịch vụ đám mây để đảm bảo tính khả dụng nhưng số lượng sản xuất cụ thể vẫn chưa được tiết lộ.
H200 duy trì khả năng tương thích với các hệ thống hỗ trợ H100, mang đến sự chuyển đổi liền mạch cho các nhà cung cấp đám mây. Những công ty lớn như Amazon, Google, Microsoft và Oracle nằm trong số những công ty đầu tiên tích hợp GPU mới vào sản phẩm của họ trong năm tới.
Trong khi Nvidia từ chối tiết lộ giá của H200, thì người tiền nhiệm của nó, H100, được ước tính dao động từ 25.000 đến 40.000 USD mỗi chiếc. Nhu cầu về những con chip hiệu suất cao này vẫn rất lớn, trong đó các công ty AI đang tích cực tìm kiếm chúng để xử lý dữ liệu hiệu quả trong việc đào tạo các công cụ hình ảnh tổng hợp và mô hình ngôn ngữ lớn.
Việc ra mắt H200 phù hợp với những nỗ lực của Nvidia nhằm đáp ứng nhu cầu ngày càng tăng về GPU của hãng. Công ty có kế hoạch tăng gấp ba lần sản lượng H100 vào năm 2024, nhằm sản xuất tới 2 triệu chiếc, như đã báo cáo vào tháng 8. Khi bối cảnh AI tiếp tục phát triển, việc giới thiệu H200 hứa hẹn sẽ nâng cao khả năng, tạo tiền đề cho một năm đầy hứa hẹn hơn cho những người đam mê GPU cũng như các nhà phát triển AI.
Bạn có thể xem thông báo của Nvidia:


