Bức tranh lớn: Chiến lược mới của Nvidia tập trung vào AI tổng quát, mô hình ngôn ngữ lớn và hệ thống đề xuất, và siêu máy tính DGX mới nhất của hãng cũng vậy. Công ty tin rằng những thứ này sẽ sớm tạo thành “động cơ kỹ thuật số của nền kinh tế hiện đại” khi các công ty như Meta, Google và Microsoft đang chạy đua để nhận ra lợi ích của AI bằng cách sử dụng kiến trúc phần cứng Grace, Hopper và Ada Lovelace của Nvidia.
Hiện tại, không có gì bí mật khi Nvidia đã dốc toàn lực vào ý tưởng bán xẻng cho các công ty lớn và nhỏ đang đào bới một cách điên cuồng trên vùng đất của những AI sáng tạo để tìm kiếm kho báu kỹ thuật số. Công ty có vị trí thuận lợi để tận dụng xu hướng này và rất có thể trở thành nhà sản xuất chip đầu tiên được định giá 1 nghìn tỷ USD – cao hơn gấp đôi so với TSMC, công ty sản xuất hơn một nửa số chip tiên tiến nhất thế giới.
Các thông báo của Nvidia tại Computex 2023 phản ánh rất rõ chiến lược mới này. Giám đốc điều hành Nvidia Jensen Huang đã tiết lộ siêu chip Grace Hopper GH200 của công ty hiện đang được sản xuất đầy đủ, làm nổi bật tiềm năng của chúng trong việc tăng tốc các dịch vụ và phần mềm điện toán cho các mô hình kinh doanh mới và tối ưu hóa các mô hình hiện có.

Huang cho biết ngành công nghệ đã va phải bức tường cứng với kiến trúc truyền thống trong những năm gần đây, đó là lý do tại sao nó ngày càng chuyển sang sử dụng GPU và tăng tốc điện toán để giải quyết các tác vụ điện toán phức tạp. Để đáp ứng nhu cầu tăng cao này, Nvidia đã phát triển nền tảng siêu máy tính DGX GH200 mới chứa 256 siêu chip Grace Hopper GH200.
Mỗi đơn vị Grace Hopper kết hợp một CPU Grace và một GPU H100 Tensor Core, và hệ thống DGX GH200 được cho là có thể cung cấp một exaflop hiệu năng tính toán cũng như băng thông bộ nhớ gấp mười lần so với thế hệ trước. Để tham khảo, máy tính exascale đầu tiên là siêu máy tính Frontier tại Phòng thí nghiệm quốc gia Oak Ridge ở Tennessee, có thể đạt 1,2 exaflop trong bài kiểm tra Linmark năm ngoái, lấy đi vương miện từ hệ thống Fugaku của Nhật Bản.
DGX GH200 cũng được trang bị bộ nhớ dùng chung 144 terabyte – gấp 500 lần so với hệ thống DGX A100 mà nó sẽ thay thế. Điều này sẽ cho phép các công ty dễ dàng xây dựng và chạy các mô hình AI tổng quát giống như mô hình đằng sau ChatGPT. Nvidia cho biết Microsoft, Google Cloud và Meta là một trong những khách hàng đầu tiên của siêu máy tính mới, trong khi SoftBank của Nhật Bản đang tìm cách đưa siêu chip GH 200 đến các trung tâm dữ liệu trên khắp quốc gia châu Á.

Nvidia cũng sẽ sử dụng bốn hệ thống DGX GH200 được liên kết bằng mạng Quantum-2 InfiniBand với băng thông lên tới 400 Gb mỗi giây để tạo ra siêu máy tính AI của riêng mình có tên là Helios. Một cách riêng biệt, công ty sẽ giới thiệu hơn 400 cấu hình hệ thống khác nhau sắp ra mắt thị trường trong những tháng tới tích hợp kiến trúc Hopper, Grace và Ada Lovelace cho nhiều ứng dụng điện toán hiệu năng cao.
Khi đứng cạnh một hình ảnh minh họa kích thước thật của hệ thống DGX GH200 trên sân khấu, Huang đã mô tả nó là “bốn con voi, một GPU”, vì bất kỳ thiết bị GH200 nào cũng có quyền truy cập vào toàn bộ nhóm bộ nhớ 144 terabyte. Anh ấy cũng cố gắng làm hài lòng khán giả bằng cách lưu ý rằng anh ấy tự hỏi liệu hệ thống mới này có thể chạy Crysis hay không. Với thực tế là những người đam mê đã có thể chạy tựa game nổi tiếng ngay từ VRAM của GeForce RTX 3090, bạn có thể chạy hàng nghìn phiên bản đồng thời bằng cách sử dụng một con quái vật như DGX GH200.

Có một điều chắc chắn: Nvidia gần như tập trung tối đa vào việc tận dụng sự bùng nổ chip AI vì thúc đẩy những tiến bộ trong lĩnh vực này là thứ mang lại hơn một nửa doanh thu cho hãng. Siêu máy tính DGX mới là một nỗ lực khác để giữ cho ngành công nghiệp này gắn bó với các sản phẩm của Nvidia. Cho dù một công ty muốn cung cấp năng lượng cho mạng 5G, dịch vụ AI tổng hợp, robot nhà máy, trải nghiệm thực tế ảo và tăng cường hay công cụ quảng cáo, thì Nvidia đều muốn trở thành nhà cung cấp lý tưởng cho tất cả các doanh nghiệp muốn sử dụng điện toán tăng tốc.
Các game thủ vẫn nằm trong tầm ngắm của công ty, mặc dù nhiều hơn thông qua lăng kính của những gì AI có thể làm để nâng cao trải nghiệm chơi trò chơi. Chẳng hạn, Avatar Cloud Engine dành cho Trò chơi mới được công bố của Nvidia sẽ cho phép các nhà phát triển cải thiện tương tác với các nhân vật không thể chơi được bằng cách liên kết chúng với một mô hình ngôn ngữ lớn. Công ty sẽ không cho biết các yêu cầu hệ thống sẽ như thế nào đối với công nghệ mới này, nhưng chúng ta biết rằng bộ phận nghiên cứu của Nvidia đang bận rộn khám phá các cách để tối ưu hóa nội dung trò chơi trong các trò chơi sử dụng AI trong tương lai.

