Tại NVIDIA GTC 2026, NVIDIA công bố nền tảng Vera Rubin gồm bảy chip thế hệ mới nhằm xây dựng các “AI factory” quy mô lớn, phục vụ từ huấn luyện đến suy luận cho thế hệ agentic AI.
Theo đó, tại sự kiện NVIDIA GTC 2026 diễn ra tại San Jose (Mỹ), NVIDIA đã công bố nền tảng hạ tầng AI thế hệ mới mang tên Vera Rubin, đánh dấu bước tiến lớn trong cuộc đua xây dựng những “nhà máy AI” (AI factory) quy mô toàn cầu. Với bảy dòng chip mới đã chính thức bước vào giai đoạn sản xuất, nền tảng này được thiết kế nhằm mở rộng năng lực xử lý cho những hệ thống AI lớn nhất thế giới, đồng thời tối ưu hóa cho toàn bộ vòng đời của trí tuệ nhân tạo – từ huấn luyện, tinh chỉnh cho tới suy luận thời gian thực.

Theo Jensen Huang, nhà sáng lập kiêm CEO của NVIDIA, Vera Rubin là bước tiến mang tính thế hệ trong kiến trúc hạ tầng AI. Ông cho biết nền tảng này được xây dựng từ bảy con chip đột phá, triển khai trong năm loại rack hạ tầng khác nhau và kết hợp thành một siêu máy tính AI thống nhất, có khả năng phục vụ mọi giai đoạn phát triển của các mô hình trí tuệ nhân tạo hiện đại. Theo ông, thời điểm bùng nổ của agentic AI – thế hệ AI có khả năng tự hành động và thực thi nhiệm vụ phức tạp – đã chính thức bắt đầu, kéo theo nhu cầu xây dựng hạ tầng tính toán ở quy mô chưa từng có.
Trọng tâm của nền tảng Vera Rubin là sự kết hợp giữa nhiều thành phần phần cứng mới, bao gồm CPU Vera, GPU Rubin, hệ thống kết nối NVLink 6, bộ điều khiển mạng ConnectX-9 SuperNIC, bộ xử lý hạ tầng BlueField-4 DPU, switch mạng Spectrum-6 Ethernet cùng bộ xử lý suy luận Groq 3 LPU được tích hợp lần đầu. Các thành phần này được thiết kế để hoạt động như một siêu máy tính AI hoàn chỉnh, hỗ trợ toàn bộ các giai đoạn của vòng đời AI, từ huấn luyện mô hình ở quy mô cực lớn cho tới suy luận và vận hành các hệ thống AI tự động.

Một trong những điểm nhấn quan trọng của nền tảng mới là hệ thống Vera Rubin NVL72, một rack GPU tích hợp tới 72 GPU Rubin và 36 CPU Vera kết nối thông qua NVLink 6. Hệ thống này còn đi kèm với ConnectX-9 SuperNIC và BlueField-4 DPU nhằm tối ưu hóa khả năng truyền dữ liệu và xử lý mạng. NVIDIA cho biết cấu hình này có thể huấn luyện các mô hình mixture-of-experts lớn chỉ với một phần tư số GPU so với thế hệ NVIDIA Blackwell architecturetrước đó. Trong các tác vụ suy luận, hiệu suất trên mỗi watt điện năng có thể tăng tới 10 lần, đồng thời giảm đáng kể chi phí xử lý cho mỗi token.

Song song với hệ thống GPU, NVIDIA cũng giới thiệu rack Vera CPU được thiết kế để phục vụ các môi trường kiểm thử và mô phỏng trong quá trình huấn luyện AI. Những khối CPU này đặc biệt quan trọng trong các tác vụ học tăng cường và agentic AI, nơi mô hình phải liên tục thử nghiệm, đánh giá và tối ưu chiến lược trong hàng triệu môi trường mô phỏng khác nhau. Mỗi rack CPU có thể tích hợp tới 256 bộ xử lý Vera và được làm mát bằng chất lỏng, cung cấp hiệu năng đơn luồng cao cùng khả năng mở rộng lớn. Theo NVIDIA, hệ thống này có thể mang lại hiệu quả gấp đôi và tốc độ nhanh hơn khoảng 50% so với các nền tảng CPU truyền thống.
Một thành phần đáng chú ý khác trong hệ sinh thái Vera Rubin là rack Groq 3 LPX, được thiết kế dành riêng cho các tác vụ suy luận AI có độ trễ thấp và yêu cầu ngữ cảnh rất lớn. Hệ thống LPX tích hợp 256 bộ xử lý LPU, mỗi bộ có 128GB SRAM trên chip và băng thông mở rộng lên tới 640TB/s. Khi kết hợp với các GPU Rubin trong cùng hệ thống, LPX có thể tăng tốc quá trình giải mã của mô hình AI bằng cách xử lý đồng thời từng lớp mạng nơ-ron cho mỗi token đầu ra. NVIDIA cho biết cách tiếp cận này có thể mang lại hiệu suất suy luận cao hơn tới 35 lần trên mỗi megawatt điện năng, đồng thời mở ra cơ hội thương mại lớn hơn cho các mô hình AI quy mô hàng nghìn tỷ tham số.

Ngoài khả năng tính toán, NVIDIA cũng chú trọng vào hệ thống lưu trữ và mạng kết nối trong các nhà máy AI. Rack lưu trữ BlueField-4 STX được thiết kế như một tầng bộ nhớ ngữ cảnh chuyên dụng cho các mô hình ngôn ngữ lớn và hệ thống AI agent. Hệ thống này cho phép lưu trữ và truy xuất dữ liệu key-value cache ở quy mô lớn, giúp tăng tốc quá trình suy luận và cải thiện hiệu suất năng lượng. Theo NVIDIA, nhờ framework DOCA Memos mới, hiệu suất suy luận có thể tăng tới năm lần so với kiến trúc lưu trữ truyền thống.
Trong khi đó, rack mạng Spectrum-6 SPX Ethernet được phát triển để tối ưu hóa luồng dữ liệu giữa các rack trong nhà máy AI. Hệ thống này có thể hoạt động với cả Ethernet Spectrum-X hoặc InfiniBand Quantum-X800, cung cấp kết nối độ trễ thấp và băng thông cao giữa hàng nghìn GPU. Công nghệ quang học tích hợp mới cũng giúp tăng hiệu quả năng lượng lên tới năm lần so với các module quang truyền thống.

Bên cạnh phần cứng, NVIDIA còn công bố nền tảng hạ tầng DSX dành cho Vera Rubin, được phát triển cùng hơn 200 đối tác trong ngành trung tâm dữ liệu. DSX Max-Q cho phép phân bổ năng lượng linh hoạt trên toàn bộ nhà máy AI, giúp triển khai thêm khoảng 30% hạ tầng trong cùng giới hạn công suất điện. Trong khi đó, phần mềm DSX Flex giúp các trung tâm dữ liệu trở thành tài sản linh hoạt đối với lưới điện, có khả năng tận dụng tới 100 gigawatt nguồn điện chưa được khai thác.
NVIDIA cũng công bố thiết kế tham chiếu Vera Rubin DSX AI Factory, một bản blueprint cho các trung tâm dữ liệu AI thế hệ mới. Thiết kế này tích hợp chặt chẽ giữa tính toán, mạng, lưu trữ, năng lượng và hệ thống làm mát nhằm tối đa hóa hiệu suất trên mỗi watt và đảm bảo độ ổn định khi vận hành liên tục với tải công việc cực lớn.
Hệ sinh thái Vera Rubin dự kiến sẽ nhận được sự hỗ trợ rộng rãi từ các nhà cung cấp hạ tầng và dịch vụ đám mây lớn. Các nền tảng cloud như Amazon Web Services, Google Cloud, Microsoft Azure và Oracle Cloud Infrastructure dự kiến sẽ triển khai các hệ thống dựa trên Vera Rubin từ nửa cuối năm nay. Ngoài ra, nhiều đối tác điện toán đám mây chuyên về AI như CoreWeave, Lambda, Nebius và Together AI cũng sẽ tham gia vào hệ sinh thái.

Về phía các nhà sản xuất phần cứng, những hãng như Cisco, Dell Technologies, Hewlett Packard Enterprise, Lenovovà Supermicro được kỳ vọng sẽ tung ra nhiều dòng máy chủ mới dựa trên nền tảng Vera Rubin. Các hãng ODM lớn của châu Á như ASUS, Foxconn, GIGABYTE, Inventec, Pegatron và Quanta Cloud Technology cũng sẽ tham gia sản xuất hệ thống dựa trên kiến trúc mới này.
Nhiều phòng thí nghiệm AI và nhà phát triển mô hình tiên tiến như Anthropic, Meta, Mistral AI và OpenAI đã bày tỏ kế hoạch sử dụng nền tảng Vera Rubin để huấn luyện các mô hình lớn hơn, đồng thời triển khai những hệ thống AI đa phương thức với ngữ cảnh dài hơn, độ trễ thấp hơn và chi phí vận hành hiệu quả hơn so với các thế hệ GPU trước.
Sự ra mắt của Vera Rubin cho thấy cuộc đua xây dựng hạ tầng AI toàn cầu đang bước sang một giai đoạn mới, nơi các trung tâm dữ liệu không còn chỉ là nơi đặt máy chủ mà trở thành những “nhà máy AI” khổng lồ, được tối ưu hóa từ kiến trúc chip cho tới hệ thống năng lượng để phục vụ cho thế hệ trí tuệ nhân tạo tiếp theo.

