Tại GTC Taipei 2026 trong khuôn khổ COMPUTEX, CEO NVIDIA Jensen Huang đã giới thiệu tầm nhìn về kỷ nguyên AI tác nhân với loạt công nghệ mới như Vera Rubin, Vera CPU, RTX Spark và Cosmos 3, đặt nền móng cho thế hệ AI có khả năng suy luận, hành động và tương tác với thế giới thực.
Cụ thể, tại GTC Taipei 2026, sự kiện mở màn cho tuần lễ công nghệ sôi động của Đài Loan trước thềm COMPUTEX 2026, CEO NVIDIA Jensen Huang đã trình bày một trong những tầm nhìn tham vọng nhất của ngành công nghệ trong nhiều năm qua. Nếu các kỳ GTC trước tập trung vào GPU, trung tâm dữ liệu hay mô hình AI tạo sinh, thì thông điệp xuyên suốt của năm nay là sự xuất hiện của một giai đoạn hoàn toàn mới: kỷ nguyên Agentic AI – AI tác nhân.

Theo Jensen Huang, thế giới đang bước qua giai đoạn mà AI chỉ đơn thuần trả lời câu hỏi hoặc tạo nội dung theo yêu cầu. Các hệ thống AI mới đang tiến hóa thành những “tác nhân số” có khả năng tự lập kế hoạch, suy luận nhiều bước, sử dụng công cụ, truy cập dữ liệu, viết mã nguồn và thực hiện các nhiệm vụ phức tạp với mức độ tự chủ ngày càng cao. Đây được xem là bước chuyển lớn nhất kể từ khi ChatGPT và làn sóng AI tạo sinh bùng nổ vào cuối năm 2022.
Từ AI tạo sinh đến AI có khả năng hành động
Jensen Huang cho rằng một truy vấn AI trong tương lai sẽ không còn chỉ là một lần hỏi và một lần trả lời. Thay vào đó, mỗi yêu cầu có thể kích hoạt hàng trăm hoặc hàng nghìn bước xử lý phía sau, bao gồm tìm kiếm dữ liệu, gọi API, truy xuất bộ nhớ, chạy mô hình chuyên biệt, thực hiện tính toán và phối hợp nhiều tác nhân khác nhau trước khi đưa ra kết quả cuối cùng.
Chính sự thay đổi này khiến hạ tầng AI hiện tại không còn phù hợp. Theo NVIDIA, các mô hình ngôn ngữ lớn (LLM) giờ đây chỉ là một phần của hệ thống. Giá trị thực nằm ở “harness” – lớp điều phối thông minh kết nối mô hình với công cụ, dữ liệu và khả năng thực thi trong thế giới thực. Điều này tạo ra nhu cầu khổng lồ về năng lực tính toán, băng thông bộ nhớ và kết nối giữa CPU, GPU cùng hệ thống mạng tốc độ cao.

Từ góc nhìn của NVIDIA, AI không còn là chi phí vận hành mà đang trở thành một nguồn tạo doanh thu trực tiếp cho doanh nghiệp. Jensen Huang nhiều lần nhấn mạnh thông điệp “Compute is Revenue” – năng lực tính toán chính là nền tảng tạo ra giá trị kinh tế trong thời đại AI.
Vera Rubin: Siêu hạ tầng cho các nhà máy AI thế hệ mới
Để phục vụ làn sóng Agentic AI, NVIDIA công bố Vera Rubin đã chính thức bước vào giai đoạn sản xuất quy mô lớn. Đây không chỉ là một thế hệ GPU mới mà là một nền tảng hạ tầng hoàn chỉnh dành cho các “AI Factory” – những trung tâm dữ liệu được xây dựng chuyên biệt để đào tạo và vận hành các hệ thống AI quy mô cực lớn.

Theo NVIDIA, Vera Rubin có thể cung cấp thông lượng xử lý tác nhân AI cao hơn khoảng 10 lần so với nền tảng Grace Blackwell trước đó. Hệ thống được thiết kế theo kiến trúc rack-scale, nơi toàn bộ CPU, GPU, lưu trữ, mạng và quang học được tối ưu như một siêu máy tính thống nhất thay vì những thành phần rời rạc.
Điều đáng chú ý là NVIDIA cho biết chuỗi cung ứng Vera Rubin hiện có quy mô lớn gấp đôi thế hệ Blackwell trước đây, với hàng trăm đối tác tham gia sản xuất trên toàn cầu, trong đó Đài Loan tiếp tục giữ vai trò trung tâm trong hệ sinh thái AI toàn cầu.
Vera CPU: Khi CPU được thiết kế dành riêng cho AI thay vì con người
Một trong những công bố gây bất ngờ nhất tại GTC Taipei 2026 là dòng CPU Vera. Jensen Huang cho rằng phần lớn CPU hiện nay được tạo ra để phục vụ nhu cầu của con người – những tác vụ diễn ra trong đơn vị thời gian tính bằng giây hoặc mili giây. Tuy nhiên, AI tác nhân hoạt động ở quy mô nanosecond và yêu cầu khả năng phản hồi gần như tức thời. Nếu CPU trở thành điểm nghẽn, các GPU trị giá hàng chục nghìn USD sẽ phải chờ đợi, gây lãng phí tài nguyên.

Đó là lý do NVIDIA quyết định phát triển Vera từ đầu như một kiến trúc hoàn toàn mới dành riêng cho Agentic AI. Công ty cho biết Vera sở hữu hiệu năng đơn luồng thuộc nhóm cao nhất thị trường, băng thông kết nối giữa các lõi lên tới hàng terabyte mỗi giây và hiệu quả năng lượng vượt trội so với kiến trúc x86 truyền thống. NVIDIA cũng tuyên bố Vera có thể đạt hiệu năng cao hơn khoảng 1,8 lần trong nhiều tác vụ AI tác nhân so với các CPU máy chủ hiện hành.
Động thái này cho thấy NVIDIA không còn chỉ muốn thống trị GPU mà đang từng bước mở rộng ảnh hưởng sang thị trường CPU trung tâm dữ liệu, vốn lâu nay nằm trong tay Intel và AMD.
Nemotron 3 Ultra và bộ công cụ AI doanh nghiệp
Bên cạnh phần cứng, NVIDIA tiếp tục củng cố vị thế trong lĩnh vực phần mềm AI với việc giới thiệu Nemotron 3 Ultra cùng bộ giải pháp Enterprise AI mới.
Theo hãng, Nemotron 3 Ultra là mô hình lai kết hợp giữa kiến trúc State Space Models (SSM) và Mixture of Experts (MoE), cho phép tăng đáng kể tốc độ suy luận trong khi giảm chi phí vận hành. Mục tiêu của NVIDIA là cung cấp cho doanh nghiệp một nền tảng hoàn chỉnh để xây dựng các AI Agent nội bộ mà không phải phát triển mọi thứ từ đầu.

Trong bối cảnh các doanh nghiệp toàn cầu đang chuyển từ thử nghiệm AI sang triển khai thực tế, chiến lược này giúp NVIDIA tiến gần hơn tới mục tiêu trở thành nhà cung cấp hạ tầng AI toàn diện, từ chip xử lý, mạng, lưu trữ cho tới mô hình nền tảng và công cụ phát triển.
RTX Spark: Nỗ lực tái định nghĩa PC sau nhiều thập kỷ
Một điểm nhấn khác của bài phát biểu là sự hợp tác giữa NVIDIA và Microsoft nhằm xây dựng thế hệ máy tính cá nhân mới mang tên RTX Spark.
Theo Jensen Huang, PC trong nhiều thập kỷ qua được thiết kế cho các ứng dụng truyền thống như văn phòng, giải trí hoặc truy cập Internet. Tuy nhiên, sự xuất hiện của AI tác nhân đòi hỏi một kiến trúc hoàn toàn khác, nơi hàng tỷ tham số mô hình có thể hoạt động cục bộ ngay trên thiết bị.

RTX Spark tích hợp CPU Arm tùy biến, GPU Blackwell và bộ nhớ hợp nhất dung lượng lớn trong một kiến trúc SoC duy nhất. NVIDIA cho biết nền tảng này có thể đạt hiệu năng AI lên tới 1 petaflop và hỗ trợ vận hành các tác nhân AI cục bộ 24/7 mà không phụ thuộc hoàn toàn vào điện toán đám mây.
Sự xuất hiện của RTX Spark cũng đánh dấu bước tiến mạnh mẽ nhất từ trước đến nay của NVIDIA vào thị trường PC, đặt hãng vào vị thế cạnh tranh trực tiếp với Intel, AMD, Qualcomm và thậm chí cả Apple trong cuộc đua AI PC.
Cosmos 3 và cuộc đua AI vật lý
Nếu Agentic AI là bước tiến trong không gian số thì Physical AI được xem là chương tiếp theo, nơi AI tương tác trực tiếp với thế giới vật lý.
Tại GTC Taipei 2026, NVIDIA giới thiệu Cosmos 3 – mô hình nền tảng dành cho robot và các hệ thống tự động. Không giống chatbot hay trợ lý ảo, Cosmos 3 được phát triển để hiểu môi trường xung quanh thông qua hình ảnh, cảm biến và dữ liệu không gian theo thời gian thực.

NVIDIA kỳ vọng Cosmos 3 sẽ trở thành nền móng cho thế hệ robot hình người, xe tự hành và các hệ thống tự động hóa công nghiệp trong tương lai. Đây cũng là mảnh ghép quan trọng trong chiến lược Physical AI mà Jensen Huang liên tục nhắc đến trong các bài phát biểu gần đây.
Từ GPU đến hạ tầng của nền kinh tế AI
Nhìn tổng thể, GTC Taipei 2026 cho thấy NVIDIA đang thay đổi cách định vị chính mình. Thay vì chỉ là một nhà sản xuất GPU, công ty muốn trở thành nền tảng hạ tầng cho toàn bộ nền kinh tế AI.
Từ Vera Rubin trong trung tâm dữ liệu, Vera CPU cho các tác nhân AI, Nemotron 3 Ultra cho doanh nghiệp, RTX Spark trên máy tính cá nhân đến Cosmos 3 dành cho robot, tất cả đều xoay quanh một mục tiêu duy nhất: xây dựng hệ sinh thái hoàn chỉnh cho thời đại AI tự chủ.
Nếu AI tạo sinh là chương mở đầu của cuộc cách mạng trí tuệ nhân tạo, thì những gì Jensen Huang công bố tại GTC Taipei 2026 cho thấy ngành công nghệ đang chuẩn bị bước sang chương tiếp theo – nơi AI không chỉ hiểu và tạo ra nội dung, mà còn có khả năng suy nghĩ, lập kế hoạch và hành động như những cộng sự kỹ thuật số thực thụ.

