Tại NVIDIA GTC 2026, CEO Jensen Huang đã phác họa tương lai nơi AI agent, robot và các nhà máy “AI factory” trở thành nền tảng của nền kinh tế trí tuệ nhân tạo.

Theo đó, tại bài phát biểu quan trọng mở màn sự kiện GTC 2026, CEO Jensen Huang của NVIDIA đã trình bày một tầm nhìn rộng lớn về tương lai của trí tuệ nhân tạo, nơi AI không còn chỉ là các mô hình phần mềm chạy trong trung tâm dữ liệu mà đang trở thành nền tảng cho một thế hệ hạ tầng máy tính hoàn toàn mới.

GTC 2026: NVIDIA mở rộng tham vọng từ chip AI đến hạ tầng cho kỷ nguyên robot và AI agent.

Trong nhiều năm qua, sự phát triển của AI chủ yếu xoay quanh giai đoạn training (huấn luyện mô hình) – quá trình sử dụng khối lượng dữ liệu khổng lồ để dạy cho hệ thống AI học cách nhận diện hình ảnh, hiểu ngôn ngữ hoặc dự đoán kết quả. Tuy nhiên, theo ông Jensen Huang, ngành công nghiệp hiện đang bước vào một giai đoạn mới, nơi trọng tâm chuyển sang inference (giai đoạn AI tạo ra kết quả khi được sử dụng).

Nếu training giống như quá trình đào tạo một chuyên gia, thì inference chính là lúc chuyên gia đó bắt đầu làm việc. Trong thực tế, khi hàng triệu hoặc hàng tỷ người dùng tương tác với các hệ thống AI mỗi ngày, khối lượng inference cần xử lý có thể lớn hơn rất nhiều so với giai đoạn training ban đầu.

Quan trọng hơn, các mô hình AI hiện nay đang tiến tới khả năng reasoning (suy luận nhiều bước). Thay vì chỉ đưa ra câu trả lời trực tiếp, AI có thể phân tích vấn đề, chia nhỏ thành nhiều bước trung gian, kiểm tra giả thuyết và tự điều chỉnh kết quả trước khi đưa ra đáp án cuối cùng. Điều này khiến nhu cầu tính toán tăng lên đáng kể, bởi mỗi câu hỏi có thể kích hoạt hàng loạt phép xử lý phức tạp phía sau.

Theo NVIDIA, chính sự kết hợp giữa inference và reasoning đang tạo ra một làn sóng nhu cầu tính toán chưa từng có trong ngành công nghệ. Để đáp ứng nhu cầu đó, công ty tiếp tục mở rộng dòng GPU dành cho trung tâm dữ liệu với các kiến trúc mới như NVIDIA Blackwell và thế hệ tiếp theo NVIDIA Rubin.

Các nền tảng này được thiết kế không chỉ để tăng tốc huấn luyện AI mà còn tối ưu hóa cho inference ở quy mô cực lớn. Theo NVIDIA, trong tương lai gần, phần lớn khối lượng tính toán AI trên thế giới sẽ nằm ở giai đoạn inference, nơi các hệ thống phải xử lý liên tục hàng tỷ yêu cầu từ người dùng và doanh nghiệp.

Song song với phần cứng, NVIDIA cũng thúc đẩy một khái niệm mới được gọi là AI Factory (nhà máy trí tuệ nhân tạo). Theo Jensen Huang, trung tâm dữ liệu trong kỷ nguyên AI sẽ hoạt động giống như các nhà máy sản xuất. Nếu các nhà máy truyền thống sản xuất hàng hóa vật lý, thì AI Factory sẽ “sản xuất” token AI – những đơn vị dữ liệu cơ bản mà mô hình AI xử lý để tạo ra văn bản, hình ảnh, video hoặc các dạng nội dung số khác.

Trong mô hình này, doanh nghiệp không chỉ lưu trữ dữ liệu mà còn vận hành các dây chuyền tính toán quy mô lớn để biến dữ liệu thành trí tuệ nhân tạo. Điều này có thể tạo ra một nền kinh tế mới xoay quanh việc sản xuất và phân phối năng lực AI.

Một xu hướng quan trọng khác được NVIDIA nhấn mạnh tại GTC năm nay là sự nổi lên của AI agent (tác nhân AI). Đây là các hệ thống trí tuệ nhân tạo có khả năng tự động thực hiện nhiệm vụ thay cho con người, chẳng hạn như tìm kiếm thông tin, lập kế hoạch công việc, phân tích dữ liệu hoặc điều phối các hệ thống phần mềm khác.

Khác với chatbot truyền thống chỉ trả lời câu hỏi, AI agent có thể thực hiện nhiều bước xử lý liên tiếp để hoàn thành một nhiệm vụ phức tạp. Chẳng hạn, một AI agent có thể phân tích yêu cầu của người dùng, truy cập cơ sở dữ liệu, gọi các dịch vụ phần mềm khác nhau và cuối cùng đưa ra kết quả hoàn chỉnh.

Để hỗ trợ xu hướng này, NVIDIA giới thiệu nền tảng mã nguồn mở NemoClaw (bản triển khai tham chiếu dựa trên OpenClaw). Nền tảng này cho phép các nhà phát triển xây dựng và triển khai các hệ thống AI agent trong môi trường doanh nghiệp, nơi các tác nhân AI có thể truy cập dữ liệu nội bộ, sử dụng công cụ phần mềm và tự động thực hiện các quy trình công việc.

Để hỗ trợ xu hướng này, NVIDIA giới thiệu nền tảng mã nguồn mở OpenClaw. Nền tảng này cho phép các nhà phát triển xây dựng và triển khai các hệ thống AI agent trong môi trường doanh nghiệp, nơi các tác nhân AI có thể truy cập dữ liệu nội bộ, sử dụng công cụ phần mềm và tự động thực hiện các quy trình công việc.

Theo Jensen Huang, trong tương lai, mỗi doanh nghiệp có thể vận hành hàng nghìn hoặc thậm chí hàng triệu AI agent hoạt động song song, tương tự như cách các công ty ngày nay vận hành hàng nghìn máy chủ trong trung tâm dữ liệu.

Không dừng lại ở AI phần mềm, NVIDIA cũng dành một phần đáng kể keynote để nói về Physical AI (AI vật lý) – lĩnh vực kết hợp trí tuệ nhân tạo với robot và các hệ thống tự động trong thế giới thực.

Theo ông Jenshen Huang, thách thức lớn nhất của robot là môi trường thực tế cực kỳ đa dạng và khó dự đoán. Không giống như môi trường số, thế giới vật lý luôn tồn tại vô số tình huống bất ngờ, từ điều kiện ánh sáng thay đổi cho đến các vật thể di chuyển không theo quy luật.

Dữ liệu thu thập từ thế giới thực vì vậy thường không đủ để huấn luyện robot xử lý mọi tình huống. Để giải quyết vấn đề này, NVIDIA đang phát triển các nền tảng mô phỏng có khả năng tạo ra lượng dữ liệu tổng hợp khổng lồ cho robot học hỏi.

Các công cụ như NVIDIA Isaac Lab cho phép các nhà phát triển xây dựng môi trường mô phỏng chi tiết để huấn luyện robot trong không gian ảo. Trong khi đó, NVIDIA Omniverse đóng vai trò là nền tảng mô phỏng quy mô lớn, nơi các nhà phát triển có thể tạo ra “bản sao số” của nhà máy, thành phố hoặc hệ thống sản xuất.

Kết hợp với các mô hình thế giới (world models) và dữ liệu video quy mô Internet, robot có thể được huấn luyện trong hàng triệu kịch bản khác nhau trước khi hoạt động ngoài đời thật.

Một điểm thú vị khác của keynote là sự hợp tác giữa NVIDIA và Disney Research trong việc phát triển robot nhân vật cho các công viên giải trí trong tương lai. Những robot này có thể di chuyển tự nhiên, tương tác với con người và thích nghi với môi trường thực tế nhờ các mô hình AI và mô phỏng vật lý.

Nhìn tổng thể, GTC 2026 cho thấy NVIDIA đang theo đuổi một chiến lược rộng lớn hơn nhiều so với việc sản xuất GPU. Công ty đang xây dựng một hệ sinh thái toàn diện cho kỷ nguyên AI, bao gồm phần cứng tính toán, nền tảng phần mềm, hệ thống mô phỏng và các công cụ phát triển robot.

Thông điệp của Jensen Huang khá rõ ràng rằng, AI đang bước sang một giai đoạn mới, nơi trí tuệ nhân tạo không chỉ tồn tại trong các trung tâm dữ liệu mà sẽ dần hiện diện trong mọi lĩnh vực của thế giới vật lý – từ robot công nghiệp, xe tự hành cho đến các hệ thống tự động trong nhà máy và thành phố.

NVIDIA ra mắt Space-1 Vera Rubin Module - giải pháp máy tính AI chuyên dụng được thiết kế để đưa sức mạnh của các trung tâm dữ liệu vào quỹ đạo Trái Đất. — NVIDIA ra mắt Space-1 Vera Rubin Module – giải pháp máy tính AI chuyên dụng được thiết kế để đưa sức mạnh của các trung tâm dữ liệu vào quỹ đạo Trái Đất.

Trong bối cảnh đó, NVIDIA không chỉ muốn trở thành nhà cung cấp chip AI, mà còn hướng tới việc xây dựng hạ tầng công nghệ cho toàn bộ nền kinh tế AI đang hình thành.

Đăng ký bản tin

GTC 2026: NVIDIA mở rộng tham vọng từ chip AI đến hạ tầng cho kỷ nguyên robot và AI agent

Tại NVIDIA GTC 2026, CEO Jensen Huang đã phác họa tương lai nơi AI agent, robot và các nhà máy “AI factory” trở thành nền tảng của nền kinh tế trí tuệ nhân tạo.

Bài viết liên quan