Tại sự kiện GTC 2026, NVIDIA giới thiệu một bước tiến mới trong mô hình máy tính cá nhân: những thiết bị có khả năng chạy AI agent ngay trên máy cục bộ, thay vì phụ thuộc vào điện toán đám mây.
Các hệ thống như NVIDIA DGX Spark – một “siêu máy tính AI để bàn” – hay các PC trang bị GPU NVIDIA RTXđược thiết kế để vận hành các trợ lý AI cá nhân. Những AI agent này có thể xử lý dữ liệu riêng của người dùng, hoạt động hoàn toàn offline và không phát sinh chi phí token như khi chạy trên cloud.

Một trong những ví dụ tiêu biểu của xu hướng này là OpenClaw, nền tảng agent AI mã nguồn mở cho phép xây dựng trợ lý tự động hóa các công việc cá nhân như truy cập file, ứng dụng hay quy trình làm việc hàng ngày.
Loạt mô hình AI mở mới dành cho agent chạy cục bộ
Tại GTC năm nay, NVIDIA công bố nhiều mô hình AI mở nhằm giúp các agent hoạt động hiệu quả ngay trên máy tính cá nhân.
Đáng chú ý nhất là dòng NVIDIA Nemotron 3, gồm các biến thể:
- Nemotron 3 Super 120B: mô hình 120 tỷ tham số với khoảng 12 tỷ tham số hoạt động, hướng tới việc vận hành các hệ thống agent phức tạp.
- Nemotron 3 Nano 4B: phiên bản nhỏ gọn phù hợp cho PC cá nhân hoặc laptop RTX.

Các mô hình này có thể chạy trực tiếp trên DGX Spark hoặc các workstation GPU RTX chuyên nghiệp.
Theo NVIDIA, Nemotron 3 Super đạt 85,6% điểm trên benchmark PinchBench, một bộ đo mới đánh giá khả năng vận hành agent theo mô hình OpenClaw.

Bên cạnh đó, NVIDIA cũng hỗ trợ tối ưu cho một số mô hình AI phổ biến khác như:
- Mistral Small 4 – mô hình khoảng 119 tỷ tham số, phù hợp cho chat, lập trình và các tác vụ agent.
- Qwen 3.5 của Alibaba, có khả năng xử lý đa phương thức (bao gồm hình ảnh) và cửa sổ ngữ cảnh lên đến 262.000 token.
Các model này có thể được thử nghiệm ngay thông qua các công cụ như Ollama, LM Studio hoặc llama.cpp, với khả năng suy luận tăng tốc nhờ GPU RTX.
Thúc đẩy sáng tạo nội dung AI với các mô hình tối ưu cho RTX
Ngoài AI agent, NVIDIA cũng công bố các mô hình AI sáng tạo nội dung được tối ưu cho GPU RTX.
Ví dụ, mô hình video – âm thanh LTX 2.3 của công ty Lightricks nay hỗ trợ định dạng NVFP4 và FP8, giúp tăng hiệu năng xử lý tới 2,1 lần.
Trong lĩnh vực chỉnh sửa hình ảnh, FLUX.2 Klein 9B của Black Forest Labs cũng được tối ưu với phiên bản FP8, giúp tăng tốc độ xử lý ảnh lên đến gấp đôi trên GPU RTX.

NemoClaw: nền tảng tối ưu OpenClaw cho thiết bị NVIDIA
Để hỗ trợ việc chạy agent AI ngay trên máy, NVIDIA giới thiệu NVIDIA NemoClaw, một bộ công cụ mã nguồn mở tối ưu hóa nền tảng OpenClaw cho phần cứng NVIDIA.
Stack này bao gồm: các mô hình Nemotron chạy cục bộ, runtime NVIDIA OpenShell.

Nhờ đó, người dùng có thể vận hành agent AI với mức độ bảo mật cao hơn, dữ liệu không cần rời khỏi máy và không phát sinh chi phí token.
Tùy chỉnh AI model dễ hơn với Unsloth Studio
Một điểm mới khác được công bố tại GTC là Unsloth Studio, giao diện web giúp đơn giản hóa quá trình fine-tuning mô hình AI.

Công cụ này hỗ trợ hơn 500 mô hình AI và cho phép người dùng có thể tải dataset trực tiếp lên hệ thống, tạo thêm dữ liệu tổng hợp bằng canvas trực quan, theo dõi tiến trình huấn luyện theo thời gian thực, xuất model sang framework mong muốn.
Unsloth Studio được xây dựng dựa trên thư viện Unsloth, giúp quá trình huấn luyện nhanh hơn gấp đôi và tiết kiệm tới 70% VRAM, đặc biệt phù hợp với các GPU RTX.

Xu hướng mới: “Agent computer”
Những công bố tại GTC cho thấy NVIDIA đang thúc đẩy một khái niệm mới trong ngành máy tính cá nhân: “agent computer” – thiết bị có khả năng vận hành trợ lý AI cá nhân ngay trên máy.

Thay vì chỉ là PC hay smartphone truyền thống, các hệ thống này sẽ trở thành nền tảng để người dùng: tạo và vận hành AI agent riêng, tự động hóa công việc cá nhân, xử lý dữ liệu nhạy cảm ngay trên thiết bị.
Xu hướng này được xem là bước tiếp theo trong quá trình phổ cập AI, đưa các mô hình lớn từ trung tâm dữ liệu về trực tiếp máy tính của người dùng.

