Kiến trúc BlueField-4 STX mới giúp nâng mạnh hiệu năng và hiệu quả năng lượng, giải quyết nút thắt lưu trữ để AI có thể suy luận theo ngữ cảnh dài nhanh và ổn định hơn.
Tại sự kiện GTC 2026, NVIDIA đã công bố kiến trúc tham chiếu mới mang tên NVIDIA BlueField-4 STX – một nền tảng lưu trữ dạng mô-đun được thiết kế để phục vụ thế hệ AI mới, đặc biệt là các hệ thống agentic AI có khả năng suy luận theo ngữ cảnh dài và liên tục.
Theo NVIDIA, STX cho phép triển khai hạ tầng lưu trữ tăng tốc một cách linh hoạt cho doanh nghiệp, nhà cung cấp dịch vụ đám mây và các đơn vị phát triển AI. Điểm nổi bật của kiến trúc này nằm ở khả năng cải thiện hiệu năng xử lý dữ liệu, với thông lượng token cao gấp 5 lần, hiệu quả năng lượng tăng tới 4 lần và tốc độ nạp dữ liệu nhanh gấp đôi so với các hệ thống truyền thống.

Trong bối cảnh AI ngày càng phức tạp, các trung tâm dữ liệu hiện nay dù có dung lượng lưu trữ lớn nhưng vẫn chưa đáp ứng tốt yêu cầu về độ trễ thấp và khả năng truy cập dữ liệu theo thời gian thực. Đây là yếu tố then chốt đối với agentic AI – nơi các hệ thống phải liên tục tương tác, ghi nhớ ngữ cảnh và thực hiện nhiều bước xử lý xuyên suốt các phiên làm việc. Khi lượng ngữ cảnh tăng lên, những hạn chế của kiến trúc lưu trữ cũ có thể làm chậm quá trình suy luận và khiến GPU không được khai thác tối đa.
Kiến trúc STX được xây dựng để giải quyết vấn đề này bằng cách đưa dữ liệu đến gần hơn với tài nguyên xử lý, đồng thời đảm bảo khả năng truy cập nhanh và ổn định ở quy mô lớn. Nhờ đó, các “nhà máy AI” có thể vận hành hiệu quả hơn trong cả ba khâu: suy luận, huấn luyện và phân tích.
Một trong những thành phần quan trọng của hệ sinh thái STX là nền tảng lưu trữ bộ nhớ ngữ cảnh NVIDIA CMX. Đây là giải pháp mở rộng bộ nhớ GPU với một lớp xử lý ngữ cảnh hiệu năng cao, giúp hệ thống AI xử lý các tác vụ suy luận phức tạp và quy mô lớn một cách mượt mà hơn. So với các hệ thống lưu trữ truyền thống, CMX có thể cung cấp số lượng token xử lý mỗi giây cao hơn đáng kể, từ đó cải thiện rõ rệt tốc độ phản hồi của AI.

Phát biểu về xu hướng này, CEO Jensen Huang cho rằng agentic AI đang thay đổi cách phần mềm vận hành, kéo theo yêu cầu phải tái thiết kế toàn bộ hạ tầng tính toán phía sau. Những hệ thống AI có khả năng suy luận trên khối lượng dữ liệu lớn và liên tục học hỏi sẽ cần một lớp lưu trữ hoàn toàn mới – và STX chính là nền tảng được xây dựng để đáp ứng nhu cầu đó.
Về mặt công nghệ, STX được tăng tốc bởi nền tảng NVIDIA Vera Rubin và sử dụng bộ xử lý NVIDIA BlueField-4 tối ưu cho lưu trữ. Con chip này kết hợp CPU NVIDIA Vera với mạng tốc độ cao ConnectX-9 SuperNIC, cùng các công nghệ mạng và phần mềm như Spectrum-X, DOCA và bộ giải pháp NVIDIA AI Enterprise. Sự tích hợp này giúp STX không chỉ mạnh về hiệu năng mà còn đạt hiệu quả năng lượng cao hơn đáng kể so với kiến trúc CPU truyền thống, đồng thời tăng gấp đôi tốc độ xử lý dữ liệu đầu vào cho các ứng dụng AI doanh nghiệp.
Hệ sinh thái xung quanh STX cũng đang nhanh chóng hình thành. Nhiều nhà cung cấp lưu trữ và đối tác công nghệ lớn như Cloudian, Dell Technologies, HPE, IBM, NetApp hay Nutanix đang tham gia phát triển các giải pháp hạ tầng dựa trên kiến trúc này. Ở phía sản xuất phần cứng, các công ty như Supermicro hay Quanta Cloud Technology đã bắt đầu xây dựng các hệ thống STX hoàn chỉnh.
Bên cạnh đó, một loạt phòng lab AI và nhà cung cấp dịch vụ đám mây, bao gồm CoreWeave, Lambda, Mistral AI hay Oracle Cloud Infrastructure, cũng đang lên kế hoạch triển khai STX cho hệ thống bộ nhớ ngữ cảnh của mình. Điều này cho thấy nhu cầu thực tế đối với một kiến trúc lưu trữ mới phục vụ AI đang ngày càng rõ rệt.
Theo kế hoạch, các nền tảng dựa trên STX sẽ được các đối tác thương mại hóa vào nửa cuối năm nay, mở ra một bước tiến mới trong việc xây dựng hạ tầng AI-native – nơi lưu trữ không còn là điểm nghẽn mà trở thành yếu tố thúc đẩy hiệu năng cho toàn bộ hệ thống.

