Phân tích mã nguồn Claude Code cho thấy phần lớn giá trị kỹ thuật của AI agent hiện đại nằm ở hệ thống harness như sandbox, quản lý quyền và điều phối công cụ thay vì chỉ ở mô hình AI.
Một nghiên cứu từ nhóm VILA-Lab thuộc Mohamed bin Zayed University of Artificial Intelligence đang thu hút sự chú ý trong cộng đồng kỹ sư AI khi phân tích mã nguồn của Claude Code và đưa ra kết luận đáng chú ý: phần “trí tuệ” cốt lõi của hệ thống chỉ chiếm tỷ lệ rất nhỏ, trong khi gần như toàn bộ giá trị kỹ thuật nằm ở lớp hạ tầng bao quanh mô hình AI.
Nghiên cứu được thực hiện sau sự cố hồi tháng 3/2026 khi Anthropic vô tình phát hành một gói npm chứa file sourcemap dung lượng gần 60 MB, làm lộ mã nguồn TypeScript của Claude Code v2.1.88. Nhóm nghiên cứu đã phân tích hơn 1.800 tệp với khoảng nửa triệu dòng mã và cho rằng chỉ khoảng 1,6% liên quan trực tiếp đến logic ra quyết định của AI. Phần còn lại là hệ thống “harness” — bao gồm quản lý quyền, sandbox, điều phối công cụ, lưu trạng thái, quản lý ngữ cảnh và cơ chế phục hồi lỗi.
Theo nhóm nghiên cứu, mô hình hoạt động cốt lõi của các AI agent hiện nay thực tế khá đơn giản: gọi mô hình ngôn ngữ, thực thi công cụ, nhận kết quả rồi lặp lại chu trình. Điều tạo nên độ phức tạp thật sự nằm ở lớp hạ tầng đảm bảo hệ thống vận hành an toàn, ổn định và hiệu quả trong môi trường thực tế.

Quan điểm này cũng được củng cố bởi nhiều nhóm độc lập khác. Karan Prasad từ Obvix Labs đã dành nhiều ngày để phân tích cùng bộ mã nguồn và đi đến kết luận rằng mô hình AI có thể thay thế được, nhưng lớp harness thì khó sao chép hơn rất nhiều.
Điểm đáng chú ý là nhiều đội ngũ phát triển khác nhau lại xây dựng kiến trúc gần như tương đồng dù dùng công nghệ khác nhau. Claude Code được viết bằng TypeScript trên Bun, Codex CLI của OpenAI đang được viết lại gần như hoàn toàn bằng Rust, trong khi Aider sử dụng Python. Dù vậy, tất cả đều hội tụ ở cùng một mô hình: vòng lặp agent trung tâm, bộ công cụ cơ bản để đọc/ghi file và chạy lệnh shell, cùng hệ thống kiểm duyệt quyền nhiều lớp trước khi thực thi tác vụ.
Các nhà nghiên cứu cho rằng sự hội tụ này cho thấy đây không còn là lựa chọn thiết kế mang tính cá nhân mà là cấu trúc gần như bắt buộc đối với AI agent hiện đại.
Trong Claude Code, hệ thống harness được chia thành nhiều lớp như giao diện người dùng, vòng lặp agent, lớp công cụ, cơ chế lưu trạng thái và môi trường thực thi. Riêng hệ thống cấp quyền đã có nhiều chế độ kiểm tra khác nhau, bao gồm cả bộ phân loại machine learning để đánh giá mức độ nguy hiểm của lệnh trước khi cho phép thực thi.
Một thành phần quan trọng khác là cơ chế nén ngữ cảnh nhiều tầng nhằm giảm chi phí xử lý prompt. Theo phân tích của Obvix Labs, việc giữ lại các phần prompt đã được cache có thể giúp tiết kiệm khoảng 76% chi phí API trong các phiên làm việc kéo dài.
Dù vậy, Boris Cherny — người tạo ra Claude Code tại Anthropic — lại có quan điểm trái ngược. Ông cho rằng harness chỉ là lớp vỏ tối giản nhất có thể và “bí quyết thật sự nằm ở mô hình AI”. Theo Cherny, khi các mô hình suy luận ngày càng mạnh hơn, nhiều lớp scaffold hay hạ tầng hỗ trợ sẽ dần trở nên ít quan trọng hơn.
Một số kết quả benchmark từ bên thứ ba cũng cho thấy sự khác biệt giữa các harness đôi khi không quá lớn trong một số bài kiểm tra cụ thể. Tuy nhiên, các chuyên gia cho rằng giá trị thật sự của harness chỉ bộc lộ khi hệ thống bước ra môi trường production với hàng triệu lượt sử dụng và hàng loạt vấn đề về bảo mật, quản lý trạng thái cũng như kiểm soát quyền truy cập.

Điều này đặc biệt rõ qua các lỗ hổng bảo mật từng xuất hiện trong Claude Code. Nhiều CVE nghiêm trọng được công bố trong giai đoạn 2025–2026 đều xuất phát từ lớp harness như hooks system, sandbox hoặc pipeline cấp quyền chứ không nằm ở mô hình AI. Một số lỗi thậm chí cho phép thực thi lệnh shell hoặc đánh cắp khóa API mà không cần tương tác từ người dùng.
Các chuyên gia nhận định đây là minh chứng cho việc harness vừa là yếu tố tạo khác biệt cạnh tranh, vừa là bề mặt tấn công lớn nhất của AI agent hiện đại.
Trong bối cảnh đó, việc Andrej Karpathy gia nhập Anthropic để tham gia nhóm huấn luyện mô hình mới cũng làm cuộc tranh luận “Big Model” đối đầu “Big Harness” nóng hơn. Karpathy được giao nhiệm vụ xây dựng hệ thống sử dụng chính Claude để tăng tốc nghiên cứu và huấn luyện các thế hệ Claude tiếp theo — một hướng đi đặt cược mạnh vào sức mạnh mô hình nền tảng.
Song song, Claude Code hiện đã được Anthropic xác nhận sử dụng chính Claude để viết toàn bộ mã nguồn của mình, tạo nên vòng lặp tự cải tiến giữa mô hình và hạ tầng vận hành.
Với các nhà phát triển AI agent trong năm 2026, nghiên cứu từ MBZUAI đặt ra câu hỏi thực tế hơn là tranh luận lý thuyết: nên đầu tư nhiều hơn vào lựa chọn mô hình AI hay vào hệ thống harness bao quanh nó? Các bằng chứng hiện tại cho thấy chất lượng mô hình vẫn cực kỳ quan trọng, nhưng một hạ tầng agent trưởng thành với sandbox, pipeline phân quyền, quản lý ngữ cảnh và hệ thống công cụ ổn định mới là yếu tố quyết định khả năng triển khai thực tế ở quy mô lớn.

