Khi chatbot không thể truy cập các hoạt động trực tuyến cá nhân, trình duyệt web đang trở thành không gian mới để AI thể hiện vai trò như một trợ lý thực thụ.
AI đang rời bỏ chatbot để tiến vào trình duyệt web
Nếu trước đây AI được biết đến chủ yếu thông qua chatbot như ChatGPT, thì nay, trình duyệt web mới là nơi chứng kiến giai đoạn phát triển tiếp theo của công nghệ này.
Lý do rất đơn giản: Các chatbot hiện nay không thể tiếp cận sâu vào đời sống trực tuyến của người dùng như trình duyệt. Trong khi đó, để AI thực sự giúp con người “làm thay mọi việc”, nó cần quyền truy cập và xử lý thông tin từ email, tài khoản ngân hàng, lịch cá nhân, v.v. Và trình duyệt là công cụ duy nhất đang giữ vai trò “trạm trung chuyển” dữ liệu đó.
Gần đây, hai sản phẩm mới cho thấy xu hướng này đang dần rõ rệt: Đầu tiên là ChatGPT Agent – một công cụ duyệt web tự động cơ bản. Tiếp theo là Comet – trình duyệt dành cho máy tính của Perplexity, cho phép mô hình ngôn ngữ lớn truy cập các trang web đã đăng nhập và thực hiện thao tác thay người dùng. Có thông tin rằng OpenAI cũng đang phát triển trình duyệt riêng của mình.
Tuy nhiên, cả hai sản phẩm hiện vẫn còn nhiều giới hạn. ChatGPT Agent chỉ dừng lại ở mức đọc – không thể tương tác với trang web có đăng nhập, hoạt động chậm và đôi khi cung cấp thông tin sai. Còn Comet dù có tốc độ tốt hơn và giao diện tiện dụng nhưng cũng gặp lỗi khi tuyên bố đã hoàn thành tác vụ trong khi thực tế thì không.

Tác giả Alex Heath cho rằng dù còn nhiều bất cập, nhưng chỉ sau vài ngày sử dụng Comet, anh đã cảm nhận được tương lai nơi AI và trình duyệt hợp nhất. Việc phải gõ lệnh cho chatbot giờ đây trở nên “tụt hậu” so với trải nghiệm tương tác thông minh trên nền web mà các sản phẩm như ChatGPT Agent hay Comet mang lại.
Trong buổi phỏng vấn trên podcast Decoder, CEO của Perplexity – Aravind Srinivas – chia sẻ rằng họ đặt cược vào sự tiến bộ nhanh chóng của các mô hình suy luận để giúp AI thực hiện được những nhiệm vụ phức tạp. Ví dụ, ChatGPT Agent đang chạy một mô hình riêng biệt được huấn luyện chuyên sâu cho các tác vụ nhiều bước – tuy chưa công bố tên và chưa mở API.
Dù còn nhiều hạn chế và lỗi kỹ thuật, rõ ràng việc tích hợp AI vào trình duyệt sẽ mở ra cánh cửa để trí tuệ nhân tạo trở thành “trợ lý” thực thụ, không chỉ là nơi để chat giải trí.

Một vài diễn biến nổi bật khác trong thế giới AI tuần qua
- Substack suýt về tay Shane Smith: Trước khi công bố gọi vốn 100 triệu USD, Substack từng được người sáng lập Vice – Shane Smith – đề xuất mua lại. Tuy nhiên thương vụ không thành.
- Xu hướng “reverse acquihire” gây tranh cãi: Việc startup AI Windsurf bị Google “hấp thụ” phần lãnh đạo mà bỏ lại nhân viên còn lại đang vấp phải làn sóng chỉ trích trong giới công nghệ.
- Mira Murati ra mắt phòng thí nghiệm Thinking Machines: Nhiều khả năng tập trung vào ứng dụng AI trong doanh nghiệp, với sự hậu thuẫn từ các tập đoàn như Cisco, ServiceNow.
- Các nhà nghiên cứu AI gặp khó khi xin visa Mỹ: Hội nghị NeurIPS buộc phải mở thêm địa điểm ở Mexico do nhiều chuyên gia bị từ chối thị thực đến San Diego.
- Meta, Google và Anthropic săn nhân tài: Meta đã chiêu mộ thêm 5 nhân sự cấp cao từ OpenAI cho phòng thí nghiệm mới. Trong khi đó, Anthropic và Google Cloud cũng đang luân chuyển nhân sự cấp cao để đẩy mạnh mảng AI agent.

