OpenAI triển khai tính năng Trusted Contact trên ChatGPT, cho phép hệ thống gửi cảnh báo đến người liên hệ tin cậy nếu phát hiện dấu hiệu người dùng có nguy cơ tự làm hại bản thân.
Theo đó, OpenAI vừa công bố một tính năng an toàn mới dành cho ChatGPT mang tên “Trusted Contact”. Tính năng này cho phép hệ thống gửi cảnh báo đến người liên hệ được chỉ định nếu phát hiện dấu hiệu người dùng có nguy cơ tự gây hại cho bản thân.
Theo OpenAI, người dùng từ 18 tuổi trở lên hiện có thể chủ động chọn một “Trusted Contact” – tức người liên hệ tin cậy – trong phần thiết lập an toàn của ChatGPT. Khi hệ thống nhận thấy các dấu hiệu liên quan đến ý định tự làm hại bản thân hoặc tự tử trong cuộc trò chuyện, nền tảng có thể kích hoạt cơ chế cảnh báo khẩn cấp.
OpenAI cho biết ngày càng có nhiều người sử dụng ChatGPT như một công cụ để chia sẻ cảm xúc cá nhân, áp lực cuộc sống hoặc các vấn đề tinh thần. Trong một số trường hợp, người dùng có thể bộc lộ những dấu hiệu nguy hiểm liên quan đến sức khỏe tâm lý, và đây là những nội dung mà hệ thống an toàn mới sẽ theo dõi kỹ hơn.
Theo thông tin được chia sẻ, tính năng Trusted Contact không hoạt động hoàn toàn tự động bằng AI. Thay vào đó, các trường hợp nghi ngờ sẽ được chuyển đến đội ngũ chuyên trách đã qua đào tạo để đánh giá mức độ rủi ro trước khi gửi cảnh báo tới người liên hệ thông qua tin nhắn, email hoặc thông báo trong ứng dụng.

Động thái này được xem là bước mở rộng trong chiến lược tăng cường an toàn của OpenAI sau một số tranh cãi liên quan đến việc chatbot AI bị cho là chưa xử lý tốt các tình huống người dùng có dấu hiệu khủng hoảng tâm lý.
Trước đó, OpenAI từng triển khai các công cụ kiểm soát dành cho tài khoản thanh thiếu niên, cho phép phụ huynh nhận cảnh báo nếu hệ thống phát hiện nguy cơ tự gây hại. Với Trusted Contact, cơ chế tương tự hiện được mở rộng sang nhóm người dùng trưởng thành.
OpenAI cho biết mục tiêu của tính năng mới là bổ sung thêm một lớp hỗ trợ an toàn trong những tình huống nhạy cảm, thay vì thay thế các dịch vụ chăm sóc sức khỏe tâm thần chuyên nghiệp.

