OpenAI đã bắt đầu triển khai chế độ giọng nói nâng cao mới cho ChatGPT đến một số ít người đăng ký ChatGPT Plus.
Tính năng giọng nói mới này được OpenAI giới thiệu tại sự kiện ra mắt GPT-4 vào tháng 5, đã bị chỉ trích vì có âm thanh tương tự như giọng của Scarlett Johansson và sau đó bị trì hoãn vì lý do an toàn.
Tại sự kiện của OpenAI, chế độ giọng nói mới này dường như có khả năng vượt trội hơn đáng kể so với chế độ giọng nói hiện tại của ChatGPT. Trên sân khấu, các nhân viên của OpenAI đã có thể ngắt lời và yêu cầu chatbot kể câu chuyện theo nhiều cách khác nhau, và chatbot đã điều chỉnh phản hồi của mình một cách mượt mà để đáp ứng các yêu cầu đó.
Chế độ nâng cao dự kiến sẽ được phát hành dưới dạng alpha vào cuối tháng 6, nhưng OpenAI đã trì hoãn triển khai thêm một tháng để “đạt tiêu chuẩn ra mắt.” Trong thời gian trì hoãn, công ty cho biết họ đang “cải thiện khả năng phát hiện và từ chối nội dung nhất định của mô hình.” Người phát ngôn của OpenAI, Taya Christianson, cho biết công ty đã thử nghiệm khả năng của mô hình giọng nói với hơn 100 người kiểm tra bên ngoài (những người cố gắng tấn công công nghệ để tìm ra điểm yếu). Gần đây, OpenAI đã đối mặt với nhiều sự giám sát về các chính sách an toàn của mình, vì vậy quyết định tạm dừng có thể là lựa chọn đúng đắn. OpenAI cũng đã “thêm các bộ lọc mới sẽ nhận diện và chặn các yêu cầu tạo nhạc hoặc âm thanh có bản quyền,” Christianson cho biết.

Trong sự kiện của OpenAI, một trong những điểm bị chỉ trích chính của chế độ mới là giọng nói trên sân khấu, được gọi là “Sky,” nghe giống với giọng của Johansson, người đã đóng vai một nhân vật AI trong phim Her. Mặc dù giọng nói này đã xuất hiện trong ChatGPT trước khi OpenAI trình diễn vào mùa xuân, công ty đã rút lại nó ngay trước khi Johansson tiết lộ rằng cô đã gửi thư đến OpenAI để hỏi về cách tạo ra giọng nói này. Christianson cho biết chế độ mới của ChatGPT sẽ chỉ sử dụng bốn giọng nói cài sẵn do OpenAI tạo ra với các diễn viên lồng tiếng, đồng thời nói thêm, “Chúng tôi đã đảm bảo rằng ChatGPT không thể giả mạo giọng nói của người khác, cả cá nhân lẫn công chúng, và sẽ chặn các đầu ra khác với một trong bốn giọng nói cài sẵn này.”
OpenAI dự định mang chế độ mới này đến tất cả người dùng ChatGPT Plus vào mùa thu, theo Christianson.