Spotify sẽ sử dụng công nghệ của OpenAI để dịch podcast sang nhiều ngôn ngữ hơn cho người dùng toàn cầu.
Spotify đã tiết lộ Dịch giọng nói cho podcast, một dịch vụ thử nghiệm mới sử dụng AI để dịch các chương trình âm thanh sang nhiều ngôn ngữ khác nhau. Thông qua việc áp dụng các kỹ thuật học máy, podcast có thể duy trì giọng nói của người tạo podcast ban đầu, mang lại âm thanh tự nhiên hơn.
Dịch giọng nói là được xây dựng trên một công cụ do Spotify phát triển và kết hợp những tiến bộ tiên tiến trong công nghệ âm thanh AI, bao gồm cả sự đóng góp của OpenAI. OpenAI, có trụ sở chính tại San Francisco, đã phát triển một mô hình nhận dạng giọng nói linh hoạt có tên “Whisper”, đã trải qua quá trình đào tạo về một tập dữ liệu đáng kể về âm thanh đa dạng. Quá trình đào tạo này cho phép nó thực hiện các nhiệm vụ như nhận dạng giọng nói đa ngôn ngữ, dịch giọng nói và nhận dạng ngôn ngữ.
Nhờ Whisper và mô hình AI của nó, Spotify tuyên bố rằng các podcast được dịch có âm thanh tự nhiên hơn so với lồng tiếng thông thường. Theo dịch vụ phát trực tuyến, một podcast được ghi bằng tiếng Anh hiện có thể được cung cấp bằng các ngôn ngữ khác trong khi vẫn giữ được “đặc điểm giọng nói đặc biệt” của người nói.

Ở giai đoạn này, chỉ một số tập danh mục và các bản phát hành sắp tới sẽ được dịch thuật. Spotify đã cam kết cung cấp bản dịch bằng tiếng Tây Ban Nha, tiếng Pháp, tiếng Đức và các ngôn ngữ không xác định khác. Công ty cũng đang cộng tác với các podcast khác để đưa các chương trình của họ vào dịch vụ dịch thuật.
Theo Ziad Sultan, Phó Giám đốc cá nhân hóa của Spotify, việc cung cấp các podcast đã dịch vẫn giữ nguyên giọng gốc của người sáng tạo sẽ giúp người nghe trên toàn thế giới khám phá và lấy cảm hứng từ các podcast mới theo cách chân thực hơn. Spotify đang thực hiện một cách tiếp cận chu đáo với AI để thúc đẩy sự kết nối sâu sắc hơn giữa người nghe và người sáng tạo. Điều này dường như là yếu tố chính trong sứ mệnh của công ty nhằm giải phóng tiềm năng sáng tạo của con người.
Các tập được dịch bằng giọng nói sẽ có sẵn trên toàn thế giới cho cả người đăng ký trả phí và miễn phí. Ban đầu, bản dịch sẽ có sẵn bằng tiếng Tây Ban Nha, với phiên bản tiếng Pháp và tiếng Đức sẽ được giới thiệu trong những ngày và tuần tới.


