Với việc tích hợp trợ lý ảo hỗ trợ tiếng Việt, người dùng có thể tìm kiếm nhạc trên Zing MP3 bằng giọng nói mà không cần thao tác tay như trước.
Hiện nay, người dùng trên iOS và Android chỉ cần ra lệnh bằng giọng nói ngay trong ứng dụng Zing MP3 để tìm nhạc mà không cần phải nhập dữ liệu bằng tay như trước đây. Trợ lý ảo trên Zing MP3 giúp người dùng tiết kiệm thời gian tìm nhạc chỉ với một vài thao tác đơn giản.
Công nghệ xử lý ngôn ngữ tự nhiên
Zing MP3 sử dụng công nghệ xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP). Đây là công nghệ giúp máy tính hiểu cách con người giao tiếp và phản hồi.
Quy trình NLP diễn ra như sau: khi người dùng ra lệnh, trợ lý tiếng nói sẽ sử dụng công nghệ nhận dạng giọng nói tự động (Automatic Speech Recognition – ASR) để tiếp nhận thông tin giọng nói và chuyển dữ liệu giọng nói thành văn bản. Công nghệ phân tích ý định người dùng (Natural Language Understanding – NLU) sẽ giúp máy hiểu ý định người dùng. Lúc này, hệ thống sẽ thực hiện xử lý ý định người dùng dựa trên dữ liệu nhạc, sở thích mỗi người, sau đó đưa ra câu trả lời tương ứng. Cuối cùng, câu trả lời này sẽ được chuyển đổi thành âm thanh (Text to Speech – TTS) và phát ra cho người dùng.

Quy trình này nghe có vẻ dễ thực hiện nhưng không phải vậy. Ngôn ngữ của con người rất phức tạp để máy tính có thể hiểu được. Điểm mấu chốt là quá trình NLP phải giúp trợ lý tiếng nói hiểu các ý nghĩa đằng sau các cụm từ bằng cách phân tích cú pháp, ngữ nghĩa, giọng vùng miền, thậm chí tiếng lóng của người nói.
Đây là một thách thức lớn vì nó là một lĩnh vực kết hợp giữa khoa học máy tính, trí tuệ nhân tạo và ngôn ngữ học. Dù công nghệ nhận dạng giọng nói đã phát triển nhanh chóng trong những năm gần đây, nhưng các thiết bị điều khiển bằng giọng nói với độ chính xác cao vẫn có thể hiểu sai các ngữ cảnh.
Điều quan trọng trong bài toán tìm nhạc của Zing MP3 là phải xử lý được các hành vi và thói quen nghe nhạc của người dùng như phát âm sai, nhớ sai tên bài hát, hay chỉ thuộc một đoạn trong lời, thậm chí phần thuộc đó cũng không chính xác. Chính vì vậy, ngoài công nghệ nhận dạng giọng nói tự động (ASR), trợ lý tiếng nói của Zing MP3 giải quyết bài toán nhận biết lời bài hát cũng như dự đoán tên bài hát gần chính xác để trả lại kết quả theo đúng yêu cầu của người dùng.
Ưu điểm của tính năng này trên Zing MP3 là khả năng nhận diện giọng nói bằng tiếng Việt, thậm chí là giọng địa phương và phản hồi bằng tiếng Việt tự nhiên nhờ vào công nghệ chuyển đổi dữ liệu thành âm thanh (TTS). Hiện nay trên thế giới, các trợ lý tiếng nói đa số sử dụng tiếng nước ngoài, hiếm hỗ trợ tiếng Việt. Ưu thế này giúp việc tìm nhạc bằng giọng nói trên Zing MP3 gần gũi, tiện lợi đối với người dùng đại chúng tại Việt Nam.
Cách sử dụng trợ lý ảo trên Zing MP3
Để sử dụng tính năng điều khiển bằng giọng nói trên Zing MP3, người dùng cập nhật phiên bản mới nhất. Sau đó vào màn hình chính của ứng dụng, chọn biểu tượng micro ở góc bên phải trên cùng màn hình để cấp quyền cho trợ lý ảo bằng cách nhấn mục “Cho phép”. Các thao tác tìm nhạc sẽ chỉ được thực hiện khi nhấn vào biểu tượng micro để kích hoạt.

Màn hình sẽ hiển thị trợ lý ảo và giới thiệu cho người dùng các tiện ích điều khiển bằng giọng nói như mở và dừng nhạc, chuyển nhạc, hẹn giờ tắt nhạc, tìm kiếm thông tin ca khúc và nghệ sĩ, thêm bài hát vào danh sách yêu thích… Từ đó, người dùng bắt đầu ra lệnh cho trợ lý ảo bằng giọng nói của mình.
Người dùng có thể mở ca khúc hoặc tìm nhạc của nghệ sĩ yêu thích hoàn toàn bằng giọng nói của mình. Ví dụ, khi muốn nghe ca khúc Sóng gió, người dùng sử dụng câu lệnh “Mở bài hát Sóng gió” và ngay sau đó trình phát nhạc sẽ mở bài hát này. Hay khi muốn thưởng thức các sản phẩm của Đức Phúc, người dùng chỉ cần ra lệnh cho trợ lý ảo “Mở nhạc của Đức Phúc”. Trình phát nhạc sẽ mở danh sách phát các ca khúc của nam ca sĩ này.
Trợ lý ảo trên Zing MP3 cũng sẽ gợi ý các bài hát theo thể loại, tâm trạng và hoạt động của người dùng. Với thể loại nhạc, người dùng sử dụng các câu lệnh như “Mở nhạc rap”, “Nghe nhạc EDM”, “Mở nhạc Hàn Quốc”, “Bật nhạc Âu Mỹ”… Khi muốn thưởng thức nhạc phù hợp với tâm trạng và hoạt động hiện tại, người dùng có thể ra lệnh như “Mở nhạc buồn”, “Mở nhạc vui”, “Bật nhạc để đi du lịch”, “Bật nhạc để làm việc”… Sau đó, trợ lý ảo sẽ phát playlist theo chủ đề thích hợp với câu lệnh.
Điểm thú vị khác của trợ lý ảo trên Zing MP3 là mở nhạc theo lời bài hát. Ở nhiều ngữ cảnh như khi đi trên đường vô tình nghe một bản nhạc quen thuộc nhưng không nhớ tên ca khúc, sau khi kích hoạt trợ lý tiếng nói, người dùng chỉ cần đọc lời bài hát để trình phát nhạc mở đúng ca khúc. Ví dụ như “Mở bài Anh thật sự ngu ngốc” (lời bài hát Em không sai chúng ta sai), “Mở bài Gió lung lay bàn tay nâng cánh hoa tình” (lời bài hát Ai mang cô đơn đi).
Các tiện ích khác khi sử dụng trợ lý ảo trên Zing MP3

Bên cạnh tính năng tìm nhạc, người dùng có thể điều khiển bằng giọng nói các tiện ích khác trên ứng dụng Zing MP3 như mở bài tiếp theo hoặc trước đó, tăng/giảm âm lượng, hẹn giờ tắt nhạc. Không chỉ điều khiển nhạc trên Zing MP3, người dùng có thể tìm kiếm thông tin nghệ sĩ thông qua trợ lý thông minh này. Thậm chí, người dùng còn có thể hỏi thêm các thông tin khác như thời tiết, giá vàng.
Hiện nay, người dùng Zing MP3 đã có thể kết nối ứng dụng này trên xe hơi và thực hiện các tác vụ rảnh tay như bật tắt nhạc, tìm nhạc, tìm đường trên xe. Để kích hoạt trợ lý tiếng nói này, chỉ cần nhấn nút “tiếp theo” (next) 2 lần là đã có thể kích hoạt trợ lý tiếng nói.
Gần đây, Zing MP3 còn cập nhật các tính năng khác như miễn phí nghe nhạc chất lượng cao 320 Kbps, cá nhân hóa playlist theo sở thích người nghe, hát karaoke, tính năng phòng nhạc và tính năng theo dõi trang cá nhân của nghệ sĩ.