Nghiên cứu về cải thiện độ chính xác của nhận dạng tiếng nói thời gian thực của kỹ sư trẻ Zalo AI, Lê Duy Khánh, đã được chấp nhận công bố tại Hội nghị khoa học Interspeech 2024.
Một nghiên cứu của kỹ sư Zalo AI về việc cải thiện độ chính xác của các mô hình nhận dạng tiếng nói trong thời gian thực đã được chấp nhận công bố tại Hội nghị khoa học Interspeech, dự kiến diễn ra tại Hy Lạp vào tháng 9/2024.
Nghiên cứu với tựa đề “Improving Streaming Speech Recognition With Time-Shifted Contextual Attention And Dynamic Right Context Masking” (Tạm dịch: Cải thiện nhận dạng tiếng nói thời gian thực bằng cơ chế chú ý dịch chuyển theo thời gian và mặt nạ ngữ cảnh tương lai động), do kỹ sư Lê Duy Khánh sinh năm 2000 thực hiện, dưới sự hướng dẫn của TS. Châu Thành Đức – Trưởng bộ phận R&D tại Zalo AI và giảng viên ĐH Khoa học tự nhiên TP.HCM. Công trình này đóng góp quan trọng vào việc nâng cấp các mô hình nhận dạng tiếng nói và gia tăng độ chính xác cho các tính năng soạn tin nhắn bằng giọng nói và chuyển tin nhắn thoại thành văn bản trên ứng dụng Zalo.

Nghiên cứu xuất phát từ nhu cầu thực tiễn về việc cải thiện độ chính xác của các thuật toán nhận dạng tiếng nói thời gian thực (streaming ASR), vốn gặp khó khăn với việc thiếu ngữ cảnh dẫn đến chất lượng nhận dạng không tối ưu. Nghiên cứu đã được tích hợp vào tính năng “soạn tin nhắn bằng giọng nói” của Zalo từ cuối năm 2023, giúp cải thiện đáng kể độ chính xác với tỷ lệ chính xác đạt 95% trong môi trường thực tế và giảm tỷ lệ cần chỉnh sửa sau khi soạn từ 6,4% xuống còn 4,8%. Tính năng này hiện đang thu hút khoảng 3,2 triệu người dùng hàng tháng và tạo ra gần 4,5 triệu tin nhắn mỗi ngày.
Ngoài việc cải thiện tính năng hiện có, nghiên cứu còn tiềm năng ứng dụng rộng rãi vào nhiều sản phẩm và dịch vụ khác như chatbot giọng nói, trợ lý giọng nói, và tính năng tự động tạo bản ghi cho các cuộc gọi video. Việc các nghiên cứu của kỹ sư Việt Nam được công nhận tại các hội nghị quốc tế như Interspeech là tín hiệu tích cực, phản ánh sự phát triển và thu hẹp khoảng cách của cộng đồng AI Việt Nam với thế giới.
Thành công của nghiên cứu này cũng thể hiện định hướng đúng đắn của Zalo AI trong việc trao quyền cho các kỹ sư trẻ, những người đóng góp quan trọng vào sự thành công của công nghệ và các tính năng AI trên nền tảng Zalo.