Microsoft ra mắt MAI-Voice-1 và MAI-1-preview, hai mô hình AI hiệu quả cao nhằm tăng sức cạnh tranh và giảm phụ thuộc vào OpenAI.
Ngày thứ Năm vừa qua, Microsoft đã công bố hai mô hình trí tuệ nhân tạo mới do chính hãng phát triển, được cho là có thể cạnh tranh ngang tầm với những công nghệ hàng đầu thế giới, sau nhiều năm tập trung vào các sản phẩm từ OpenAI.
Động thái này chính thức đưa bộ phận AI của Microsoft, dưới sự dẫn dắt của Mustafa Suleyman, vào thế đối đầu trực tiếp với OpenAI và nhiều đối thủ khác trong ngành, đồng thời giúp hãng chủ động hơn trong cuộc đua AI khốc liệt giữa các tập đoàn công nghệ lớn và các startup được rót vốn mạnh mẽ.
Trong buổi phỏng vấn với Semafor, Suleyman chia sẻ: “Chúng tôi là một trong những công ty lớn nhất thế giới. Điều đó đồng nghĩa chúng tôi phải sở hữu năng lực nội bộ để tạo ra những mô hình mạnh mẽ nhất.”

Một trong hai sản phẩm được ra mắt là MAI-Voice-1, mô hình xử lý giọng nói được đánh giá là hiệu quả hàng đầu, có thể vận hành trên một GPU duy nhất và tạo ra một phút âm thanh chỉ trong chưa tới một giây.
Song song, Microsoft cũng giới thiệu MAI-1-preview, mô hình ngôn ngữ có thể trở thành nền tảng cho các phiên bản Copilot tương lai – trợ lý AI đang được tích hợp vào Windows và bộ ứng dụng Office.
Cả hai mô hình đều được tối ưu về chi phí. Theo Microsoft, MAI-1-preview chỉ cần khoảng 15.000 GPU Nvidia H-100 để huấn luyện, ít hơn nhiều so với một số mô hình khác như Grok của xAI, vốn cần hơn 100.000 chip cùng loại.
Suleyman cho biết công ty đã tận dụng nhiều kỹ thuật, trong đó có những phương pháp học hỏi từ cộng đồng mã nguồn mở, để tối ưu khả năng huấn luyện mà không cần quá nhiều tài nguyên. Ông nhấn mạnh: “Chúng tôi đã xây dựng một mô hình có sức mạnh vượt ngoài mong đợi. Trong giai đoạn hiện nay, việc huấn luyện hiệu quả không chỉ dựa vào sức mạnh tính toán, mà còn ở khả năng chọn lọc dữ liệu chính xác và loại bỏ những phần không thực sự mang lại giá trị cho mô hình.”