Zalo là một trong những doanh nghiệp tiên phong tại Việt Nam phát triển mô hình ngôn ngữ lớn (LLM) nội địa. Với định hướng làm chủ công nghệ AI từ giai đoạn khởi tạo, Zalo đã từng bước vượt qua nhiều thách thức để vươn lên nhóm dẫn đầu khu vực Đông Nam Á trong lĩnh vực này.
Là một trong những đơn vị tiên phong trong lĩnh vực trí tuệ nhân tạo tại Việt Nam, Zalo đã phát triển thành công mô hình ngôn ngữ lớn (LLM) “thuần Việt” và giới thiệu phiên bản đầu tiên vào năm 2023. Hướng đến mục tiêu tự chủ công nghệ và hạn chế phụ thuộc vào giải pháp nước ngoài, mô hình do Zalo xây dựng sở hữu 13 tỷ tham số và được huấn luyện hoàn toàn từ đầu – bao gồm từ thiết kế kiến trúc, lựa chọn thuật toán đến tổ chức dữ liệu đầu vào.
Với cách tiếp cận này, đội ngũ kỹ sư trong nước có thể kiểm soát trọn vẹn quá trình huấn luyện, từ đó chủ động tối ưu và phát triển mô hình phù hợp với tiếng Việt. Việc sở hữu mô hình LLM nội địa không chỉ thể hiện năng lực công nghệ của Việt Nam mà còn đưa quốc gia trở thành một trong số ít các nước tại Đông Nam Á có thể tự xây dựng LLM độc lập.
Theo báo cáo từ Grand View Research, thị trường mô hình ngôn ngữ lớn toàn cầu năm 2024 ước tính đạt hơn 5,6 tỷ USD và được dự báo sẽ tăng trưởng với tốc độ gần 37% mỗi năm từ 2025 đến 2030. Trong khi phần lớn sự chú ý tập trung vào những quốc gia như Mỹ và Trung Quốc – nơi quy tụ các tập đoàn AI hàng đầu, thì Đông Nam Á dù ít nổi bật hơn vẫn đang có những bước tiến đáng kể. Tiêu biểu, Singapore đã công bố mô hình SEA-LION LLM với 13% dữ liệu huấn luyện đến từ các ngôn ngữ trong khu vực.
Tại Việt Nam, hành trình phát triển LLM cũng ghi nhận nhiều nỗ lực đáng chú ý. Không sở hữu tiềm lực mạnh mẽ như các tập đoàn công nghệ toàn cầu, Zalo khi bắt đầu vẫn phải đối mặt với nhiều khó khăn – từ hạn chế về dữ liệu tiếng Việt (vốn ít hơn rất nhiều so với tiếng Anh hay tiếng Trung), cho đến thiếu hụt hạ tầng tính toán và kinh nghiệm huấn luyện chuyên sâu.
Tuy vậy, bằng chiến lược phát triển bài bản và định hướng rõ ràng, Zalo đã từng bước tháo gỡ các rào cản. Việc trang bị hệ thống gồm 8 máy chủ DGX H100 – dòng GPU tiên tiến và khan hiếm của Nvidia – đã tạo điều kiện cho việc huấn luyện mô hình hiệu năng cao với tổng công suất xử lý lên tới 256 petaFLOPS. Đồng thời, Zalo cũng không ngừng đầu tư xây dựng kho dữ liệu tiếng Việt, và huấn luyện đội ngũ kỹ sư thông qua các mô hình thử nghiệm quy mô nhỏ để sẵn sàng khi có hạ tầng lớn.
Nhờ định hướng đúng đắn, chỉ sau 6 tháng huấn luyện, Zalo đã phát triển thành công mô hình 7 tỷ tham số tối ưu cho tiếng Việt, đạt hiệu suất vượt trội – lên đến 150% so với GPT-3.5 (theo đánh giá từ nền tảng VMLU – bộ tiêu chuẩn đánh giá năng lực xử lý tiếng Việt của các mô hình LLM).
Đến cuối năm 2024, mô hình của Zalo đã vươn lên xếp thứ 2 trong bảng xếp hạng các LLM huấn luyện từ đầu trên VMLU, chỉ sau Llama-3-70B của Meta và vượt qua nhiều tên tuổi quốc tế như GPT-4 của OpenAI, Gemma-2 của Google hay Phi-3 của Microsoft.
Theo Tiến sĩ Nguyễn Trường Sơn – Giám đốc Khoa học của Zalo AI: “Mặc dù khởi đầu với nhiều thách thức, chúng tôi tin rằng Việt Nam hoàn toàn có thể sở hữu những mô hình AI mang tính cạnh tranh quốc tế. Zalo đã tích cực học hỏi từ các trung tâm nghiên cứu lớn trên thế giới để xây dựng chiến lược phù hợp với điều kiện trong nước. Những thành tựu bước đầu chính là động lực để đội ngũ kỹ sư tiếp tục mở rộng mô hình theo hướng ngày càng hiệu quả và toàn diện hơn.”
Thành công của mô hình LLM nội địa cũng tạo tiền đề cho các ứng dụng AI phục vụ người Việt. Một trong số đó là trợ lý hỏi đáp tổng hợp Kiki Info được tích hợp dưới dạng Tài khoản Chính thức (Official Account) trên nền tảng Zalo. Chỉ sau chưa đầy 2 tháng ra mắt, Kiki Info đã thu hút tới 1 triệu lượt truy cập từ người dùng trong nước – cho thấy nhu cầu rõ ràng đối với các giải pháp AI nói tiếng Việt.
Đại diện Zalo khẳng định, việc phát triển công nghệ không chỉ là nỗ lực riêng của doanh nghiệp mà còn là đóng góp thiết thực vào nền công nghệ quốc gia. Zalo cam kết tiếp tục đồng hành cùng cộng đồng công nghệ Việt để kiến tạo các sản phẩm AI “do người Việt làm – cho người Việt dùng”.

Nhà sáng lập Zalo, ông Vương Quang Khải, cũng chia sẻ kỳ vọng về tương lai ngành AI trong nước: “Trí tuệ nhân tạo đẹp không chỉ bởi công nghệ mà còn bởi tác động tích cực đến cuộc sống. Chúng tôi tin rằng người Việt hoàn toàn có thể làm ra các sản phẩm AI chất lượng cao, không chỉ phục vụ thị trường trong nước mà còn đủ sức cạnh tranh ở quy mô toàn cầu.”

