Vượt qua nhiều thách thức về hạ tầng và dữ liệu, Zalo đã phát triển thành công mô hình ngôn ngữ lớn thuần Việt, mở ra bước tiến mới cho trí tuệ nhân tạo tại Việt Nam.
Với tinh thần đồng hành cùng định hướng chiến lược của Đảng và Chính phủ trong việc thúc đẩy công nghệ và đổi mới sáng tạo, Zalo đã đầu tư mạnh mẽ vào nghiên cứu và phát triển trí tuệ nhân tạo (AI). Một trong những cột mốc đáng chú ý là việc Zalo phát triển thành công mô hình ngôn ngữ lớn (LLM) hoàn toàn bằng kỹ thuật huấn luyện từ đầu, giúp Việt Nam trở thành một trong số ít quốc gia tại Đông Nam Á sở hữu mô hình AI do chính đội ngũ trong nước xây dựng.
Từ năm 2023, Zalo đã hoàn tất việc huấn luyện một mô hình LLM tập trung vào tiếng Việt, được phát triển bởi các kỹ sư người Việt. Sau sáu tháng đào tạo, mô hình với quy mô 7 tỷ tham số đã vượt qua GPT-3.5 của OpenAI về hiệu suất trên bảng đánh giá năng lực tiếng Việt VMLU, đạt tới 150% hiệu quả. Sang năm 2024, phiên bản nâng cấp 13 tỷ tham số của Zalo tiếp tục vươn lên vị trí cao trong bảng xếp hạng, vượt qua nhiều tên tuổi toàn cầu như GPT-4 của OpenAI, gemma-2-9b-it của Google hay Phi-3 của Microsoft, chỉ đứng sau Llama-3-70B của Meta.

Điểm nổi bật là toàn bộ quá trình huấn luyện được thực hiện từ đầu (from scratch), cho phép Zalo chủ động kiểm soát hoàn toàn mô hình và công nghệ, giảm sự phụ thuộc vào các nền tảng quốc tế. Điều này minh chứng cho năng lực phát triển AI nội địa của Việt Nam không hề thua kém so với các quốc gia phát triển, dù xuất phát điểm gặp không ít khó khăn.
Thực tế, Việt Nam từng đối mặt với nhiều trở ngại trong việc phát triển mô hình ngôn ngữ lớn, từ việc thiếu hụt hạ tầng tính toán như GPU cao cấp, hạn chế dữ liệu tiếng Việt chất lượng cao đến sự thiếu kinh nghiệm triển khai quy mô lớn. Trong khi các hãng công nghệ toàn cầu đã sở hữu hàng nghìn GPU hiệu năng cao từ Nvidia, các kỹ sư Việt Nam ban đầu chỉ có thể làm việc với GPU dân dụng để xây dựng nền móng kỹ thuật.
Để từng bước tháo gỡ các khó khăn, Zalo đã đặt mua loạt máy chủ DGX H100 từ Nvidia – loại chuyên dụng cho huấn luyện AI – và linh hoạt điều chỉnh kế hoạch huấn luyện theo tiến độ bàn giao thiết bị từ hãng. Cùng lúc, đội ngũ Zalo AI tập trung xây dựng tập dữ liệu tiếng Việt có chất lượng, giúp bù đắp hạn chế về tài nguyên ngôn ngữ.
Theo chia sẻ từ Tiến sĩ Nguyễn Trường Sơn, Giám đốc Khoa học của Zalo AI: “Chúng tôi biết rõ mình bắt đầu muộn và gặp nhiều bất lợi, nhưng Zalo đã chọn tham gia sớm vào cuộc đua AI để xây dựng một mô hình trí tuệ nhân tạo riêng cho Việt Nam. Chúng tôi học hỏi từ các chuyên gia quốc tế, đồng thời điều chỉnh chiến lược phù hợp với điều kiện trong nước. Những thành quả hiện tại là động lực để tiếp tục mở rộng mô hình về quy mô và nâng cao chất lượng, hướng tới tạo ra các ứng dụng AI hữu ích cho người dùng Việt.”
Không chỉ dừng lại ở nghiên cứu, Zalo đã sớm đưa mô hình LLM vào thực tế với nhiều sản phẩm ứng dụng hiệu quả. Đầu năm 2025, Zalo ra mắt trợ lý ảo Kiki Info dưới dạng Official Account (OA) trên nền tảng nhắn tin, hỗ trợ người dùng trong các chủ đề hỏi đáp, sáng tạo nội dung và giải trí. Chỉ trong chưa đầy hai tháng, Kiki Info đã thu hút hơn một triệu lượt truy cập.
Một ứng dụng khác là thiệp AI, cho phép người dùng tạo và gửi thiệp chúc mừng với nội dung sáng tạo nhờ AI. Chỉ sau hai tháng triển khai, đã có hơn 15 triệu thiệp được gửi qua nền tảng Zalo, phản ánh sự quan tâm lớn từ cộng đồng.
Nỗ lực của Zalo còn gắn liền với các chính sách quốc gia như Nghị quyết 57-NQ/TW về phát triển khoa học công nghệ và Nghị định 147/2024/NĐ-CP về xây dựng không gian mạng xã hội an toàn, minh bạch. Những chính sách này đã tạo môi trường thuận lợi để Zalo tiếp tục phát huy vai trò tiên phong trong công cuộc chuyển đổi số quốc gia.
Với chiến lược “AI-First”, Zalo đang tích cực phổ biến trí tuệ nhân tạo đến gần hơn với cuộc sống. Hiện có khoảng 23% người dùng Zalo thường xuyên sử dụng các tính năng liên quan đến AI, cho thấy tầm ảnh hưởng ngày càng rõ rệt của công nghệ này đối với người dân Việt Nam.