Bằng nỗ lực xây dựng LLM tiếng Việt từ con số 0, Zalo không chỉ tạo dấu ấn công nghệ mà còn góp phần khẳng định vị thế Việt Nam trên bản đồ trí tuệ nhân tạo toàn cầu.
Zalo theo đuổi hướng đi độc lập trong cuộc đua LLM toàn cầu
Khi nhiều doanh nghiệp Việt Nam lựa chọn tinh chỉnh các mô hình ngôn ngữ lớn (LLM) có sẵn từ nước ngoài để rút ngắn thời gian và tiết kiệm chi phí phát triển, Zalo lại quyết định chọn một lộ trình đầy thách thức hơn: tự xây dựng mô hình từ đầu (from scratch). Đây không phải là hành động nhằm cạnh tranh trực tiếp với các ông lớn công nghệ quốc tế, mà là minh chứng cho khát vọng làm chủ công nghệ bằng tiếng mẹ đẻ và khẳng định năng lực nội tại của đội ngũ kỹ sư Việt.
Chông gai trên con đường tự huấn luyện mô hình tiếng Việt
Sự bùng nổ của trí tuệ nhân tạo tạo sinh (Generative AI) từ sau khi ChatGPT xuất hiện vào cuối năm 2022 đã làm thay đổi cục diện ngành công nghệ toàn cầu. Trong bối cảnh các tập đoàn như OpenAI, Google, Meta hay Microsoft đầu tư hàng tỷ USD để phát triển LLM trên nền tảng hạ tầng mạnh mẽ với GPU cao cấp như Nvidia H100, các doanh nghiệp công nghệ ở quốc gia đang phát triển như Việt Nam phải đối mặt với thách thức lớn về chi phí, thiết bị và năng lực kỹ thuật.
Zalo, với lựa chọn tự huấn luyện mô hình từ đầu, đã đối diện nhiều khó khăn. Trước hết là việc thu thập và xử lý dữ liệu tiếng Việt đủ lớn để đào tạo mô hình có chất lượng. Ngoài ra, việc tiếp cận các thiết bị GPU tiên tiến như H100 cũng là một thử thách không nhỏ trong bối cảnh khan hiếm toàn cầu và bị hạn chế bởi chính sách xuất khẩu.
Linh hoạt, kiên trì và đặt người Việt làm trọng tâm
Trong giai đoạn chưa thể tiếp cận được hệ thống máy chủ mạnh, các kỹ sư Zalo đã tận dụng GPU dân dụng để thử nghiệm mô hình nhỏ, kiểm chứng từng dòng mã. Nhờ đó, đến khi hệ thống chính thức được bàn giao, mọi khâu chuẩn bị đều đã sẵn sàng cho việc đào tạo ở quy mô lớn.
Về dữ liệu, thay vì phụ thuộc vào nguồn bên ngoài, Zalo chủ động xây dựng kho văn bản tiếng Việt chất lượng cao – yếu tố nền tảng giúp huấn luyện LLM phản ánh chính xác ngôn ngữ và văn hóa Việt. Theo Tiến sĩ Nguyễn Trường Sơn – Giám đốc Khoa học của Zalo AI, định hướng của đội ngũ không nằm ở việc đối đầu với các ông lớn, mà là làm tốt nhất trong thị trường ngách: phát triển mô hình tiếng Việt do người Việt làm chủ.

Bước ngoặt mang tên Zalo LLM
Nhờ chiến lược linh hoạt và nỗ lực không ngừng, Zalo đã rút ngắn thời gian phát triển mô hình từ 18 tháng dự kiến xuống chỉ còn 6 tháng. Cuối năm 2023, mô hình LLM tiếng Việt đầu tiên do Zalo phát triển đã ra mắt tại sự kiện Zalo AI Summit, nhận được sự đánh giá cao từ cộng đồng công nghệ. Trong thử nghiệm thực tế, mô hình vượt qua GPT-3.5 và chỉ xếp sau GPT-4 – một kết quả cho thấy sự tiến bộ đáng kể của đội ngũ kỹ sư Việt.
Trên bảng xếp hạng VMLU – một chuẩn đánh giá dành riêng cho khả năng hiểu ngôn ngữ tiếng Việt, mô hình của Zalo không chỉ vượt GPT-3.5 mà còn vượt qua GPT-4, Gemma-2-9B của Google và Phi-3-small của Microsoft, chỉ đứng sau LLaMA-3-70B của Meta.
Đưa AI từ nghiên cứu đến đời sống
Không dừng lại ở phòng thí nghiệm, Zalo đã nhanh chóng thương mại hóa và đưa công nghệ vào ứng dụng thực tế. Trợ lý hỏi đáp tổng hợp Kiki Info – hoạt động trên nền tảng Zalo – đã thu hút hơn 1 triệu người dùng chỉ trong chưa đầy hai tháng. Trong khi đó, ứng dụng tạo thiệp Thiệp AI đã ghi nhận tới 15 triệu lượt sử dụng trong cùng thời gian.
Đây không chỉ là thành quả của một doanh nghiệp mà còn là bước đi khẳng định khả năng của Việt Nam trong lĩnh vực công nghệ tiên tiến. Cùng với các chính sách đổi mới sáng tạo được nêu rõ trong các văn kiện cấp cao như Nghị quyết 57-NQ/TW, thành công của Zalo góp phần đưa trí tuệ nhân tạo vào trung tâm chiến lược phát triển quốc gia.
Từ Zalo đến kỳ vọng AI Việt rộng lớn hơn
Lựa chọn con đường từ gốc rễ – từ kiến trúc mô hình đến dữ liệu và thuật toán – Zalo đang góp phần xây dựng một nền tảng AI thuần Việt thực sự. Đây là bước đi dài hạn, giúp Việt Nam không chỉ làm chủ công nghệ, mà còn tạo ra những sản phẩm phục vụ thiết thực cho người dùng trong nước.
Như chia sẻ của ông Sơn, hành trình phát triển LLM của Zalo vẫn chưa dừng lại. Doanh nghiệp này tiếp tục tối ưu mô hình theo cả chiều sâu (về năng lực) và chiều rộng (về ứng dụng), hướng tới mục tiêu xây dựng hệ sinh thái AI Việt có chất lượng cạnh tranh quốc tế.
Sự thành công của Zalo hôm nay là động lực để một thế hệ kỹ sư công nghệ mới tại Việt Nam tiếp bước, đóng góp vào hành trình khẳng định vị thế của trí tuệ nhân tạo Việt Nam trên bản đồ thế giới.