Báo cáo VMLU của Zalo AI ghi nhận sự phát triển mạnh mẽ của mô hình ngôn ngữ lớn tiếng Việt trong năm 2024, với sự tham gia của nhiều tổ chức và cá nhân trong nước và quốc tế, khẳng định vị thế của Việt Nam trong lĩnh vực AI.
Zalo AI vừa công bố báo cáo tổng hợp tình hình phát triển các mô hình ngôn ngữ lớn (LLM) tiếng Việt trong năm 2024. Báo cáo dựa trên bộ tiêu chuẩn đánh giá VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models), cung cấp bảng xếp hạng chi tiết năng lực của các mô hình ngôn ngữ lớn theo nhiều lĩnh vực: tổng quát, STEM, khoa học xã hội, nhân văn và mở rộng.

Nở rộ các mô hình ngôn ngữ lớn tại Việt Nam
Năm 2024 đánh dấu sự bùng nổ mạnh mẽ của cộng đồng nghiên cứu AI tại Việt Nam với sự ra đời của 45 mô hình ngôn ngữ lớn được ghi nhận trên bảng xếp hạng VMLU. Nền tảng này đã thu hút hơn 155 tổ chức và cá nhân tham gia, tổng cộng 3.729 lượt đánh giá và 691 lần tải bộ tiêu chuẩn. Đây là minh chứng cho sự quan tâm ngày càng cao đối với AI tạo sinh tại Việt Nam, mặc dù lĩnh vực này vẫn đối mặt với nhiều thách thức như thiếu hụt dữ liệu và nguồn lực kỹ thuật.
Đáng chú ý, bên cạnh các tổ chức trong nước, nhiều đơn vị quốc tế cũng tham gia tối ưu mô hình LLM cho tiếng Việt, điển hình như nhóm nghiên cứu từ Trường ĐH Oregon (Hoa Kỳ), DAMO Academy – Alibaba Group (Trung Quốc), và Samsung SDSRV Teams. Song song đó, các nhóm nghiên cứu từ các trường đại học tại Việt Nam như ML4U (ĐH Bách khoa TP.HCM) và FPTU HCM (ĐH FPT TP.HCM) cũng để lại dấu ấn đáng kể.
Cạnh tranh trực tiếp với các “ông lớn” toàn cầu
Nhiều mô hình LLM do người Việt tự huấn luyện đã đạt thành tích ấn tượng, sánh ngang với những sản phẩm từ các tập đoàn lớn như GPT-4 (OpenAI) hay Llama-3-70B (Meta). Trong đó, KiLM-13b-v24.7.1 của Zalo AI xếp thứ hai trong danh sách các mô hình xây dựng từ đầu (from-scratch models) với điểm trung bình 66,07, chỉ kém Llama-3-70B (66,44 điểm). Một mô hình khác, ViGPT-1.6B-v1 của VinBigData, cũng lọt vào Top 10, đứng vị trí thứ tám.
Với các mô hình tinh chỉnh (fine-tuned models), 9/10 vị trí đầu tiên thuộc về các đơn vị trong nước. Điều này phản ánh xu hướng sử dụng các mô hình mở để tinh chỉnh và bản địa hóa theo dữ liệu tiếng Việt, mở ra tiềm năng phát triển các ứng dụng AI phục vụ người dùng trong nước.
VMLU – Công cụ đắc lực cho cộng đồng AI Việt Nam
Ra mắt vào cuối năm 2023, VMLU cung cấp bộ dữ liệu và tiêu chuẩn kiểm tra toàn diện với 10.880 câu hỏi thuộc 58 chủ đề trong các lĩnh vực STEM, khoa học xã hội, nhân văn và mở rộng. Các câu hỏi được thiết kế theo bốn cấp độ từ tiểu học đến sau đại học, giúp đánh giá toàn diện năng lực của mô hình ngôn ngữ lớn.
Nền tảng VMLU không chỉ là công cụ đo lường mà còn là động lực thúc đẩy các nhóm nghiên cứu cải thiện chất lượng mô hình. Tiến sĩ Đặng Trần Thái, đại diện VinBigData, chia sẻ: “VMLU giúp chúng tôi kiểm tra hiệu quả của các thử nghiệm và cải tiến trong suốt quá trình huấn luyện. Đây là thước đo cần thiết để tạo ra các mô hình chất lượng cao hơn.”
Hướng tới tương lai bền vững của AI Việt Nam
Nhìn về tương lai, Giáo sư Nguyễn Lê Minh từ Viện JAIST nhận định xu hướng chính trong phát triển LLM tại Việt Nam sẽ tập trung vào việc tối ưu hóa các mô hình mở như Llama. Tuy nhiên, một số nhóm nghiên cứu vẫn tiếp tục tự xây dựng mô hình riêng để đáp ứng các nhu cầu chuyên biệt.

TS. Châu Thành Đức, đại diện Zalo AI, khẳng định: “Chúng tôi sẽ không ngừng cải tiến bộ tiêu chuẩn VMLU để hỗ trợ cộng đồng AI Việt Nam. Mục tiêu của Zalo AI là tạo nền tảng vững chắc cho sự phát triển của AI ứng dụng, mang lại giá trị thực tiễn cho người dùng Việt.”
Hiện tại, VMLU vẫn được cung cấp miễn phí và là công cụ hỗ trợ đắc lực cho các nhà phát triển LLM trong và ngoài nước. Thông tin chi tiết và hướng dẫn sử dụng VMLU có thể tham khảo trên trang chính thức của Zalo AI.


