Mới đây, Zalo AI đã công bố Báo cáo tình hình phát triển các mô hình ngôn ngữ lớn (Large Language Model – LLM) tiếng Việt trong năm 2024 dựa trên nền tảng đánh giá và xếp hạng năng lực tiếng Việt VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models).
Bảng xếp hạng mô hình ngôn ngữ lớn tiếng Việt (VMLU Leaderboard) tính đến ngày 31/12/2024 dựa trên điểm số về năng lực ở các lĩnh vực: tổng quát, STEM, khoa học xã hội, khoa học nhân văn và mở rộng.
Báo cáo của Zalo AI ghi nhận sự phát triển mạnh mẽ của các mô hình ngôn ngữ lớn hướng đến người dùng Việt Nam. Cụ thể trong năm 2024, VMLU công bố 45 LLM trên bảng xếp hạng, tiếp nhận yêu cầu đánh giá của hơn 155 tổ chức & cá nhân, tổng kết 691 lượt tải bộ tiêu chuẩn đánh giá và 3.729 lượt đánh giá LLM từ nền tảng.
Tuy số lượng còn hạn chế, nhiều mô hình LLM do người Việt tự huấn luyện đã bứt phá đạt vị trí cao trong bảng xếp hạng VMLU Leaderboard, trực tiếp cạnh tranh với những mô hình của các “ông lớn” như Llama-3-70B (Meta), GPT-4 (OpenAI) hay gemini (Google).
Cụ thể, KiLM-13b-v24.7.1 được phát triển bởi Zalo AI vươn lên vị trí số 2 from-scratch models (mô hình được huấn luyện từ đầu) với số điểm tổng quát trung bình 66,07 – xếp sau mô hình Llama-3-70B đang đứng đầu bảng với 66,44 điểm. Một mô hình khác của người Việt là ViGPT-1.6B-v1 (thuộc Vin BigData) cũng nằm trong Top 10 from-scratch models, xếp ở vị trí thứ 8.
VMLU là một dự án đóng góp cho cộng đồng mà Zalo AI mong muốn thúc đẩy nhằm tạo động lực cho các đơn vị nâng cao trình độ huấn luyện LLM, cũng như cho ra đời các sản phẩm AI đa dạng, phục vụ nhu cầu thực tiễn của cuộc sống.