Meta – công ty mẹ của Facebook và Instagram đang nổi lên như một “tay chơi” đáng gờm trong lĩnh vực AI mã nguồn mở nhờ dòng mô hình ngôn ngữ Llama. Từ phiên bản đầu tiên năm 2023 đến Llama 2 và Llama 3 gần đây, Meta liên tục khẳng định định hướng mở, cung cấp miễn phí cho cả nghiên cứu và thương mại. Điều này mở ra cơ hội để cộng đồng phát triển, tổ chức và cá nhân cùng khai thác, cải tiến, tạo nên một hệ sinh thái AI sôi động. Trong bài viết này, cùng Cốc Cốc tìm hiểu Llama 2 và Llama 3, điểm khác biệt và ứng dụng thực tiễn dành cho bạn đọc phổ thông.
Nội dung chính
Llama 2: Mô hình ngôn ngữ mở thế hệ mới của Meta
Ra mắt tháng 7/2023 với sự hợp tác của Microsoft, Llama 2 nhanh chóng trở thành tâm điểm trong giới AI. Thay vì giữ kín mô hình như nhiều đối thủ, Meta chọn cách phát hành miễn phí và mã nguồn mở, cho phép sử dụng trong cả nghiên cứu và thương mại. Theo Mark Zuckerberg, cách tiếp cận “mở” giúp thúc đẩy đổi mới, tăng tốc thử nghiệm và cải thiện độ an toàn nhờ sự đóng góp của cộng đồng toàn cầu.

Về kỹ thuật, Llama 2 là phiên bản nâng cấp toàn diện so với thế hệ đầu. Mô hình có hai dòng chính: Llama 2 nền tảng và Llama 2-Chat (tối ưu hội thoại), với ba quy mô 7B, 13B và 70B tham số. Meta đã huấn luyện trên khoảng 2 nghìn tỷ token, mở rộng cửa sổ ngữ cảnh lên 4.096 token và thêm hơn 1 triệu mẫu hội thoại được chú thích thủ công, giúp cải thiện khả năng đối thoại và giảm lỗi rõ rệt.
Điểm nổi bật của Llama 2 là tính linh hoạt cao: người dùng có thể tải trọng số, tùy chỉnh và triển khai trên nhiều nền tảng như Azure, AWS, Hugging Face. Meta còn hợp tác với Qualcomm để tối ưu cho thiết bị di động, mở ra tương lai AI hoạt động trực tiếp trên smartphone.

Llama Chat được xây dựng từ Llama 2, huấn luyện trên dữ liệu công khai, sau đó tinh chỉnh có giám sát và tiếp tục cải thiện nhờ phản hồi con người (RLHF) để mô hình ngày càng chính xác và tự nhiên hơn.
Llama 3 – Bước tiến mới và những cải tiến nổi bật
Tháng 4/2024, Meta ra mắt Llama 3, được xem là mô hình AI mạnh mẽ nhất của hãng tại thời điểm đó. Tiếp nối tinh thần mã nguồn mở từ Llama 2, Llama 3 mang đến hàng loạt nâng cấp về dữ liệu, kiến trúc và hiệu suất. Mô hình được huấn luyện trên 15 nghìn tỷ token – gấp 7 lần Llama 2 – với dữ liệu đa ngôn ngữ và lượng mẫu code lớn, giúp cải thiện khả năng xử lý văn bản, hội thoại và lập trình. Cửa sổ ngữ cảnh cũng mở rộng lên 8.000 token, hỗ trợ tốt hơn các đoạn văn dài.
Về kỹ thuật, Meta áp dụng Grouped Query Attention, bộ tokenizer mới với 128.000 từ vựng và tối ưu hóa để chạy hiệu quả trên cả GPU phổ thông. Nhờ đó, Llama 3 vượt trội trên nhiều benchmark, thậm chí bản 70B còn vượt Claude 3 và Gemini Pro, trong khi bản 8B cũng nhỉnh hơn Mistral 7B.
Không chỉ mạnh mẽ, Llama 3 còn được tích hợp trực tiếp vào Messenger, Instagram, WhatsApp dưới dạng trợ lý Meta AI, đưa công nghệ này đến hàng tỷ người dùng. Meta cũng ưu tiên an toàn với các công cụ như Llama Guard 2 và Code Shield, đồng thời hé lộ kế hoạch phát triển phiên bản siêu lớn 405B tham số trong tương lai.

Meta Llama: Chiến lược AI mã nguồn mở của Meta
Việc ra mắt Llama 2 và Llama 3 không chỉ là nâng cấp công nghệ mà còn nằm trong chiến lược dài hạn của Meta về AI mã nguồn mở. Trái với OpenAI hay Google giữ kín mô hình, Meta tin rằng “cởi mở” sẽ thúc đẩy đổi mới nhanh hơn và an toàn hơn. Khi cộng đồng cùng tham gia thử nghiệm và cải tiến, các lỗ hổng dễ dàng được phát hiện, đồng thời sinh ra nhiều ứng dụng sáng tạo như Alpaca hay Vicuna – những biến thể được fine-tune từ Llama để trò chuyện tự nhiên hơn.

Chỉ trong hai năm, Llama đã đạt hơn 1 tỷ lượt tải, được sử dụng bởi doanh nghiệp, trường đại học, thậm chí cơ quan nhà nước trên khắp thế giới. Nhờ đó, Meta không chỉ cạnh tranh bằng mô hình AI mà còn xây dựng cả một hệ sinh thái mở với sự tham gia của cộng đồng. Các đối tác lớn như Microsoft, Amazon cũng nhanh chóng tích hợp Llama vào dịch vụ đám mây, củng cố thêm vị thế Meta.
Dù việc “mở” khiến Meta đánh đổi lợi thế độc quyền và tiềm ẩn nguy cơ lạm dụng, công ty vẫn kiên định rằng lợi ích lâu dài vượt xa rủi ro. Thậm chí, chiến lược này đã tạo áp lực buộc các ông lớn khác cũng phải nghiêng về hướng AI mở – nơi Meta đóng vai trò tiên phong.
So sánh Llama 2 và Llama 3
| Tiêu chí | Llama 2 | Llama 3 |
| Thời điểm ra mắt | Tháng 7/2023 | Tháng 4/2024 (sau ~9 tháng) |
| Vai trò | Bước ngoặt đưa Meta vào AI mã nguồn mở | Kế thừa, nâng cấp, nhiều cải tiến mạnh mẽ |
| Quy mô mô hình | 7B, 13B, 70B tham số (bản nền tảng + Chat) | 8B, 70B tham số (bản nền tảng + Instruct); đang phát triển bản 405B |
| Kiến trúc | Transformer decoder, context 4.096 token, tokenizer ~32k từ vựng | Transformer decoder, context 8.192 token, tokenizer mới (Tiktoken) 128k từ vựng |
| Dữ liệu huấn luyện | ~2 nghìn tỷ token, chủ yếu tiếng Anh | ~15 nghìn tỷ token (gấp 7 lần), 30 ngôn ngữ, dữ liệu code gấp 4 lần |
| Hiệu suất | Mạnh, dùng cho nhiều ứng dụng AI | Vượt trội hơn hẳn trên benchmark (ngôn ngữ, suy luận, toán học, code, sáng tạo nội dung) |
| Khả năng hội thoại | Chat tự nhiên (Llama 2-Chat), nhưng đôi khi từ chối quá mức | Trả lời mượt mà, ít từ chối vô cớ, thân thiện hơn với câu hỏi nhạy cảm |
| Ứng dụng chính | Chủ yếu cộng đồng lập trình viên, doanh nghiệp tích hợp riêng (chatbot, dịch, phân tích dữ liệu…) | Ngoài cộng đồng, được tích hợp trực tiếp vào Messenger, Instagram, WhatsApp qua Meta AI |
| Tính mở giấy phép | Mã nguồn mở, cho phép dùng thương mại (giới hạn quy mô người dùng) | Tiếp tục mã nguồn mở, bổ sung công cụ an toàn: Llama Guard 2, Code Shield, Cybersec Eval… |
Tóm lại, Llama 2 và Llama 3 không chỉ là hai thế hệ mô hình ngôn ngữ lớn của Meta, mà còn là minh chứng rõ ràng cho triết lý AI mã nguồn mở mà công ty theo đuổi. Cốc Cốc hy vọng thông tin bài viết hữu ích với bạn đọc.