
Việc Meta vừa công bố lộ trình dòng mô hình ngôn ngữ lớn (LLM) Llama tại LlamaCon 2025 (được tổ chức ngày 29 tháng 4 năm 2025 tại trụ sở Meta ở Menlo Park, California) vẽ nên một viễn cảnh hấp dẫn: mã nguồn mở không chỉ là lựa chọn ưu tiên, mà chính là động cơ thúc đẩy tương lai AI.
Nếu tầm nhìn của Meta thành hiện thực, chúng ta sẽ không chỉ chứng kiến những cải tiến từng bước, mà là một sóng thần AI, được dẫn dắt bởi hợp tác và tính dễ tiếp cận, đe dọa xóa sổ các mô hình AI độc quyền kiểu “kín cổng cao tường (walled gardens)”.
Llama 4: nhanh hơn, đa ngôn ngữ, ngữ cảnh khổng lồ
Tiêu điểm chính là Llama 4, hứa hẹn một bước nhảy vọt về năng lực. Tốc độ là ưu tiên hàng đầu, và Meta khẳng định mô hình được tăng tốc mạnh mẽ, giúp tương tác trở nên mượt mà hơn. Điểm đột phá thực sự là khả năng đa ngôn ngữ, với độ thông thạo lên tới 200 thứ tiếng.
Hãy tưởng tượng một thế giới nơi rào cản ngôn ngữ trong tương tác với AI chỉ còn là chuyện lịch sử. Mức độ bao trùm này có thể phổ cập quyền truy cập AI trên quy mô toàn cầu, kết nối mọi người bất kể tiếng mẹ đẻ.
Hơn nữa, Llama 4 sẽ giải quyết một trong những thách thức dai dẳng của LLM: giới hạn ngữ cảnh. Khả năng xử lý lượng thông tin khổng lồ là then chốt cho các tác vụ phức tạp, và Meta cho biết Llama 4 có thể có cửa sổ ngữ cảnh (context window) rộng bằng toàn bộ mã số thuế của Hoa Kỳ — nghe thật khó tin. “Cửa sổ ngữ cảnh” là độ dài chuỗi đầu vào (tính theo số token) mà mô hình có thể “nhìn thấy” và sử dụng để tạo câu trả lời.
Hãy hình dung tiềm năng của việc hiểu biết sâu sắc và phân tích toàn diện. Vấn đề “mò kim đáy bể (needle in a haystack)” — truy xuất thông tin cụ thể từ văn bản lớn — cũng được cải thiện đáng kể, và Meta đang tập trung để tối ưu hiệu quả hơn nữa. Khả năng xử lý và ghi nhớ thông tin chính xác này sẽ rất quan trọng cho ứng dụng thực tiễn.
Khả năng mở rộng trên mọi phần cứng
Chiến lược của Meta không chỉ là xây dựng các mô hình khổng lồ, mà còn là cho phép tiếp cận AI trên nhiều loại phần cứng.
Dòng Llama 4 được thiết kế để mở rộng. “Scout” — biến thể nhỏ nhất — được cho là chạy được trên một GPU Nvidia H100, giúp các AI mạnh mẽ trở nên dễ tiếp cận hơn với các nhà nghiên cứu cá nhân và tổ chức nhỏ.
“Maverick” — mô hình cỡ trung — cũng hoạt động trên một GPU duy nhất, cân bằng giữa sức mạnh và khả năng tiếp cận. Trong khi “Behemoth” (Khổng lồ) hiển nhiên sẽ là một công trình lớn, việc Meta nhấn mạnh các mô hình nhỏ gọn nhưng mạnh mẽ cho thấy cách tiếp cận thực dụng nhằm thúc đẩy việc áp dụng rộng rãi.
Điều quan trọng là Meta tự hào về chi phí trên mỗi token rất thấp và hiệu năng vượt trội, trực tiếp giải quyết rào cản kinh tế trong việc ứng dụng AI.
Tầm ảnh hưởng của Llama vượt ra ngoài ranh giới Trái Đất. Việc triển khai Llama trên Trạm Vũ trụ Quốc tế—cung cấp các câu trả lời quan trọng mà không cần kết nối trực tiếp với Trái Đất—cho thấy mô hình này vô cùng mạnh mẽ và đáng tin cậy trong những điều kiện khắc nghiệt.
AI mã nguồn mở, chi phí thấp cho người dùng
Meta hướng tới việc làm cho Llama nhanh, tiết kiệm và mã nguồn mở—trao quyền kiểm soát dữ liệu và tương lai AI cho người dùng. Việc ra mắt API cải thiện khả năng sử dụng là bước tiến lớn, hạ thấp rào cản cho lập trình viên. API của Llama 4 hứa hẹn trải nghiệm thân thiện, cho phép người dùng tải lên dữ liệu huấn luyện, nhận cập nhật trạng thái và tạo mô hình tinh chỉnh riêng để chạy trên nền tảng AI yêu thích.
Việc áp dụng giải mã suy đoán (speculative decoding) được cho là tăng tốc độ tạo token lên khoảng 1,5 lần, giúp mô hình hiệu quả hơn. Bởi Llama là mã nguồn mở, cộng đồng AI toàn cầu đang tích cực đóng góp tối ưu hóa, với các công ty như Cerebras và Groq phát triển các cải tiến phần cứng riêng.
Theo Meta, tương lai của AI ngày càng mang tính thị giác. Sự ra mắt Locate 3D—công cụ xác định vật thể từ truy vấn văn bản—và tiếp tục phát triển Segment Anything Model (SAM)—công cụ một nhấp để phân đoạn, nhận dạng và theo dõi vật thể—đánh dấu bước chuyển sang AI có thể thực sự “nhìn thấy” và hiểu thế giới. SAM 3, dự kiến ra mắt mùa hè này trên Amazon Web Services, hứa hẹn hiểu biết thị giác nâng cao, ví dụ như tự động xác định tất cả ổ gà trong một thành phố, mở ra tiềm năng AI giải quyết thách thức đô thị.
Lợi thế mã nguồn mở và thách thức tương lai
Ali Ghodsi, Tổng Giám đốc của Databricks, nhấn mạnh niềm tin của Databricks vào mã nguồn mở, vì nó thúc đẩy đổi mới, giảm chi phí và tăng tốc áp dụng. Ông cũng ca ngợi thành công ngày càng tăng của các mô hình nhỏ gọn, tinh giản nhưng không kém cạnh tranh về hiệu năng. Việc dự kiến ra mắt “Little Llama”—phiên bản nhỏ hơn cả Scout—càng chứng tỏ đà phát triển mạnh mẽ của xu hướng này.
Nhìn về tương lai, trọng tâm sẽ chuyển sang chưng cất mô hình an toàn và bảo mật—đảm bảo các mô hình nhỏ không mang theo lỗ hổng của phiên bản lớn. Các công cụ như Llama Guard là bước đầu ứng phó rủi ro, nhưng cần thêm nỗ lực để duy trì chất lượng và bảo mật trên loạt mô hình ngày càng đa dạng. Một mối quan ngại mới là tính khách quan: mô hình mở có thể gợi ý sản phẩm của đối thủ nếu nó phù hợp nhất, dẫn đến AI trung thực và lấy người dùng làm trọng tâm.
Lộ trình Llama 2025 của Meta báo hiệu bước chuyển quyết liệt: mã nguồn mở sẽ là mô hình chủ đạo trong phát triển AI. Với mô hình nhanh hơn, đa ngôn ngữ, tập trung vào tính dễ tiếp cận trên nhiều phần cứng và cam kết trao quyền người dùng, Meta đang kích hoạt sóng thần AI hứa hẹn phổ cập công nghệ và thúc đẩy đổi mới chưa từng có trên khắp các ngành.
Llama sẽ tạo một làn sóng thay đổi trong lĩnh vực trí tuệ nhân tạo. Ảnh: Tech News World