
Một trong những startup AI nổi bật nhất châu Âu vừa ra mắt hai mô hình AI cực nhỏ, đến mức họ đặt tên chúng là “não gà” và “não ruồi”.
Multiverse Computing tuyên bố đây là những mô hình nhỏ nhất thế giới nhưng vẫn đạt hiệu suất cao, có thể xử lý chat, giọng nói và thậm chí khả năng suy luận trong một số trường hợp.
Các mô hình nhỏ mới này được thiết kế để tích hợp vào các thiết bị Internet of Things (Vạn vật kết nối – IoT), cũng như chạy trực tiếp trên điện thoại thông minh, máy tính bảng và PC.
“Chúng tôi có thể nén mô hình đến mức nó vừa vặn trên thiết bị,” nhà sáng lập Román Orús nói với TechCrunch. “Bạn có thể chạy trực tiếp tại chỗ, ngay trên iPhone hoặc Apple Watch của mình.”
Multiverse Computing là một startup AI nổi bật tại châu Âu, có trụ sở tại Donostia, Tây Ban Nha, với khoảng 100 nhân viên tại các văn phòng trên toàn cầu. Công ty được đồng sáng lập bởi giáo sư hàng đầu châu Âu về máy tính lượng tử và vật lý Román Orús; chuyên gia máy tính lượng tử Samuel Mugel; và Enrique Lizaso Olmos, cựu phó CEO của Unnim Banc.
Tháng Sáu vừa qua, công ty đã huy động được 189 triệu euro (khoảng 215 triệu USD) dựa trên công nghệ nén mô hình mà họ gọi là “CompactifAI.” Kể từ khi thành lập năm 2019, công ty đã huy động khoảng 250 triệu USD, theo Orús.
CompactifAI là một thuật toán nén lấy cảm hứng từ lượng tử, giúp giảm kích thước các mô hình AI hiện có mà không làm giảm hiệu suất, theo Orús.
“Chúng tôi có công nghệ nén không phải loại nén thông thường mà các chuyên gia khoa học máy tính hay học máy thường dùng, bởi chúng tôi xuất phát từ vật lý lượng tử,” ông mô tả. “Đây là một thuật toán nén tinh tế và tinh chỉnh hơn.”
Công ty đã phát hành nhiều phiên bản nén của các mô hình mã nguồn mở, đặc biệt là các mô hình nhỏ phổ biến như Llama 4 Scout hay Mistral Small 3.1. Họ cũng vừa ra mắt phiên bản nén của hai mô hình mở mới của OpenAI và đã nén một số mô hình rất lớn — ví dụ như DeepSeek R1 Slim.
Nhưng vì tập trung vào việc làm mô hình nhỏ hơn, họ đặc biệt chú trọng tạo ra những mô hình nhỏ nhất nhưng mạnh mẽ nhất có thể.
Hai mô hình mới của công ty nhỏ đến mức có thể mang khả năng AI chat đến hầu hết các thiết bị IoT và hoạt động mà không cần kết nối internet, theo Multiverse. Họ hài hước gọi dòng sản phẩm này là Model Zoo vì đặt tên dựa trên kích thước não động vật.
Một mô hình có tên SuperFly là phiên bản nén của mô hình mã nguồn mở SmolLM2-135 của Hugging Face. Phiên bản gốc có 135 triệu tham số và được phát triển cho các thiết bị. SuperFly có 94 triệu tham số, mà Orús ví như kích thước não của một con ruồi. “Cái này như một con ruồi, nhưng thông minh hơn một chút,” ông nói.
SuperFly được thiết kế để huấn luyện trên dữ liệu rất hạn chế, như các hoạt động của thiết bị. Multiverse hình dung nó sẽ tích hợp vào các thiết bị gia dụng, cho phép người dùng điều khiển bằng lệnh giọng nói như “bắt đầu giặt nhanh” cho máy giặt, hoặc đặt câu hỏi xử lý sự cố. Với một chút sức mạnh xử lý (như Arduino), mô hình có thể xử lý giao diện giọng nói, như công ty đã trình diễn trong buổi demo trực tiếp với TechCrunch.
Mô hình còn lại được đặt tên ChickBrain, lớn hơn với 3,2 tỷ tham số, nhưng cũng mạnh hơn nhiều và có khả năng suy luận. Đây là phiên bản nén của mô hình Llama 3.1 8B của Meta, theo Multiverse. Tuy nhiên, nó đủ nhỏ để chạy trên MacBook mà không cần kết nối internet.
Quan trọng hơn, Orús cho biết ChickBrain thực tế còn nhỉnh hơn phiên bản gốc trong một số bài kiểm tra chuẩn, bao gồm kiểm tra kỹ năng ngôn ngữ MMLU-Pro, kiểm tra kỹ năng toán Math 500 và GSM8K, và kiểm tra kiến thức chung GPQA Diamond.
Công ty không công bố kết quả kiểm tra của SuperFly vì SuperFly không được nhắm đến các trường hợp cần suy luận.
Cần lưu ý rằng Multiverse không khẳng định Model Zoo của họ sẽ vượt các mô hình lớn nhất hiện đại trên các bài kiểm tra này. Hiệu suất của Zoo có thể thậm chí không nằm trong bảng xếp hạng. Điểm mấu chốt là công nghệ của họ có thể thu nhỏ mô hình mà không làm giảm hiệu suất.
Orús cho biết công ty đang trao đổi với tất cả các nhà sản xuất thiết bị và đồ gia dụng hàng đầu. “Chúng tôi đang nói chuyện với Apple. Chúng tôi cũng đang trao đổi với Samsung, Sony và HP. HP đã tham gia vòng đầu tư trước đó,” ông nói. Vòng huy động lần này do quỹ đầu tư mạo hiểm châu Âu nổi tiếng Bullhound Capital dẫn đầu, với sự tham gia của nhiều đối tác khác, bao gồm HP Tech Ventures và Toshiba.
Startup này cũng cung cấp công nghệ nén cho các hình thức học máy khác, như nhận dạng hình ảnh, và trong sáu năm qua đã có các khách hàng như BASF, Ally, Moody’s, Bosch và nhiều công ty khác.
Ngoài việc bán trực tiếp mô hình cho các nhà sản xuất thiết bị lớn, Multiverse còn cung cấp mô hình nén qua giao diện lập trình ứng dụng (API) được lưu trữ trên Amazon Web Services, mà bất kỳ nhà phát triển nào cũng có thể sử dụng, thường với chi phí token thấp hơn đối thủ.
Chữ AI (Trí tuệ nhân tạo) và bàn tay robot được đặt trên bo mạch chủ máy tính trong minh họa. Ảnh: Reuters