
OpenAI hôm thứ Ba cho biết họ đã phát hành hai mô hình ngôn ngữ dạng mở (open-weight) vượt trội trong khả năng suy luận nâng cao và được tối ưu để chạy trên máy tính xách tay, với hiệu suất tương đương các mô hình suy luận nhỏ độc quyền của hãng.
Mô hình ngôn ngữ dạng mở là mô hình có trọng số (tham số huấn luyện) được công khai, cho phép các nhà phát triển phân tích và tinh chỉnh mô hình cho các tác vụ cụ thể mà không cần dữ liệu huấn luyện gốc.
“Một điều đặc biệt ở các mô hình dạng mở là mọi người có thể chạy chúng cục bộ, sau tường lửa riêng của mình, trên hạ tầng của chính mình,” đồng sáng lập OpenAI Greg Brockman phát biểu tại một buổi họp báo.
Các mô hình ngôn ngữ dạng mở khác với mô hình mã nguồn mở (open-source), vốn cung cấp toàn bộ mã nguồn, dữ liệu huấn luyện và phương pháp huấn luyện.
Ngoài ra, Amazon cũng thông báo rằng các mô hình dạng mở của OpenAI hiện đã có mặt trên nền tảng Bedrock – chợ AI tạo sinh của Amazon Web Services (AWS). Đây là lần đầu tiên một mô hình của OpenAI được cung cấp trên Bedrock, theo ông Atul Deo, giám đốc sản phẩm của nền tảng này.
“OpenAI đã phát triển các mô hình tuyệt vời, và chúng tôi tin rằng đây sẽ là lựa chọn hấp dẫn cho khách hàng dưới dạng mô hình mã nguồn mở hoặc trọng số mở,” ông Deo nói trong một cuộc phỏng vấn. Ông từ chối tiết lộ thỏa thuận giữa AWS và OpenAI.
Thị trường các mô hình AI dạng mở và mã nguồn mở đã trở nên cạnh tranh gay gắt trong năm nay. Trong một thời gian, các mô hình Llama của Meta được coi là tốt nhất, nhưng điều đó đã thay đổi vào đầu năm nay khi DeepSeek của Trung Quốc tung ra mô hình suy luận mạnh mẽ và tiết kiệm chi phí, trong khi Meta gặp khó khăn với việc ra mắt Llama 4.
Hai mô hình mới của OpenAI là những mô hình mở đầu tiên được phát hành kể từ GPT-2 vào năm 2019.
Theo OpenAI, mô hình lớn hơn là gpt-oss-120b có thể chạy trên một GPU duy nhất, trong khi mô hình nhỏ hơn gpt-oss-20b đủ nhẹ để chạy trực tiếp trên máy tính cá nhân.
Các mô hình này có hiệu suất tương đương với các mô hình suy luận độc quyền của OpenAI như o3-mini và o4-mini, và đặc biệt mạnh trong các truy vấn liên quan đến lập trình, toán học thi đấu và y tế.
Các mô hình được huấn luyện trên một tập dữ liệu chỉ gồm văn bản, bên cạnh kiến thức phổ thông còn tập trung vào khoa học, toán học và lập trình. OpenAI không công bố các bảng so sánh hiệu suất giữa các mô hình mới này và các mô hình đối thủ như DeepSeek-R1.
Logo OpenAI trong ảnh minh họa. Ảnh: Reuters