Nvidia hôm thứ Tư công bố dữ liệu mới cho thấy máy chủ trí tuệ nhân tạo (AI) mới nhất của hãng có thể cải thiện hiệu suất các mô hình AI mới — bao gồm hai mô hình phổ biến từ Trung Quốc — lên gấp 10 lần.
Dữ liệu này được công bố trong bối cảnh thế giới AI chuyển từ việc tập trung vào huấn luyện mô hình, nơi Nvidia chiếm ưu thế trên thị trường, sang triển khai các mô hình phục vụ hàng triệu người dùng, nơi Nvidia phải cạnh tranh nhiều hơn với các đối thủ như Advanced Micro Devices (AMD) và Cerebras.
Dữ liệu của Nvidia tập trung vào các mô hình AI theo phương pháp mixture-of-expert. Kỹ thuật này giúp mô hình AI hiệu quả hơn bằng cách chia câu hỏi thành nhiều phần nhỏ và giao cho các “chuyên gia” bên trong mô hình xử lý. Phương pháp này trở nên phổ biến trong năm nay sau khi DeepSeek (Trung Quốc) gây chú ý với mô hình mã nguồn mở hiệu suất cao, huấn luyện trên chip Nvidia ít hơn so với các đối thủ.
Kể từ đó, phương pháp mixture-of-experts đã được OpenAI (ChatGPT), Mistral (Pháp) và Moonshoot AI (Trung Quốc) áp dụng. Tháng 7 vừa qua, Moonshoot AI đã ra mắt mô hình mã nguồn mở xếp hạng cao của riêng mình.
Trong khi đó, Nvidia nhấn mạnh rằng mặc dù các mô hình này có thể cần ít huấn luyện hơn trên chip của hãng, các máy chủ của Nvidia vẫn có thể phục vụ các mô hình đó cho người dùng một cách hiệu quả.
Nvidia cho biết máy chủ AI mới nhất của hãng, chứa 72 chip hàng đầu trong một máy tính duy nhất với liên kết tốc độ cao giữa chúng, đã cải thiện hiệu suất mô hình Kimi K2 Thinking của Moonshoot AI gấp 10 lần so với thế hệ máy chủ Nvidia trước đó. Đây là mức cải thiện tương tự với các mô hình của DeepSeek.
Theo Nvidia, cải thiện chủ yếu đến từ số lượng chip mà máy chủ có thể tích hợp và tốc độ liên kết giữa các chip, lĩnh vực mà Nvidia vẫn giữ lợi thế so với đối thủ.
Đối thủ của Nvidia là AMD đang phát triển máy chủ tương tự với nhiều chip mạnh, dự kiến ra mắt thị trường vào năm tới.

Một chiếc smartphone với logo NVIDIA hiển thị được đặt trên bo mạch máy tính trong hình minh họa. Ảnh: Reuters

