Giám đốc điều hành Nvidia, Jensen Huang, đã đi trước thị trường nhiều năm khi thúc đẩy công ty phát triển các chip chuyên biệt cho trí tuệ nhân tạo từ năm 2010 — hơn một thập kỷ trước khi AI bùng nổ. Một bước đi chiến lược khác bắt đầu vào năm 2020, khi Nvidia đẩy mạnh đầu tư vào mạng trung tâm dữ liệu thông qua thương vụ mua lại Mellanox, hiện đang định hình một trụ cột kinh doanh mới của hãng.
Chỉ trong vài năm, mảng mạng của Nvidia — vốn tập trung vào kết nối các trung tâm dữ liệu — đã trở thành động lực doanh thu lớn thứ hai, chỉ sau mảng chip dành cho tính toán. Trong quý gần nhất, mảng này ghi nhận 11 tỷ USD doanh thu, tăng 267% so với cùng kỳ năm trước, và đạt hơn 31 tỷ USD trong cả năm tài chính.
Mảng này bao gồm các công nghệ cốt lõi như NVLink (kết nối GPU trong máy chủ), hệ thống chuyển mạch InfiniBand, nền tảng ethernet Spectrum-X cho AI, cùng các giải pháp quang học tích hợp. Tổng thể, đây là những thành phần thiết yếu để xây dựng các “nhà máy AI” — trung tâm dữ liệu chuyên phục vụ huấn luyện và vận hành mô hình trí tuệ nhân tạo.
Theo Kevin Cook, chiến lược gia tại Zacks Investment Research, mảng mạng đang nổi lên là một trong những lĩnh vực ấn tượng nhất của Nvidia. Doanh thu 11 tỷ USD trong một quý của bộ phận này thậm chí vượt quy mô mảng mạng của ông lớn Cisco trong cùng kỳ, tiệm cận mức doanh thu cả năm của đối thủ.
Dù vậy, mảng mạng vẫn ít được chú ý hơn so với hoạt động sản xuất chip — lĩnh vực lớn nhất của Nvidia — cũng như mảng game, vốn là nền tảng kinh doanh ban đầu của hãng.
Nguồn gốc của mảng mạng Nvidia đến từ Mellanox, một công ty mạng được thành lập tại Israel năm 1999 mà Nvidia đã mua lại vào năm 2020 với giá 7 tỷ USD. Theo các lãnh đạo Nvidia, việc kết hợp năng lực mạng với GPU giúp công ty cung cấp giải pháp hoàn chỉnh, tối ưu hiệu suất cho các hệ thống AI quy mô lớn.
“Mạng không chỉ là truyền dữ liệu giữa các nút tính toán, mà là nền tảng của toàn bộ hệ thống,” Kevin Deierling, Phó chủ tịch cấp cao phụ trách mạng của Nvidia và là người gia nhập công ty thông qua thương vụ mua lại Mellanox, cho biết. Ông nhấn mạnh rằng trong các trung tâm dữ liệu hiện đại, mạng đóng vai trò tương tự “bảng mạch nền” — kết nối và điều phối toàn bộ hoạt động tính toán.
“Mọi người thường nghĩ mạng chỉ là kiểu ‘tôi có máy in và cần kết nối tới nó’,” Deierling nói. “Jensen đã nói ngay ngày đầu tiên khi mua lại chúng tôi rằng trung tâm dữ liệu chính là đơn vị tính toán mới. Mạng không chỉ là việc truyền dữ liệu nhỏ giữa các nút tính toán; nó thực sự là nền tảng.”
Dù Deierling thừa nhận ông không hoàn toàn hiểu vì sao Huang mua lại công ty vào thời điểm đó — nhưng giờ thì ông đã hiểu. Việc sở hữu một mảng mạng song song với mảng GPU giúp Nvidia có thể bán chip cùng với các công nghệ hoạt động tối ưu nhất đi kèm với chúng.
“Khi Jensen mua Mellanox năm 2020, ông ấy nhận ra đó là mảnh ghép còn thiếu để biến GPU thành một gói hoàn chỉnh,” Cook nhận định.
Deierling cho biết thêm rằng một yếu tố khác giúp mảng mạng của Nvidia thành công là công ty chỉ cung cấp công nghệ dưới dạng giải pháp toàn bộ (full-stack), thay vì bán từng thành phần riêng lẻ, và họ không trực tiếp bán sản phẩm mà thông qua các đối tác.
Tại hội nghị công nghệ Nvidia GTC ngày 16/3, công ty tiếp tục công bố loạt nâng cấp mới, bao gồm nền tảng Rubin với sáu chip mới cho siêu máy tính AI, hệ thống lưu trữ bộ nhớ ngữ cảnh suy luận và các bộ chuyển mạch quang tử Spectrum-X hiệu quả hơn.
Những bước tiến này cho thấy mảng mạng không còn là phần bổ trợ, mà đang dần trở thành một trụ cột song hành cùng chip trong chiến lược phát triển AI của Nvidia.
Jensen Huang, CEO Nvidia, giới thiệu phần cứng phục vụ hạ tầng AI — nền tảng kết hợp giữa chip và công nghệ mạng trong các trung tâm dữ liệu. Ảnh: Bloomberg

