Nhu cầu mạnh mẽ đối với thiết bị tính toán AI tại Trung Quốc đã đẩy giá máy chủ B300 của Nvidia lên gần gấp đôi, đạt khoảng 7 triệu nhân dân tệ (1 triệu USD) mỗi hệ thống, trong bối cảnh chiến dịch siết chặt buôn lậu chip khiến nguồn cung chợ đen cạn kiệt.
Giá của dòng máy chủ tiên tiến và mạnh nhất của Nvidia — vốn đóng vai trò then chốt trong các tác vụ trí tuệ nhân tạo — đã tăng từ đầu năm nay, nhưng tăng mạnh sau khi thị trường chợ đen, một kênh cung ứng quan trọng, bị kiểm soát chặt, bốn nguồn tin cho biết.
Đà tăng giá còn được thúc đẩy bởi nhu cầu tính toán lớn từ các công ty công nghệ Trung Quốc, dù nhiều doanh nghiệp tránh ghi nhận trực tiếp phần cứng Nvidia trong sổ sách để không bị liên đới đến các lệnh trừng phạt của Mỹ, theo các nguồn tin.
Trả lời Reuters, Nvidia cho biết dòng B300 bị hạn chế bán tại Trung Quốc và các đối tác phải tuân thủ nghiêm ngặt quy định.
“Khi các hệ thống ngày càng lớn và phức tạp, việc chuyển hướng trái phép sẽ dẫn đến thất bại,” công ty cảnh báo trong một tuyên bố.
“Nvidia không cung cấp bất kỳ dịch vụ hay hỗ trợ nào cho các hệ thống như vậy, và các cơ chế thực thi là nghiêm ngặt và hiệu quả.”
Khan hiếm do siết chặt xuất khẩu của Mỹ
Một máy chủ B300, chứa tám GPU B300, có giá khoảng 550.000 USD tại Mỹ, tăng từ khoảng 500.000 USD vào cuối năm ngoái, theo hai nguồn tin.
Việc giá tại Trung Quốc gần như tăng gấp đôi — từ khoảng 4 triệu nhân dân tệ cuối năm ngoái — phản ánh “phí khan hiếm” do các hạn chế xuất khẩu ngày càng chặt chẽ từ Mỹ.
Diễn biến này xảy ra trong bối cảnh các tập đoàn công nghệ Trung Quốc chạy đua tìm kiếm phần cứng hiệu quả về chi phí để xử lý “token” — đơn vị văn bản cơ bản mà mô hình AI sử dụng — nhằm thương mại hóa mô hình và hạ tầng tính toán của họ.
Nguồn cung trở nên khan hiếm hơn sau khi nhà chức trách Mỹ truy tố Yih-Shyan “Wally” Liaw, đồng sáng lập của Supermicro là đối tác Nvidia, vào tháng 3, các nguồn tin cho biết thêm.
Một số công ty không còn đủ khả năng mua do giá tăng đã chuyển sang thuê thiết bị, với chi phí lên tới 190.000 nhân dân tệ mỗi tháng theo hợp đồng một năm.
Theo Morgan Stanley, các mô hình AI Trung Quốc tăng thị phần sử dụng token toàn cầu lên 32% vào tháng 3/2026 từ 5% một năm trước, nhờ tiến bộ trong lập trình và khả năng “tác nhân”.
MiniMax, Zhipu và Qwen của Alibaba đều ghi nhận mức sử dụng token tăng gấp 6–7 lần trong tháng 2 và 3 so với tháng 12, ngân hàng đầu tư Mỹ cho biết.
Một trong những hệ thống mạnh nhất cho suy luận AI
B300 của Nvidia, được trang bị 288 GB bộ nhớ băng thông cao, cung cấp hiệu năng tính toán 14 petaFLOPS ở độ chính xác FP4, nằm trong số các chip mạnh nhất cho các tác vụ suy luận AI. Nvidia và các đối tác như Supermicro bắt đầu giao chip này từ tháng 9 năm ngoái.
Sự không chắc chắn quanh việc xuất khẩu chip H200 cũng góp phần làm giá B300 tăng gần đây.
Dù đã được cả hai chính phủ chấp thuận xuất khẩu, H200 vẫn chưa được chuyển đến Trung Quốc do hai bên chưa thống nhất điều kiện bán.
Tập đoàn công nghệ Huawei và các nhà sản xuất chip AI Trung Quốc khác đang tận dụng tình trạng này để thu hẹp thị phần dẫn đầu 55% của Nvidia tại Trung Quốc, nơi đối thủ AMD hiện chỉ chiếm khoảng 4%.

Các máy chủ trung tâm dữ liệu và linh kiện chứa những chip AI mới nhất của Nvidia được trưng bày tại hội nghị nhà phát triển phần mềm GTC của công ty ở San Jose, California, Mỹ, ngày 19/3/2025. Ảnh: Reuters

