OpenAI cảnh báo Quốc hội về việc DeepSeek “chưng cất” mô hình Mỹ

Cuộc cạnh tranh giữa các công ty trí tuệ nhân tạo (AI) hàng đầu thế giới đang bước vào một giai đoạn nhạy cảm hơn, khi tranh chấp không còn xoay quanh việc mô hình nào mạnh hơn, mà là cách các mô hình được huấn luyện và bảo vệ. Trong một bản ghi nhớ gửi các nhà lập pháp Mỹ, OpenAI cáo buộc startup Trung Quốc DeepSeek đang tìm cách “chưng cất” (distillation) các mô hình AI của Mỹ để huấn luyện hệ thống riêng, làm dấy lên lo ngại về sự xói mòn lợi thế công nghệ của Washington trong cuộc đua AI toàn cầu.

OpenAI đã gửi bản ghi nhớ tới Ủy ban Đặc biệt của Hạ viện Mỹ về Cạnh tranh Chiến lược giữa Mỹ và Trung Quốc, nhấn mạnh: “Chúng tôi đã quan sát thấy các tài khoản liên quan đến nhân viên DeepSeek đang phát triển các phương thức nhằm vượt qua các hạn chế truy cập của OpenAI và truy cập các mô hình thông qua các bộ định tuyến bên thứ ba được che giấu và những cách khác nhằm che đậy nguồn gốc của họ.”

OpenAI cho rằng đây là “những nỗ lực liên tục nhằm hưởng lợi miễn phí từ các năng lực được phát triển bởi OpenAI và các phòng thí nghiệm AI tiên phong khác của Mỹ.”

DeepSeek và công ty mẹ High-Flyer chưa đưa ra phản hồi chính thức. Tuy nhiên, sự trỗi dậy nhanh chóng của DeepSeek trong năm qua – với các mô hình như DeepSeek-V3 và DeepSeek-R1 được giới công nghệ Thung lũng Silicon đánh giá cao – đã khiến thị trường và giới hoạch định chính sách Mỹ đặc biệt chú ý.

Chưng cất AI: Kỹ thuật hợp pháp hay con đường tắt chiến lược?

Trọng tâm của tranh chấp nằm ở kỹ thuật “distillation” – chưng cất mô hình. Về bản chất, đây là phương pháp trong đó một mô hình mới học hỏi từ đầu ra của một mô hình cũ hơn, mạnh hơn. Thay vì tiếp cận mã nguồn hay dữ liệu nội bộ, nhà phát triển chỉ cần đưa câu lệnh (prompt) vào mô hình tiên tiến và sử dụng phản hồi để huấn luyện hệ thống của mình.

Về mặt kỹ thuật, distillation không phải là điều mới mẻ và cũng không tự động cấu thành hành vi bất hợp pháp. Trong nghiên cứu AI, đây là phương pháp phổ biến nhằm tối ưu hóa mô hình, giúp hệ thống nhỏ hơn đạt hiệu suất gần tương đương hệ thống lớn.

Tuy nhiên, OpenAI cho rằng việc tự động hóa quy mô lớn để “thu hoạch” đầu ra từ các mô hình thương mại có thể làm suy yếu nền tảng kinh tế của ngành AI tiên tiến.

Huấn luyện một mô hình ngôn ngữ lớn hàng đầu đòi hỏi chi phí khổng lồ: hạ tầng tính toán chuyên biệt, hàng triệu giờ GPU, chip tiên tiến và đội ngũ kỹ sư trình độ cao. Nếu đối thủ có thể tái tạo hành vi của mô hình thông qua việc khai thác đầu ra mà không phải đầu tư tương xứng, lợi tức đầu tư của các công ty tiên phong sẽ bị đe dọa.

Trong bản ghi nhớ, OpenAI cho biết họ phát hiện các tài khoản liên quan đến DeepSeek tìm cách truy cập mô hình thông qua “các bộ định tuyến bên thứ ba được che giấu” nhằm che đậy nguồn gốc. Công ty cũng nói rằng nhân viên DeepSeek đã phát triển mã để tự động thu thập đầu ra phục vụ chưng cất.

OpenAI đồng thời khẳng định họ chủ động loại bỏ người dùng có dấu hiệu cố gắng chưng cất mô hình để phát triển sản phẩm cạnh tranh. Tuy nhiên, bản ghi nhớ cho thấy các biện pháp phòng vệ này chưa hoàn toàn ngăn chặn được hoạt động mà công ty coi là khai thác trái phép.

Tác động đến cục diện cạnh tranh và địa chính trị AI

Vấn đề chưng cất không chỉ mang tính kỹ thuật, mà còn tác động sâu rộng đến cán cân cạnh tranh và chính sách công nghệ. Nhiều hệ thống AI của Trung Quốc, trong đó có chatbot R1 của DeepSeek, được cung cấp miễn phí hoặc với chi phí thấp. Nếu distillation giúp rút ngắn khoảng cách hiệu năng mà không cần đầu tư tương đương, các đối thủ chi phí thấp có thể nhanh chóng đạt mức ngang bằng với các công ty Mỹ đang thu phí truy cập.

Đối với Washington, đây không chỉ là câu chuyện thương mại mà còn là vấn đề chiến lược. Dân biểu John Moolenaar, Chủ tịch Ủy ban Trung Quốc của Hạ viện, gọi đây là một phần trong chiến lược “đánh cắp, sao chép và triệt hạ”. Những phát biểu như vậy cho thấy tranh chấp kỹ thuật đã được đặt trong khung cạnh tranh địa chính trị.

Bên cạnh đó, OpenAI còn cảnh báo về rủi ro an toàn. Khi một mô hình được tái tạo thông qua chưng cất, các cơ chế bảo vệ tích hợp có thể không được chuyển giao đầy đủ sang mô hình mới. Điều này đặc biệt nhạy cảm trong các lĩnh vực như hóa học hoặc sinh học, nơi kiểm soát đầu ra là yếu tố then chốt nhằm hạn chế lạm dụng.

Cuộc tranh luận về distillation cũng gắn chặt với vấn đề phần cứng. Chip tiên tiến đóng vai trò trung tâm trong huấn luyện AI. Trong bối cảnh Mỹ áp đặt các biện pháp kiểm soát xuất khẩu nhằm hạn chế Trung Quốc tiếp cận công nghệ bán dẫn cao cấp, khả năng tận dụng đầu ra của mô hình Mỹ có thể giúp các công ty Trung Quốc giảm phụ thuộc vào phần cứng tiên
tiến.
Các nhà lập pháp như Michael McCaul cảnh báo rằng ngay cả với chip kém mạnh hơn, Trung Quốc vẫn có thể phát triển các mô hình mã nguồn mở tiên tiến. Nếu kết hợp thêm phần cứng cao cấp, lợi thế của Mỹ có thể bị thu hẹp nhanh hơn dự kiến.

Đối với giới doanh nghiệp và nhà đầu tư, tranh chấp này phản ánh sự thay đổi trong định nghĩa về năng lực cạnh tranh AI. Không còn chỉ là bài toán về quy mô dữ liệu hay sức mạnh tính toán, mà còn là khả năng bảo vệ đầu ra, kiểm soát truy cập và thực thi các quy định xuyên biên giới.

Chưng cất AI, từ một kỹ thuật tối ưu hóa nội bộ, đang trở thành tâm điểm của cuộc cạnh tranh công nghệ toàn cầu. Trong bối cảnh AI ngày càng gắn với an ninh quốc gia và vị thế kinh tế, cách các chính phủ và doanh nghiệp xử lý vấn đề này có thể định hình lại trật tự ngành trong thập kỷ tới.

Logo Deepseek trong ảnh minh họa. OpenAI đã cảnh báo tới Quốc Hội Mỹ về việc DeepSeek của Trung Quốc “chưng cất” các mô hình AI tiên tiến của Mỹ. Ảnh: Reuters