
DeepSeek vừa ra mắt đã gây chấn động ngành công nghệ toàn cầu với một mô hình trí tuệ nhân tạo (AI) mới có khả năng cạnh tranh với các ông lớn Mỹ như OpenAI, nhưng với chi phí thấp, khiến cho các cổ phiếu công nghệ tại thị trường chứng khoán Mỹ mất đến 1.000 tỷ USD giá trị vốn hóa chỉ trong một phiên giao dịch đầu tuần này.
Thị trường cổ phiếu công nghệ toàn cầu đã ổn định trở lại trong hai phiên tiếp theo vào thứ Ba và thứ Tư, và thậm chí tại châu Âu, cổ phiếu công nghệ đã tăng giá trở lại sau làn sóng bán tháo đầu tuần mà các chuyên gia cho là phản ứng quá mức.
Phần lớn các chuyên gia sau cú sốc ban đầu đã đặt nghi vấn về cách thức DeepSeek phát triển mô hình AI của mình, và câu hỏi chính được đặt ra lúc này là công ty công nghệ này của Trung Quốc có xây dựng dữ liệu huấn luyện AI hay không, hay là “ăn chực” dữ liệu từ các tập đoàn công nghệ lớn trên thế giới.
Theo các nguồn tin trong giới điều hành và đầu tư tại Thung lũng Silicon, DeepSeek đã sử dụng kỹ thuật chắt lọc tri thức (distillation) – trong đó một hệ thống AI học từ một hệ thống AI khác – để phát triển các mô hình của mình. Cụ thể hơn, kỹ thuật “distillation” hoạt động bằng cách sử dụng một mô hình AI lâu đời, mạnh mẽ hơn để đánh giá chất lượng câu trả lời của một mô hình mới hơn, từ đó giúp mô hình mới hấp thụ kiến thức từ mô hình cũ.
Điều này đồng nghĩa với việc mô hình mới có thể hưởng lợi từ hàng tỷ đô la đầu tư vào nghiên cứu và tài nguyên tính toán mà không phải chịu các chi phí tương ứng. Nó giúp các mô hình mới bỏ qua giai đoạn huấn luyện tốn kém nhưng vẫn đạt hiệu suất cao.
Một trong những điểm đáng chú ý của DeepSeek là nó chứng minh rằng chỉ cần một lượng dữ liệu tương đối nhỏ – chưa đến 1 triệu mẫu – từ một mô hình lớn, mạnh mẽ hơn cũng có thể giúp một mô hình nhỏ hơn cải thiện đáng kể khả năng của nó.
Hình thức chắt lọc này, khác với cách thuật ngữ này từng được sử dụng trong nghiên cứu học thuật, đã trở thành một phương pháp phổ biến trong ngành AI. Tuy nhiên, nó vi phạm điều khoản sử dụng của một số mô hình AI hàng đầu do các công ty công nghệ Mỹ phát triển trong những năm gần đây, bao gồm cả OpenAI.
DeepSeek có vi phạm quyền sở hữu trí tuệ không?
Người phát ngôn của OpenAI cho biết công ty có biết về các nhóm ở Trung Quốc đang tích cực sao chép mô hình AI của Mỹ bằng phương pháp distillation và đang xem xét liệu DeepSeek có vi phạm quyền sở hữu trí tuệ của họ hay không.
OpenAI đã lên tiếng cảnh báo rằng các startup Trung Quốc đang “liên tục” tận dụng công nghệ của họ để tạo ra những sản phẩm cạnh tranh. Công ty này cho biết họ đang xem xét các cáo buộc rằng DeepSeek đã sử dụng mô hình AI của OpenAI để phát triển chatbot đối thủ.
OpenAI và đối tác Microsoft – đơn vị đã đầu tư 13 tỷ USD vào công ty AI có trụ sở tại San Francisco – đang điều tra xem liệu công nghệ độc quyền của họ có bị thu thập trái phép thông qua kỹ thuật “distillation” hay không.
OpenAI cho biết họ sẽ phối hợp với chính phủ Mỹ để bảo vệ công nghệ Mỹ, nhưng không tiết lộ chi tiết về các biện pháp cụ thể.
“Là công ty dẫn đầu trong lĩnh vực AI, chúng tôi triển khai nhiều biện pháp để bảo vệ quyền sở hữu trí tuệ, bao gồm quy trình kiểm duyệt chặt chẽ trước khi phát hành các mô hình tiên tiến,” OpenAI tuyên bố.
Microsoft và OpenAI hiện đang điều tra hoạt động bất thường được phát hiện bởi các chuyên gia bảo mật của Microsoft vào cuối năm ngoái, trong đó một lượng lớn dữ liệu đã bị trích xuất từ API của OpenAI theo cách có thể vi phạm điều khoản dịch vụ.
Nói về kỹ thuật chắt lọc đầu ra từ các mô hình AI lớn để huấn luyện các mô hình nhỏ hơn, CEO Altman không chấp nhận việc một công ty bên ngoài thực hiện distillation trên OpenAI.
Howard Lutnick, người được cựu Tổng thống Donald Trump đề cử làm Bộ trưởng Thương mại và sẽ giám sát các lệnh kiểm soát xuất khẩu AI trong tương lai, tuyên bố trong phiên điều trần trước Thượng viện Mỹ rằng DeepSeek đã chiếm dụng công nghệ AI của Mỹ và sẽ bị hạn chế.
Thư ký báo chí Nhà Trắng, Karoline Leavitt, cho biết Hội đồng An ninh Quốc gia Mỹ đang xem xét các tác động tiềm tàng của ứng dụng AI này.
Tuy nhiên, cũng có những ý kiến cho rằng việc chắt lọc dữ liệu đầu ra của các mô hình AI lớn để phát triển mô hình AI mới không phải là vi phạm bản quyền nếu các điều khoản dịch vụ của các tập đoàn công nghệ không cấm điều đó.
Naveen Rao, Phó Chủ tịch phụ trách AI tại Databricks có trụ sở tại San Francisco, cho biết công ty của ông không sử dụng kỹ thuật này nếu nó vi phạm điều khoản dịch vụ. Tuy nhiên, ông cho rằng học hỏi từ đối thủ là điều bình thường (par for the course) trong ngành AI, và so sánh tình huống này với việc các hãng sản xuất ô tô mua và phân tích động cơ của nhau.
“Thành thật mà nói, điều này xảy ra trong mọi ngành. Cạnh tranh là thực tế. Nếu có thể khai thác được thông tin, người ta sẽ tận dụng nó để giành lợi thế,” Rao nói. “Chúng tôi luôn cố gắng tuân thủ đạo đức nghề nghiệp, nhưng vẫn phải cạnh tranh.”
Ví dụ, giấy phép sử dụng mô hình Llama của Meta yêu cầu bất kỳ ai sử dụng nó để chắt lọc tri thức phải công khai thực hành này, theo một người phát ngôn của Meta.
Trong một báo cáo nghiên cứu, DeepSeek đã tiết lộ rằng họ có sử dụng Llama để tạo ra một số phiên bản mô hình chắt lọc dữ liệu mà họ công bố trong tháng này. Tuy nhiên, công ty không đề cập liệu họ có sử dụng mô hình của Meta ở giai đoạn đầu hay không.
Giải pháp nào để ngăn chặn distillation?
Các chuyên gia công nghệ cho rằng ngăn chặn việc chắt lọc dữ liệu có thể khó hơn so với suy nghĩ ban đầu.
Khi các sản phẩm phổ biến như ChatGPT có hàng trăm triệu người dùng, lượng dữ liệu nhỏ được chắt lọc như vậy có thể rất khó phát hiện. Hơn nữa, một số mô hình như Llama của Meta Platforms và các mô hình từ startup Pháp Mistral có thể được tải xuống miễn phí và vận hành trên các trung tâm dữ liệu riêng, khiến việc phát hiện vi phạm điều khoản sử dụng trở nên khó khăn hơn.
“Không thể ngăn chặn chắt lọc dữ liệu khi có các mô hình mã nguồn mở như Mistral và Llama. Chúng có sẵn cho tất cả mọi người. Họ cũng có thể tìm thấy mô hình của OpenAI thông qua khách hàng,” Umesh Padval, Giám đốc điều hành tại Thomvest Ventures, nhận xét.
Một nguồn tin quen thuộc với các phòng thí nghiệm AI lớn cho biết cách duy nhất để ngăn các công ty như DeepSeek chắt lọc dữ liệu từ mô hình của Mỹ là áp dụng các quy định nghiêm ngặt về “biết khách hàng của bạn” (know-your-customer – KYC), tương tự như cách các công ty tài chính xác minh danh tính khách hàng.
Jonathan Ross, CEO của Groq, một công ty cung cấp điện toán AI và lưu trữ các mô hình AI trên nền tảng đám mây, đã thực hiện chặn tất cả địa chỉ IP từ Trung Quốc nhằm ngăn các công ty nước này khai thác các mô hình AI mà công ty đang lưu trữ.
“Nhưng điều đó chưa đủ, vì vẫn có cách để lách luật,” Ross thừa nhận. “Chúng tôi có những ý tưởng để ngăn chặn điều này, nhưng đây sẽ là một trò chơi mèo vờn chuột… Tôi không biết đâu là giải pháp triệt để. Nếu ai đó tìm ra, hãy cho chúng tôi biết và chúng tôi sẽ áp dụng ngay.”
Tuy nhiên, trước những quan ngại về vai trò của chính phủ Trung Quốc phía sau các công ty công nghệ, đặc biệt là DeepSeek, một số nước đã bắt đầu triển khai các biện pháp phòng vệ nhằm đảm bảo an ninh quốc gia và bảo vệ dữ liệu cá nhan người dùng.
Trong khi chính phủ Mỹ tăng cường giám sát DeepSeek, Hải quân Mỹ được cho là đã cấm các thành viên sử dụng ứng dụng của DeepSeek do lo ngại về bảo mật và đạo đức.
Tại một số nước châu Âu, DeepSeek cũng đã bị ngăn chặn.
Hôm thứ Ba, chính phủ Anh tuyên bố công dân có quyền tự quyết định việc sử dụng ứng dụng này, đồng thời cho biết họ đang theo dõi các mối đe dọa tiềm tàng đối với an ninh quốc gia liên quan đến dữ liệu từ nền tảng AI này, và sẽ không ngần ngại hành động nếu có rủi ro phát sinh.
Hôm thứ Tư, trong bối cảnh ngày càng có nhiều lo ngại về việc dữ liệu thu thập từ chatbot mới của DeepSeek có thể bị chính phủ Trung Quốc sử dụng, ứng dụng này đã biến mất khỏi các cửa hàng ứng dụng của Apple và Google tại Ý, sau khi các cơ quan quản lý ở Rome và Ireland yêu cầu công ty cung cấp thông tin về cách xử lý dữ liệu của công dân.
Garante, cơ quan bảo vệ dữ liệu cá nhân của Ý, cho biết họ muốn biết loại dữ liệu cá nhân nào đang được thu thập, nguồn dữ liệu, mục đích sử dụng, cơ sở pháp lý và liệu dữ liệu có được lưu trữ tại Trung Quốc hay không. Garante đã cho DeepSeek và các công ty liên kết 20 ngày để trả lời câu hỏi.
Trong khi đó, một người phát ngôn của Ủy ban Bảo vệ Dữ liệu Ireland tại Dublin nói rằng họ cũng đã “gửi yêu cầu đến DeepSeek để cung cấp thông tin về việc xử lý dữ liệu liên quan đến công dân Ireland”.
Chính sách bảo mật của DeepSeek tuyên bố rằng thông tin cá nhân thu thập từ người dùng được lưu trữ “trên các máy chủ an toàn đặt tại Cộng hòa Nhân dân Trung Hoa”. DeepSeek cho biết dữ liệu được sử dụng “để tuân thủ nghĩa vụ pháp lý, hoặc khi cần thiết để thực hiện các nhiệm vụ vì lợi ích công cộng, hoặc để bảo vệ lợi ích quan trọng của người dùng và những người khác”.
Luật Tình báo Quốc gia Trung Quốc quy định rằng tất cả doanh nghiệp, tổ chức và công dân đều phải ‘hỗ trợ, giúp đỡ và hợp tác’ với các hoạt động tình báo quốc gia.
Làn sóng lo ngại mới nhất tại Washington về việc Trung Quốc sử dụng công nghệ Mỹ để phát triển ngành AI có nhiều điểm tương đồng với những tranh cãi trước đây về ngành bán dẫn. Chính phủ Mỹ đã áp đặt hàng loạt lệnh cấm đối với chip và thiết bị sản xuất chip xuất khẩu sang Trung Quốc, đồng thời đang xem xét hạn chế việc hợp tác phát triển một số công nghệ mã nguồn mở nhất định.
Liệu AI có phải là “mặt trận” tiếp theo trong cuộc đối đầu công nghệ Mỹ – Trung?
Sự xuất hiện của DeepSeek là một lời cảnh tỉnh cho Thung lũng Silicon. Ảnh: AFP