Một đội quân “máy cào” AI đang chạy tràn lan trên Internet, quét hàng tỷ website để lấy dữ liệu phục vụ cho các thuật toán tại các công ty công nghệ hàng đầu – tất cả đều không được phép hay trả phí, gây xáo trộn nền kinh tế trực tuyến.
Trước khi các chatbot AI bùng nổ, các website cho phép công cụ tìm kiếm truy cập nội dung của họ để đổi lấy khả năng hiển thị cao hơn – qua đó mang lại lưu lượng truy cập và doanh thu quảng cáo.
Tuy nhiên, sự phát triển nhanh chóng của AI tạo sinh đã cho phép các ông lớn công nghệ như Google và OpenAI khai thác thông tin cho chatbot bằng trình thu thập web (web crawlers), mà không cần sự truy cập trực tiếp của con người vào các website gốc.
Các nhà sản xuất nội dung truyền thống, như các cơ quan truyền thông, đang bị các trình thu thập AI vượt mặt, ảnh hưởng tới hoạt động trực tuyến và doanh thu quảng cáo của họ.
“Những website cho phép bot truy cập nội dung trước đây nhận được lượng độc giả tăng,” Kurt Muehmel, Trưởng bộ phận chiến lược AI tại công ty quản lý dữ liệu Dataiku, nói. Nhưng sự xuất hiện của AI tạo sinh “hoàn toàn phá vỡ” mô hình đó, ông nói với AFP.
Wikipedia báo cáo lưu lượng truy cập của con người giảm 8% từ 2024 đến 2025 do sự gia tăng các bản tóm tắt thông tin từ công cụ tìm kiếm AI.
“Xung đột cơ bản là mô hình kinh doanh mới trên Internet dựa vào AI không tạo ra lưu lượng truy cập,” Matthew Prince, CEO của Cloudflare, một nhà cung cấp dịch vụ Internet Mỹ, nhận định.
Cloudflare, đơn vị xử lý hơn 20% lưu lượng Internet toàn cầu, công bố mùa hè này một biện pháp mới nhằm ngăn các “tàu cào AI” truy cập nội dung mà không trả phí hoặc không được phép từ chủ sở hữu website.
“Về cơ bản giống như đặt biển giới hạn tốc độ hoặc biển cấm xâm nhập,” Prince nói với AFP bên lề Hội nghị Web Summit ở Lisbon.
“Các bot hành xử xấu vẫn có thể vượt qua, nhưng chúng tôi có thể theo dõi… Theo thời gian, chúng tôi có thể siết chặt kiểm soát sao cho các công ty AI không thể vượt qua.”
Biện pháp này áp dụng cho hơn 10 triệu website và đã “thu hút sự chú ý của các gã khổng lồ AI,” ông cho biết.
Ở quy mô nhỏ hơn, startup Mỹ TollBit cung cấp cho các nhà xuất bản tin tức trực tuyến công cụ để chặn, giám sát và kiếm tiền từ lưu lượng “tàu cào AI”.
“Internet giống như một xa lộ,” CEO kiêm đồng sáng lập Toshit Panigrahi nói, đồng thời mô tả công ty mình như một “trạm thu phí trên Internet.”
TollBit hợp tác với hơn 5.600 website, bao gồm USA Today, Time và Associated Press, cho phép các cơ quan truyền thông thiết lập phí truy cập nội dung riêng.
Công cụ phân tích là miễn phí cho nhà xuất bản, nhưng các công ty AI sẽ bị tính “phí giao dịch cho mỗi nội dung họ truy cập.”
Tuy nhiên, theo Muehmel, việc AI chiếm lĩnh trực tuyến không thể giải quyết chỉ bằng “các biện pháp nửa vời hoặc bởi một công ty riêng lẻ.”
“Đây là sự tiến hóa của toàn bộ nền kinh tế Internet, và sẽ mất nhiều năm (để giải quyết),” ông nói.
Nếu đội quân bot tiếp tục tự do trên mạng, “tất cả các động lực tạo ra nội dung sẽ biến mất,” Prince nhận định.
“Điều đó sẽ là tổn thất, không chỉ cho chúng ta – những người muốn tiêu thụ nội dung, mà thực sự cho cả các công ty AI, những người cần nội dung gốc để huấn luyện hệ thống của họ.”

Matthew Prince, CEO Cloudflare, nhấn mạnh rằng xung đột cơ bản giữa các chủ sở hữu website nội dung và các công ty AI là việc khai thác dữ liệu trên Internet dựa vào AI không tạo ra lưu lượng truy cập. Ảnh: AFP

