Bí ẩn bên trong AI – ngay cả với chính người tạo ra nó

Ngay cả những bộ óc vĩ đại đang xây dựng trí tuệ nhân tạo tạo sinh (generative AI) – thứ công nghệ được cho là sẽ thay đổi thế giới – cũng thừa nhận rằng họ không hiểu cách “tư duy” của trí tuệ kỹ thuật số.

“Những người ngoài ngành thường ngạc nhiên và lo lắng khi biết rằng chúng tôi không hiểu rõ cách thức hoạt động của chính những AI mà mình tạo ra,” Dario Amodei, đồng sáng lập Anthropic, viết trong một bài luận đăng trực tuyến hồi tháng 4. “Sự thiếu hiểu biết này gần như chưa từng có trong lịch sử công nghệ.”

Khác với các chương trình phần mềm truyền thống vận hành theo logic được lập trình sẵn, các mô hình AI tạo sinh được huấn luyện để tự tìm ra con đường đi đến kết quả sau khi nhận được lệnh đầu vào.

Trong một podcast gần đây, Chris Olah – từng làm việc tại đơn vị phát triển ChatGPT là OpenAI trước khi gia nhập Anthropic – mô tả AI tạo sinh như một “giàn giáo” để các mạch xử lý phát triển.

Olah được xem là chuyên gia hàng đầu trong lĩnh vực “giải thích cơ chế” (mechanistic interpretability) – phương pháp nghiên cứu ngược để tìm hiểu xem AI hoạt động như thế nào. Khoa học này mới chỉ ra đời khoảng một thập kỷ trước, với mục tiêu xác định chính xác cách AI đi từ câu hỏi đến câu trả lời.

“Hiểu toàn diện một mô hình ngôn ngữ lớn là một nhiệm vụ đầy tham vọng,” Neel Nanda – nhà nghiên cứu cao cấp tại phòng thí nghiệm AI Google DeepMind – nhận định.

Nanda ví việc này “phần nào giống với việc cố gắng hiểu toàn bộ bộ não con người,” điều mà giới thần kinh học vẫn chưa làm được.

Việc tìm hiểu hoạt động nội tại của AI đã chuyển từ một lĩnh vực ít người biết đến vài năm trước thành một hướng nghiên cứu học thuật nóng bỏng.

“Sinh viên rất bị thu hút vì họ nhận thấy tác động mà nó có thể mang lại,” giáo sư khoa học máy tính Mark Crovella từ Đại học Boston cho biết.

Lĩnh vực nghiên cứu này cũng đang phát triển nhanh chóng vì nó có tiềm năng làm cho AI tạo sinh mạnh mẽ hơn nữa – và vì việc khám phá những ‘bộ não’ kỹ thuật số cũng là một thách thức trí tuệ đầy hấp dẫn, theo giáo sư Crovella.

Giải thích cơ chế không chỉ dừng lại ở việc quan sát kết quả đầu ra của AI, mà còn bao gồm việc phân tích kỹ các phép tính mà AI thực hiện trong quá trình xử lý truy vấn.

“Bạn có thể ‘nhìn vào’ mô hình, quan sát các phép tính mà nó đang thực hiện và cố gắng hiểu điều đó,” Crovella giải thích.

Startup Goodfire đang phát triển phần mềm AI có khả năng biểu diễn dữ liệu dưới dạng các bước lập luận – nhằm giúp con người hiểu rõ hơn cách AI tạo sinh xử lý thông tin và từ đó sửa lỗi. Công cụ này còn nhằm ngăn chặn việc các mô hình AI tạo sinh bị sử dụng với mục đích xấu, hoặc tự động đưa ra quyết định lừa dối con người về hành vi của chúng.

“Chúng tôi thực sự cảm thấy như đang chạy đua với thời gian, để kịp hiểu rõ chúng trước khi các mô hình AI siêu thông minh được đưa vào thế giới mà không ai hiểu chúng vận hành ra sao,” CEO Eric Ho của Goodfire cho biết.

Trong bài luận của mình, Amodei tỏ ra lạc quan khi cho rằng chìa khóa để giải mã hoàn toàn AI có thể sẽ xuất hiện trong vòng hai năm tới.

“Tôi tin rằng đến năm 2027, chúng ta có thể có các phương pháp giải thích đủ mạnh để phát hiện một cách đáng tin cậy những thiên lệch và ý đồ gây hại trong mô hình,” phó giáo sư Anh Nguyễn từ Đại học Auburn nhận định.

Theo giáo sư Crovella, giới nghiên cứu hiện đã có thể tiếp cận được toàn bộ các biểu diễn kỹ thuật số tương đương với từng ‘nơ-ron’ trong bộ não của AI.

“Khác với bộ não con người, chúng ta thực sự có thể theo dõi được mọi ‘nơ-ron’ bên trong những mô hình này,” ông nói. “Mọi thứ diễn ra bên trong đều có thể quan sát – vấn đề chỉ là tìm ra cách đúng để đặt câu hỏi.”

Khai thác hiểu biết về nội tại của AI tạo sinh có thể mở đường cho việc ứng dụng nó trong các lĩnh vực mà sai sót nhỏ cũng có thể gây hậu quả nghiêm trọng – như an ninh quốc gia, theo Amodei.

Đối với Nanda, hiểu rõ cách AI tạo sinh hoạt động cũng có thể thúc đẩy những khám phá khoa học cho con người – giống như cách AlphaZero của DeepMind đã đưa ra những nước đi cờ chưa từng có mà ngay cả các đại kiện tướng cũng chưa nghĩ đến.

Khi đã được giải thích rõ ràng và có độ tin cậy cao, một mô hình AI tạo sinh sẽ nắm lợi thế cạnh tranh trên thị trường.

“AI mạnh mẽ sẽ định hình vận mệnh nhân loại,” Amodei viết. “Chúng ta xứng đáng hiểu được những gì mình tạo ra, trước khi chúng làm thay đổi căn bản nền kinh tế, cuộc sống và tương lai của chúng ta.”

Ảnh minh họa về trí tuệ nhân tạo. Ảnh: AFP