Một startup trí tuệ nhân tạo mới có tên Recursive Superintelligence vừa công bố thoát trạng thái “ẩn mình” hôm thứ Tư với khoản gọi vốn 650 triệu USD, đặt mục tiêu phát triển một hệ thống AI có khả năng tự cải tiến lặp lại – tức tự xây dựng chính nó – mà không cần con người can thiệp.
Nhà sáng lập Richard Socher — từng là gương mặt nổi bật trong lĩnh vực AI với startup chatbot You.com và các nghiên cứu liên quan ImageNet — cho biết công ty đang theo đuổi mục tiêu xây dựng một mô hình AI có thể tự phát hiện điểm yếu, tự thiết kế lại kiến trúc và cải thiện chính nó.
Ông gọi đây là hướng đi “trí tuệ siêu nhân tự cải tiến theo vòng lặp” (recursive self-improvement, RSI), một khái niệm lâu nay được xem là “đỉnh cao” của nghiên cứu AI.
AI tự nghiên cứu AI
Theo Socher, điểm khác biệt của Recursive Superintelligence không chỉ nằm ở việc “AI hỗ trợ nghiên cứu”, mà là tự động hóa toàn bộ chu trình nghiên cứu khoa học.
“Chúng tôi muốn tự động hóa toàn bộ quá trình từ ý tưởng, triển khai đến kiểm chứng nghiên cứu,” Socher nói trong một cuộc phỏng vấn trực tuyến. “Ban đầu là nghiên cứu AI, sau đó là mọi loại nghiên cứu, và cuối cùng có thể mở rộng sang cả lĩnh vực vật lý.”
Ông nhấn mạnh rằng mục tiêu cốt lõi không phải là cải tiến từng bước nhỏ, mà là một hệ thống AI có khả năng tự tạo ra thế hệ AI mới tốt hơn chính nó.
Công ty định hướng dựa trên khái niệm “open-endedness” — tính mở, không bị giới hạn bởi một mục tiêu cố định. Ý tưởng này được lấy cảm hứng từ tiến hóa sinh học, nơi các hệ thống liên tục thích nghi qua hàng tỷ năm.
Socher cho biết một số đồng sáng lập, trong đó có các nhà nghiên cứu từng làm việc tại Google DeepMind, đã từng nghiên cứu các mô hình thế giới (world models – mô hình AI cố gắng hiểu và mô phỏng cách thế giới vận hành bên trong chính nó) và hệ thống tạo môi trường tương tác như Genie 3.
Ông ví quá trình này với tiến hóa tự nhiên: các sinh vật thích nghi, rồi lại bị các sinh vật khác thích nghi ngược, tạo ra một vòng lặp tiến hóa không ngừng.
Khi được hỏi liệu quá trình tự cải tiến có “kết thúc” hay không, Socher cho rằng không có điểm dừng rõ ràng.
“Bạn luôn có thể trở nên thông minh hơn,” ông nói, đồng thời thừa nhận việc xác định giới hạn của trí tuệ là một bài toán đang được nghiên cứu và “còn rất xa”.
AI “tấn công AI” để tăng an toàn
Một trong những kỹ thuật được công ty nhấn mạnh là “rainbow teaming” — mở rộng từ khái niệm “red teaming” trong an ninh mạng.
Trong khi red teaming sử dụng con người để thử “bẻ khóa” mô hình AI, rainbow teaming cho phép một AI đóng vai “tấn công” một AI khác, lặp lại hàng triệu vòng để tìm ra các điểm yếu.
“Bạn có thể để hai AI cùng tiến hóa,” Socher nói. “Một bên liên tục tấn công, bên kia học cách phòng thủ. Qua đó, hệ thống trở nên an toàn hơn.”
Ông cho biết cách tiếp cận này hiện đã được nhiều phòng thí nghiệm AI lớn áp dụng.
Khác biệt với các “neolab” AI
Recursive Superintelligence được xem là một phần của thế hệ startup AI mới, thường gọi là “neolab”, tập trung vào nghiên cứu nền tảng thay vì sản phẩm thương mại ngắn hạn.
Tuy nhiên, Socher nói ông không hoàn toàn đồng ý với cách phân loại này.
“Chúng tôi không chỉ là một phòng thí nghiệm,” ông nói. “Chúng tôi muốn xây dựng một công ty có sản phẩm thực sự hữu ích cho con người.”
Ông cho biết công ty có thể rút ngắn thời gian phát triển sản phẩm đầu tiên xuống “tính bằng quý, không phải năm”.
Một trong những giả định dài hạn của RSI là: khi AI đủ mạnh, tài nguyên quan trọng nhất sẽ là năng lực tính toán (compute).
Socher nói xã hội tương lai có thể phải đối mặt với câu hỏi phân bổ tài nguyên: dùng bao nhiêu sức mạnh tính toán để giải quyết từng vấn đề toàn cầu như ung thư hay dịch bệnh.
“Đó sẽ trở thành một trong những câu hỏi lớn nhất của thế giới,” ông nói.

Nhà sáng lập Richard Socher của Recursive Superintelligence đặt mục tiêu phát triển một hệ thống AI có khả năng tự cải tiến lặp lại mà không cần con người can thiệp. Ảnh: Getty Images

