Các hệ thống trí tuệ nhân tạo được xây dựng dựa trên những cấu trúc lấy cảm hứng từ sinh học có thể tạo ra các mẫu hoạt động giống với não người ngay cả trước khi được huấn luyện, theo nghiên cứu mới từ Đại học Johns Hopkins.
Nghiên cứu, được công bố trên tạp chí Nature Machine Intelligence, cho thấy thiết kế kiến trúc của một mô hình AI có thể quan trọng hơn nhiều so với quá trình học sâu quy mô lớn — vốn thường kéo dài hàng tháng, tiêu tốn năng lượng khổng lồ và có chi phí lên đến hàng tỉ đô la.
“Cách mà lĩnh vực AI đang đi theo hiện nay là ném thật nhiều dữ liệu vào mô hình và xây dựng những cụm tính toán lớn bằng cả một thành phố nhỏ. Điều đó đòi hỏi chi phí hàng trăm tỉ đô la. Trong khi đó, con người học cách nhìn chỉ với rất ít dữ liệu,” tác giả chính Mick Bonner, trợ lý giáo sư ngành khoa học nhận thức tại Johns Hopkins, cho biết.
“Tiến hóa có lẽ đã hội tụ vào thiết kế này vì một lý do chính đáng. Công trình của chúng tôi gợi ý rằng những kiến trúc giống não hơn sẽ đặt hệ thống AI vào một điểm xuất phát rất thuận lợi,” Bonner nói thêm.
Bonner và các đồng nghiệp đã xem xét ba nhóm thiết kế mạng phổ biến thường được dùng để xây dựng các hệ thống AI hiện đại: mô hình transformer, mạng kết nối hoàn toàn (fully connected networks) và mạng tích chập (convolutional networks).
Kiểm tra kiến trúc AI dựa trên hoạt động não bộ
Các nhà khoa học liên tục điều chỉnh ba bản thiết kế này — hay kiến trúc AI — để tạo ra hàng chục mạng nơ-ron nhân tạo khác nhau. Sau đó, họ cho những mạng AI mới và chưa qua huấn luyện này tiếp xúc với hình ảnh về đồ vật, con người và động vật, rồi so sánh phản hồi của chúng với hoạt động não của người và linh trưởng khi xem cùng những hình ảnh đó.
Khi các mô hình transformer và mạng kết nối hoàn toàn được chỉnh sửa bằng cách tăng mạnh số lượng nơ-ron nhân tạo, phản hồi của chúng gần như không thay đổi. Tuy nhiên, việc điều chỉnh tương tự đối với kiến trúc mạng tích chập giúp nhóm nghiên cứu tạo ra các mẫu hoạt động mô phỏng tín hiệu trong não người tốt hơn đáng kể.
Theo nhóm nghiên cứu, các mạng tích chập chưa qua huấn luyện này đạt hiệu quả ngang với những hệ thống AI thông thường — vốn được huấn luyện trên hàng triệu hoặc hàng tỉ hình ảnh. Điều này cho thấy kiến trúc có thể đóng vai trò quan trọng hơn nhiều so với suy nghĩ trước đây.
“Nếu việc huấn luyện trên dữ liệu khổng lồ thực sự là yếu tố quyết định, thì sẽ không có cách nào đạt được các hệ thống AI giống não chỉ bằng cách thay đổi kiến trúc,” Bonner nói. “Điều này có nghĩa là, nếu bắt đầu từ đúng bản thiết kế và có thể kết hợp thêm những hiểu biết từ sinh học, chúng ta có thể đẩy nhanh đáng kể quá trình học của hệ thống AI.”
Tiếp theo, nhóm nghiên cứu đang phát triển các thuật toán học đơn giản dựa trên sinh học, có thể truyền cảm hứng cho một khuôn khổ học sâu mới.

Nghiên cứu mới từ Đại học Johns Hopkins cho thấy một số kiến trúc AI lấy cảm hứng từ sinh học có thể mô phỏng hoạt động não người ngay cả trước khi được huấn luyện dữ liệu, thách thức những giả định lâu nay về cách AI phải học. Ảnh: Stock

