Các mô hình AI không vượt qua được bài kiểm tra về tâm lý học

By Hoàng Khang (Theo SciTechDaily) 15 Tháng 6 2026, 06:17

Một bài kiểm tra tâm lý học kinh điển đã bộc lộ điểm yếu bất ngờ của một số hệ thống trí tuệ nhân tạo (AI) tiên tiến nhất hiện nay, cho thấy cơ chế chú ý của AI có thể hoạt động rất khác so với con người.

Trong nghiên cứu do nhà khoa học Suketu Patel dẫn đầu, các nhà nghiên cứu đã sử dụng bài kiểm tra Stroop – một công cụ được giới tâm lý học sử dụng trong nhiều thập kỷ để đánh giá khả năng tập trung và kiểm soát nhận thức – nhằm đánh giá hiệu suất của các mô hình ngôn ngữ lớn như GPT-5, Claude và Gemini.

Kết quả cho thấy dù AI có thể xử lý tốt nhiều nhiệm vụ phức tạp, các hệ thống này gặp khó khăn trong việc duy trì sự tập trung khi phải xử lý thông tin gây nhiễu trong thời gian dài.

Trong bài kiểm tra Stroop, người tham gia nhìn thấy từ ngữ chỉ thị màu sắc, chẳng hạn từ “đò” hay “xanh dương” được in bằng mực màu. Đôi khi từ ngữ và màu mực trùng khớp, như từ “đỏ” được viết bằng mực đỏ, nhưng đôi khi chúng lại không tương thích, khi từ “đỏ” lại được viết bằng mực màu xanh dương. Người tham gia được yêu cầu xác định màu mực trong khi bỏ qua ý nghĩa của từ.

Con người thường mất nhiều thời gian hơn khi màu sắc và nội dung từ không trùng khớp, nhưng vẫn duy trì độ chính xác cao ngay cả khi bài kiểm tra kéo dài.

Khi áp dụng thử nghiệm tương tự cho các mô hình AI, các nhà nghiên cứu nhận thấy chúng hoạt động khá tốt ở giai đoạn đầu. GPT-4o đạt độ chính xác 91% với danh sách gồm năm từ có màu sắc và nội dung không khớp nhau. Claude 3.5 Sonnet cũng cho kết quả tương tự.

Tuy nhiên, hiệu suất giảm mạnh khi độ dài danh sách tăng lên.

Độ chính xác của GPT-4o giảm từ 91% xuống còn 57% khi số lượng từ tăng từ năm lên 10. Với danh sách gồm 40 từ, độ chính xác chỉ còn 15%.

Claude 3.5 Sonnet duy trì hiệu suất ổn định hơn, nhưng cũng giảm xuống còn 24% khi xử lý danh sách 40 từ.

Các nhà nghiên cứu ghi nhận xu hướng tương tự ở GPT-5, Claude Opus 4.1 và Gemini 2.5.

Kết quả còn tệ hơn khi các từ có màu sắc trùng khớp và không trùng khớp được trộn lẫn trong cùng một danh sách. Trong một số trường hợp, độ chính xác đối với các mục không trùng khớp gần như giảm về 0%.

Theo nhóm nghiên cứu, kết quả này phản ánh sự khác biệt cơ bản giữa cách con người và AI xử lý thông tin.

Giống con người, các mô hình AI được huấn luyện chủ yếu để nhận diện và diễn giải từ ngữ, khiến chúng có xu hướng tập trung vào nội dung văn bản. Tuy nhiên, con người có khả năng kiềm chế phản ứng tự động này để tiếp tục thực hiện đúng nhiệm vụ được giao, ngay cả trong các chuỗi thử nghiệm dài.

Ngược lại, các mô hình ngôn ngữ ngày càng có xu hướng quay trở lại việc đọc từ thay vì xác định màu sắc khi bài kiểm tra kéo dài, cho thấy chúng dần mất khả năng duy trì mục tiêu ban đầu.

Dù các mô hình ngôn ngữ lớn đã thể hiện năng lực ấn tượng trong viết lách, lập trình, suy luận và hội thoại, nghiên cứu mới cho thấy hiệu suất cao không đồng nghĩa với việc AI xử lý thông tin theo cách tương tự con người.

Nhóm nghiên cứu nhận định các hệ thống AI hiện nay có thể tồn tại những điểm yếu tiềm ẩn khi phải duy trì sự tập trung trong thời gian dài, kiểm soát phản ứng tự động hoặc tuân thủ một chỉ dẫn cụ thể xuyên suốt quá trình thực hiện nhiệm vụ.

Trong bối cảnh AI ngày càng được ứng dụng rộng rãi trong đời sống và công việc, việc hiểu rõ những giới hạn này có thể quan trọng không kém việc đánh giá các năng lực của công nghệ.

Một bài kiểm tra sự chú ý cho thấy các mô hình AI tiên tiến có thể mất tập trung khi phải xử lý các nhiệm vụ dài và phức tạp hơn. Không giống con người, AI thường quay lại phản ứng sai khi mức độ phức tạp gia tăng. Ảnh: Shutterstock