Tác nhân AI (AI agent) có thể làm việc như một nhân viên siêu năng lực – nhưng chỉ khi có người dạy chúng cách làm việc.
Hãy hình dung một AI agent như một nhân viên mới rất thông minh. Nếu được đưa vào bệnh viện, nhà máy hay phòng giao dịch tài chính mà không được hướng dẫn, nó sẽ lúng túng. Nhưng nếu được giải thích rõ quy trình nội bộ, công cụ đang dùng và những “mẹo nghề” chỉ người trong ngành mới biết, nó có thể hoạt động như một chuyên gia kỳ cựu.
Một nghiên cứu mới công bố tháng 2/2026 cho thấy sự khác biệt đó có thể lên tới hơn 50%.
Khi AI có “kỹ năng”, hiệu suất tăng vọt
Nghiên cứu SkillsBench, do 40 nhà khoa học từ Amazon, Carnegie Mellon, Stanford, UC Berkeley và Oxford thực hiện, đã thử nghiệm bảy cấu hình AI agent hàng đầu – bao gồm Anthropic Claude Code, Google Gemini CLI và OpenAI Codex CLI – trên 84 nhiệm vụ thực tế với hơn 7.300 lượt chạy.
Các agent được kiểm tra trong ba tình huống: không có hướng dẫn; được cung cấp “kỹ năng” do chuyên gia viết; và tự tạo hướng dẫn cho chính mình.
Kết quả rất rõ ràng: khi được trang bị kỹ năng do con người biên soạn, tỷ lệ thành công tăng trung bình 16,2%. Nhưng trong nhiều lĩnh vực, mức cải thiện còn cao hơn nhiều.
Trong y tế, hiệu suất tăng tới 51,9 điểm phần trăm. Sản xuất tăng 41,9 điểm. An ninh mạng tăng 23,2 điểm, và năng lượng tăng 17,9 điểm.
Sự khác biệt này không đến từ việc thay đổi mô hình AI, mà đến từ tài liệu hướng dẫn mà con người cung cấp.
“Kỹ năng” là gì – và vì sao AI không tự tạo ra được?
AI agent là các mô hình như Claude hay GPT được cấp quyền truy cập công cụ và phần mềm để tự thực hiện nhiều bước công việc. Chúng có thể phân tích dữ liệu, viết mã, kiểm tra bảo mật hoặc xử lý báo cáo tài chính.
Tuy nhiên, vấn đề nằm ở chỗ: các mô hình này được huấn luyện từ dữ liệu công khai, trong khi quy trình vận hành thực tế của bệnh viện, nhà máy hay hệ thống lưới điện lại nằm trong tài liệu nội bộ hoặc kinh nghiệm tích lũy của chuyên gia.
“Kỹ năng” ở đây chính là cách con người mã hóa kiến thức đó thành dạng có cấu trúc: hướng dẫn từng bước, ví dụ cụ thể, tiêu chuẩn chuyên ngành và cách áp dụng. Agent không cần huấn luyện lại – chỉ cần “đọc” và làm theo.
Một ví dụ điển hình: khi phân tích rủi ro lũ lụt từ dữ liệu dòng chảy sông, agent chỉ đạt tỷ lệ thành công 2,9% nếu tự xử lý. Nhưng khi được cung cấp hướng dẫn sử dụng đúng phương pháp thống kê (Log-Pearson Type III), tỷ lệ thành công tăng vọt lên 80%.
Cùng một mô hình. Cùng một nhiệm vụ. Khác biệt nằm ở tri thức do con người truyền đạt.
Mô hình nhỏ có thể vượt mô hình lớn
Phát hiện đáng chú ý khác liên quan đến chi phí. Nhiều doanh nghiệp cho rằng muốn kết quả tốt hơn phải dùng mô hình lớn, đắt tiền.
Tuy nhiên, dữ liệu từ SkillsBench cho thấy một mô hình nhỏ nhưng được trang bị kỹ năng phù hợp có thể vượt qua mô hình lớn hoạt động “tự bơi”. Claude Haiku 4.5, khi có kỹ năng chọn lọc, đạt tỷ lệ thành công 27,7% – cao hơn cả Claude Opus 4.5 chạy không có kỹ năng (22%).
Điều này cho thấy lợi thế không chỉ nằm ở quy mô mô hình, mà ở chất lượng tri thức được “đóng gói” cho nó.
Quá nhiều hướng dẫn cũng phản tác dụng
Nghiên cứu cũng chỉ ra rằng kỹ năng không nên quá dài. Hai hoặc ba mô-đun tập trung cho mỗi kỹ năng cho kết quả tốt nhất. Khi tài liệu quá nhiều hoặc quá toàn diện, hiệu suất giảm đáng kể.
Một agent bị “ngập” trong hướng dẫn dài dòng chẳng khác gì nhân viên mới được phát cuốn sổ tay 300 trang ngay ngày đầu tiên – càng khó biết phải bắt đầu từ đâu.
Hướng dẫn ngắn gọn, cụ thể, có ví dụ thực tế là hiệu quả nhất.
Vì sao con người vẫn giữ vai trò quyết định?
Ở điều kiện thử nghiệm cuối cùng, các agent được yêu cầu tự tạo kỹ năng cho chính mình. Kết quả trung bình còn kém hơn cả khi không có kỹ năng.
Phần lớn agent không nhận ra nhiệm vụ đòi hỏi kiến thức chuyên sâu, hoặc tạo ra hướng dẫn mơ hồ, chung chung.
Kết luận của nhóm nghiên cứu rất rõ: kỹ năng hiệu quả đòi hỏi chuyên môn lĩnh vực được con người chọn lọc và cấu trúc lại – điều mà mô hình hiện nay chưa thể tự làm một cách đáng tin cậy.
AI agent có thể tăng hiệu suất hơn 50%. Nhưng lợi thế thực sự không nằm ở bản thân mô hình, mà ở khả năng của tổ chức trong việc chuyển hóa kinh nghiệm, quy trình và tri thức nội bộ thành “kỹ năng” có thể tái sử dụng cho AI.
Trong bối cảnh nhiều doanh nghiệp châu Á – Thái Bình Dương vẫn lưu giữ tri thức vận hành chủ yếu trong kinh nghiệm của đội ngũ lâu năm, việc mã hóa tri thức đó thành tài sản số cho AI có thể trở thành lợi thế cạnh tranh bền vững – và khó sao chép nhất.

Ảnh minh họa quá trình con người hướng dẫn và trang bị “kỹ năng” cho AI agent trong môi trường làm việc, cho thấy vai trò quyết định của chuyên môn con người trong việc nâng cao hiệu suất của tác nhân AI. Ảnh: TechWire Asia

