Cuộc đua phát triển trí tuệ nhân tạo đang bước vào một giai đoạn mới, nơi các mô hình không chỉ dừng lại ở khả năng trả lời câu hỏi hay viết đoạn mã đơn lẻ, mà ngày càng được định hình như những “tác nhân” có thể phối hợp, lập kế hoạch và thực thi công việc phức tạp trong môi trường doanh nghiệp. Trong bối cảnh đó, việc Anthropic tung ra Claude Opus 4.6 gần như đồng thời với khi OpenAI công bố GPT-5.3 Codex không chỉ là một sự trùng hợp về thời điểm, mà phản ánh rõ mức độ cạnh tranh gay gắt giữa hai trong số những công ty AI hàng đầu thế giới hiện nay.
Khi AI lập trình không còn là “công cụ”, mà trở thành “tác nhân”
Claude Opus 4.6 được Anthropic giới thiệu hôm thứ Tư, 4/2, như phiên bản mới nhất và mạnh nhất trong dòng mô hình Opus, đóng vai trò trung tâm đối với Claude Code – công cụ lập trình tác nhân của hãng. Chỉ vài tháng sau khi Opus 4.5 ra mắt, bản nâng cấp 4.6 cho thấy Anthropic đang tăng tốc đáng kể, không chỉ cải thiện hiệu năng kỹ thuật mà còn mở rộng tệp người dùng mà mô hình hướng tới. Thay vì chỉ phục vụ các lập trình viên chuyên nghiệp, Opus 4.6 được thiết kế để trở thành công cụ hỗ trợ cho một phổ rộng hơn các lao động tri thức, từ quản lý sản phẩm đến phân tích tài chính.
Điểm nhấn quan trọng nhất của Opus 4.6 là khái niệm “đội tác nhân”. Theo Anthropic, thay vì để một tác nhân AI xử lý công việc theo trình tự, thì với Opus 4.6, người dùng có thể phân tách một nhiệm vụ lớn thành nhiều phần, giao cho các tác nhân khác nhau cùng làm việc song song và phối hợp trực tiếp với nhau. Scott White, Giám đốc Sản phẩm của Anthropic, mô tả trải nghiệm này giống như có trong tay một nhóm nhân sự giỏi, mỗi người phụ trách một phần việc, giúp tốc độ và hiệu quả tổng thể được cải thiện đáng kể. Hiện tính năng đội tác nhân đang được cung cấp dưới dạng bản xem trước nghiên cứu cho người dùng API và các thuê bao.
Bên cạnh đó, Opus 4.6 còn được mở rộng cửa sổ ngữ cảnh lên tới 1 triệu token, ngang bằng với các phiên bản Sonnet cao cấp của Anthropic. Điều này cho phép mô hình xử lý những cơ sở mã rất lớn hoặc các tài liệu dài mà không cần chia nhỏ – một yếu tố ngày càng quan trọng khi AI được đưa vào các dự án phần mềm quy mô doanh nghiệp.
Một thay đổi đáng chú ý khác là việc tích hợp Claude trực tiếp vào PowerPoint dưới dạng bảng phụ, cho phép người dùng xây dựng và chỉnh sửa bài thuyết trình ngay trong môi trường quen thuộc, thay vì phải xuất file rồi chỉnh sửa thủ công như trước. Đây là dấu hiệu cho thấy Anthropic không chỉ nhắm tới lập trình thuần túy, mà còn muốn đưa tác nhân AI len sâu vào các quy trình làm việc văn phòng hàng ngày.
OpenAI và tham vọng về AI “tự chủ” trong phát triển phần mềm
Ở phía bên kia chiến tuyến, OpenAI cũng không giấu tham vọng của mình khi giới thiệu GPT-5.3 Codex – phiên bản mới nhất của mô hình lập trình tác nhân mà công ty đặt nhiều kỳ vọng.
Theo OpenAI, GPT-5.3 Codex không chỉ nhanh hơn khoảng 25% so với phiên bản trước, mà còn đánh dấu một bước chuyển quan trọng về mặt định vị: từ một công cụ chủ yếu viết và rà soát mã, Codex được nâng cấp thành tác nhân có thể thực hiện gần như mọi công việc mà lập trình viên và các chuyên gia tri thức làm trên máy tính.
OpenAI cho biết GPT-5.3 Codex có khả năng tạo ra các ứng dụng và trò chơi phức tạp từ con số không, đồng thời thể hiện bước tiến rõ rệt trên nhiều bộ đánh giá chuẩn của ngành. Trên SWE-Bench Pro – một thước đo khắt khe về kỹ nghệ phần mềm trong bối cảnh thực tế – mô hình đạt 57%. Trên Terminal-Bench 2.0, bài đánh giá tập trung vào kỹ năng thao tác terminal, GPT-5.3 Codex đạt 77,3%, tăng mạnh so với thế hệ trước. Những con số này được OpenAI nhấn mạnh không chỉ như minh chứng về hiệu năng, mà còn như bằng chứng cho thấy mô hình có thể đảm nhận vai trò ngày càng “tự chủ” hơn trong chuỗi công việc phát triển phần mềm.
Một chi tiết gây chú ý là OpenAI khẳng định GPT-5.3 Codex là mô hình đầu tiên của hãng “đóng vai trò then chốt trong việc tạo ra chính nó”. Theo mô tả, đội ngũ Codex đã sử dụng các phiên bản sớm của mô hình để gỡ lỗi quá trình huấn luyện, quản lý hạ tầng triển khai và đánh giá kết quả thử nghiệm. CEO Sam Altman gọi đây là dấu hiệu cho thấy tốc độ phát triển AI có thể tăng theo cấp số nhân, khi chính AI trở thành công cụ hỗ trợ trực tiếp cho việc xây dựng thế hệ AI tiếp theo.
Cuộc đua không chỉ nằm ở phòng thí nghiệm
Sự tương phản giữa hai thông báo ra mắt càng trở nên rõ ràng khi xét đến thời điểm công bố. OpenAI và Anthropic ban đầu được cho là lên kế hoạch giới thiệu các công cụ lập trình tác nhân của mình cùng lúc vào 10 giờ sáng ngày 4/2 theo giờ Thái Bình Dương. Tuy nhiên, Anthropic đã bất ngờ dời lịch ra mắt sớm hơn khoảng 15 phút, qua đó giành lợi thế biểu tượng trong cuộc đua công bố. Việc Anthropic đưa “con bài tẩy” của mình trước OpenAI chỉ 15 phút phản ánh rõ mức độ căng thẳng và tính toán chiến lược giữa hai công ty.
Cuộc cạnh tranh này không chỉ diễn ra trên mặt trận công nghệ, mà còn mang màu sắc cá nhân và truyền thông ngày càng rõ nét. Cả OpenAI và Anthropic đều chuẩn bị phát sóng quảng cáo trong trận Super Bowl – một sân khấu thể thao đắt đỏ và có sức ảnh hưởng lớn nhất nước Mỹ. Trong khi Anthropic châm biếm việc OpenAI thử nghiệm quảng cáo trong ChatGPT, Sam Altman đã công khai chỉ trích chiến dịch của đối thủ là “rõ ràng không trung thực”. Trên mạng xã hội X, Altman cáo buộc Anthropic sử dụng thông điệp gây hiểu lầm để công kích một kịch bản quảng cáo mà OpenAI “chắc chắn sẽ không bao giờ triển khai”.
Những phát ngôn qua lại này phơi bày sự khác biệt sâu sắc về triết lý và mô hình kinh doanh giữa hai bên. Anthropic, được thành lập bởi các cựu nhà nghiên cứu OpenAI với trọng tâm là an toàn AI, thường nhấn mạnh cách tiếp cận thận trọng và kiểm soát chặt chẽ việc sử dụng mô hình. Ngược lại, OpenAI theo đuổi chiến lược mở rộng quy mô người dùng nhanh chóng, với ChatGPT miễn phí tiếp cận hàng trăm triệu người trên toàn cầu, đồng thời từng bước thương mại hóa thông qua các gói trả phí và dịch vụ doanh nghiệp.
Thị trường doanh nghiệp – nơi quyết định thắng thua
Phía sau những màn đấu khẩu công khai là một thị trường đang tăng trưởng nóng. Theo khảo sát của Andreessen Horowitz, chi tiêu của doanh nghiệp cho các mô hình ngôn ngữ lớn đã vượt xa những dự báo lạc quan nhất. Năm 2025, mức chi tiêu trung bình cho LLM của mỗi doanh nghiệp được ước tính đạt 7 triệu USD, cao hơn nhiều so với con số 2,5 triệu USD của năm trước. Dự báo cho năm 2026 còn cho thấy con số này có thể tăng lên gần 11,6 triệu USD, phản ánh niềm tin ngày càng lớn của doanh nghiệp vào AI như một hạ tầng cốt lõi, chứ không chỉ là công cụ thử nghiệm.
Trong bối cảnh đó, việc Anthropic nhấn mạnh “đội tác nhân” và OpenAI mở rộng Codex thành công cụ đa dụng cho lao động tri thức cho thấy cả hai đều đang nhắm tới cùng một mục tiêu: trở thành nền tảng AI trung tâm trong hoạt động doanh nghiệp. Cuộc cạnh tranh không còn chỉ là ai viết mã tốt hơn, mà là ai có thể cung cấp một hệ sinh thái tác nhân AI linh hoạt, hiệu quả và đáng tin cậy hơn để thay thế hoặc bổ trợ cho con người trong nhiều khâu công việc.
Sự ra mắt gần như đồng thời của Opus 4.6 và GPT-5.3 Codex vì thế có thể được xem như phát súng mở màn cho một “cuộc chiến AI lập trình” đúng nghĩa. Ở đó, công nghệ, truyền thông, chiến lược kinh doanh và cả cá tính của các nhà lãnh đạo đều đan xen, tạo nên một cuộc đua có mức cược rất cao. Với tốc độ đổi mới hiện nay, ranh giới giữa người viết phần mềm và AI viết phần mềm ngày càng mờ nhạt, và kết quả của cuộc cạnh tranh giữa OpenAI và Anthropic nhiều khả năng sẽ định hình cách thế giới xây dựng, vận hành và kiểm soát phần mềm trong thập kỷ tới.
CEO Sam Altman cho rằng GPT-5.3 Codex là dấu hiệu cho thấy tốc độ phát triển AI có thể tăng theo cấp số nhân, khi chính AI trở thành công cụ hỗ trợ trực tiếp cho việc xây dựng thế hệ AI tiếp theo. Ảnh: Getty Images
Dario Amodei, Giám đốc điều hành và đồng sáng lập Anthropic, nhấn mạnh Opus 4.6 phát triển “đội tác nhân” cho doanh nghiệp. Ảnh: Reuters

