Tập đoàn công nghệ Trung Quốc Tencent vào tối thứ Sáu đã chính thức ra mắt mô hình suy luận Hunyuan T1, có khả năng cạnh tranh với DeepSeek R1 cả về hiệu suất lẫn giá thành.
Tencent cho biết trong một bài đăng trên tài khoản WeChat chính thức rằng, phiên bản T1 nâng cấp mang lại thời gian phản hồi nhanh hơn và khả năng xử lý các tài liệu văn bản dài được cải thiện.
T1 có thể “giữ cho logic nội dung rõ ràng và văn bản gọn gàng, mạch lạc”, bài đăng cho biết, đồng thời tỷ lệ sinh ảo giác của mô hình này là “cực kỳ thấp”.
Việc ra mắt diễn ra trong bối cảnh cạnh tranh gia tăng tại thị trường AI Trung Quốc sau khi DeepSeek tung ra các mô hình có hiệu suất tương đương hoặc vượt trội so với các hệ thống phương Tây với chi phí thấp hơn đáng kể.
Trước đó, Tencent đã phát hành phiên bản xem trước của T1 thông qua các nền tảng, bao gồm ứng dụng trợ lý AI Yuanbao.
Phiên bản chính thức này sẽ được hỗ trợ bởi mô hình ngôn ngữ nền tảng Turbo S của Tencent, ra mắt vào cuối tháng trước, mà công ty khẳng định xử lý truy vấn nhanh hơn so với mô hình R1 của DeepSeek.
Sản phẩm mới nhất của tập đoàn công nghệ Trung Quốc sử dụng phương pháp học tăng cường quy mô lớn, kỹ thuật cũng được DeepSeek áp dụng cho mô hình R1 ra mắt hồi tháng 1.
So sánh T1 với DeepSeek-R1 và OpenAI o1
Phiên bản này là bản chính thức sau khi Tencent thử nghiệm bản beta T1-preview trên chatbot Yuanbao. Mô hình đạt 87,2 điểm trong bài kiểm tra Massive Multitask Language Understanding (MMLU) Pro, đánh giá mức độ hiểu biết của mô hình. Kết quả này vượt qua 84 điểm của DeepSeek-R1 nhưng vẫn thấp hơn 89,3 điểm của OpenAI o1 – mô hình suy luận được nhà sản xuất ChatGPT ra mắt vào tháng 12.
T1 cũng đạt điểm cao trong các bài đánh giá khác, bao gồm 78,2 điểm trong kỳ thi Toán học Mở rộng Hoa Kỳ (AIME) 2024, chỉ thấp hơn R1 (79,8) và o1 (79,2). Về khả năng xử lý ngôn ngữ tiếng Trung, T1 xuất sắc đạt 91,8 điểm trong bài kiểm tra C-Eval, ngang bằng với R1 và cao hơn 87,8 điểm của o1, theo Tencent.
T1 cũng cạnh tranh với DeepSeek về giá cả, yếu tố then chốt làm nên lợi thế của start-up Trung Quốc này. T1 tính phí 1 nhân dân tệ (0,14 USD) cho mỗi 1 triệu token đầu vào, trong khi đầu ra có giá 4 nhân dân tệ cho mỗi triệu token. Mức giá đầu vào này tương đương với R1, vốn tính 1 nhân dân tệ cho mỗi triệu token vào ban ngày và chỉ 0,25 nhân dân tệ vào ban đêm. Giá đầu ra của T1 cũng tương đối cạnh tranh, khi R1 tính phí 16 nhân dân tệ vào ban ngày và giảm còn 4 nhân dân tệ vào ban đêm.
Tencent cho biết họ là đơn vị đầu tiên trong ngành áp dụng kiến trúc lai kết hợp giữa Transformer của Google và Mamba – công nghệ được phát triển bởi Đại học Carnegie Mellon và Đại học Princeton. So với kiến trúc Transformer thuần túy, phương pháp lai này “giúp giảm đáng kể chi phí đào tạo và suy luận” nhờ giảm sử dụng bộ nhớ, theo tuyên bố từ Tencent.
Tencent đã tăng cường đầu tư vào AI trong những tháng gần đây. Hôm thứ Năm, công ty thông báo sẽ tăng chi tiêu vốn vào năm 2025, sau khi đã chi mạnh tay cho AI trong suốt năm 2024.
Trong hình là trụ sở của Tencent tại khuôn viên Tencent Binhai ở Thâm Quyến, tỉnh Quảng Đông, Trung Quốc.