
Phòng thí nghiệm AI Trung Quốc DeepSeek vừa âm thầm cập nhật Prover – mô hình AI được thiết kế để giải các bài toán liên quan đến chứng minh và định lý.
Theo tờ South China Morning Post, DeepSeek đã tải lên phiên bản mới nhất của Prover, bản V2, cùng với một biến thể rút gọn, lên nền tảng phát triển AI Hugging Face vào tối thứ Tư. Có vẻ như phiên bản này được xây dựng dựa trên mô hình V3 của startup này, với 671 tỷ tham số và sử dụng kiến trúc “hỗn hợp chuyên gia” (MoE – Mixture of Experts), một kiến trúc đòi hỏi ít năng lực tính toán hơn.
Các tham số được hiểu tương đối là năng lực giải quyết vấn đề của một mô hình, trong khi kiến trúc MoE chia nhỏ các nhiệm vụ thành các phân nhiệm và phân bổ cho những thành phần “chuyên gia” nhỏ hơn và chuyên biệt hơn.
DeepSeek lần cuối cập nhật Prover vào tháng 8, khi đó mô tả đây là một mô hình AI tùy chỉnh và được công khai nhằm phục vụ việc chứng minh định lý hình thức và lập luận toán học.
Hồi tháng 2, Reuters đưa tin rằng DeepSeek đang cân nhắc gọi vốn bên ngoài lần đầu tiên. Gần đây, công ty đã phát hành phiên bản nâng cấp của mô hình V3 đa năng và được cho là sắp cập nhật mô hình “lập luận” R1.
DeepSeek vừa cập nhật Prover – mô hình AI được thiết kế để giải các bài toán liên quan đến chứng minh và định lý