Trong khi OpenAI có dấu hiệu thu hẹp nỗ lực trong lĩnh vực tạo video khi đóng ứng dụng Sora, ByteDance hôm thứ Năm xác nhận mô hình âm thanh – video mới của hãng, Dreamina Seedance 2.0, đang được triển khai trên nền tảng chỉnh sửa CapCut.
ByteDance cho biết mô hình này cho phép người sáng tạo soạn thảo, chỉnh sửa và đồng bộ nội dung video – âm thanh thông qua lệnh văn bản, hình ảnh hoặc video tham chiếu.
Việc triển khai sẽ diễn ra theo từng giai đoạn, bắt đầu với người dùng CapCut tại Brazil, Indonesia, Malaysia, Mexico, Philippines, Thái Lan và Việt Nam, trước khi mở rộng sang các thị trường khác.
Thông tin này được đưa ra sau khi có báo cáo cho rằng việc triển khai toàn cầu của mô hình bị tạm dừng để xử lý các vấn đề liên quan đến quyền sở hữu trí tuệ, vốn bị ngành công nghiệp Hollywood chỉ trích vì nguy cơ vi phạm bản quyền. Đây cũng có thể là lý do khiến phạm vi phát hành hiện còn hạn chế.
Tại Trung Quốc, mô hình đã có sẵn trên ứng dụng Jianying của ByteDance.
Theo công ty, Dreamina Seedance 2.0 có thể tạo video ngay cả khi không có hình ảnh tham chiếu, chỉ cần vài từ mô tả cảnh. Công cụ này cũng có khả năng tái tạo chân thực kết cấu, chuyển động và ánh sáng ở nhiều góc nhìn khác nhau, giúp chỉnh sửa, nâng cao hoặc hiệu chỉnh video của người dùng.
Một ứng dụng khác là cho phép nhà sáng tạo thử nghiệm ý tưởng từ các bản phác thảo ban đầu trước khi quay video thực tế.
Ngoài ra, mô hình có thể phục vụ nhiều loại nội dung như công thức nấu ăn, hướng dẫn thể dục, giới thiệu sản phẩm/doanh nghiệp, hoặc các video có nhiều chuyển động – vốn là điểm khó đối với các mô hình video AI trước đây.
Ở thời điểm ra mắt, mô hình hỗ trợ tạo clip dài tối đa 15 giây với sáu tỷ lệ khung hình khác nhau.
Trong CapCut, Dreamina Seedance 2.0 sẽ xuất hiện ở nhiều khu vực, bao gồm các tính năng chỉnh sửa như AI Video và công cụ tạo nội dung như Video Studio. Mô hình cũng sẽ được tích hợp vào nền tảng tạo nội dung AI Dreamina và nền tảng marketing Pippit của ByteDance.
Do khả năng tạo nội dung chân thực, ByteDance cho biết đã áp dụng các biện pháp hạn chế để đảm bảo an toàn, chẳng hạn không cho phép tạo video từ hình ảnh hoặc video chứa khuôn mặt thật, đồng thời chặn việc tạo nội dung vi phạm quyền sở hữu trí tuệ. Tuy vậy, việc mô hình chưa có mặt tại Mỹ cho thấy các biện pháp này có thể vẫn đang được hoàn thiện.
Các nội dung do Dreamina Seedance 2.0 tạo ra cũng sẽ được gắn hình mờ watermark để nhận diện khi chia sẻ ra ngoài nền tảng, hỗ trợ các yêu cầu gỡ bỏ nếu phát sinh vi phạm bản quyền.
ByteDance cho biết sẽ hợp tác với các chuyên gia và cộng đồng sáng tạo trong quá trình triển khai để tiếp tục cải thiện năng lực của mô hình.

ByteDance giới thiệu mô hình tạo video AI Dreamina Seedance 2.0, tích hợp vào nền tảng chỉnh sửa CapCut, cho phép tạo và đồng bộ video – âm thanh từ prompt và dữ liệu tham chiếu. Ảnh: ByteDance

