OpenAI ra mắt công cụ tạo video AI Sora -

OpenAI đã chính thức phát hành công cụ tạo video trí tuệ nhân tạo Sora, nhưng công ty sẽ không cho phép hầu hết người dùng tái hiện hình ảnh con người để tránh các hình thức lạm dụng.

Người dùng phiên bản cao cấp có trả phí của sản phẩm chủ lực ChatGPT của OpenAI giờ đây có thể sử dụng Sora để tạo video AI ngay lập tức dựa trên các lệnh văn bản (written commands), ví dụ như tạo các đoạn video chất lượng cao về gấu đấu vật sumo và mèo nhâm nhi cà phê.

Một ví dụ trên trang web của OpenAI sử dụng gợi ý “một cảnh rộng, yên bình về một gia đình voi ma mút len lông trong sa mạc mở.” Video của Sora hiển thị hình ảnh ba sinh vật đã tuyệt chủng này chậm rãi bước qua các đụn cát.

“Chúng tôi hy vọng phiên bản ban đầu của Sora sẽ cho phép mọi người trên toàn thế giới khám phá các hình thức sáng tạo mới, kể câu chuyện của mình và mở rộng giới hạn của những gì có thể đạt được với việc kể chuyện bằng video,” OpenAI viết trong một bài đăng blog.

Tuy nhiên, chỉ một nhóm nhỏ những người thử nghiệm được mời mới có thể sử dụng Sora để tạo video có hình ảnh con người, khi OpenAI đang nỗ lực “giải quyết các mối quan ngại về việc sử dụng trái phép hình ảnh,” công ty cho biết trong một bài đăng blog. Trước đó, Sora được giới thiệu lần đầu vào tháng 2, nhưng chỉ dành riêng cho một số nghệ sĩ, nhà làm phim và người kiểm thử an toàn.

Trước khi phát hành Sora vào hôm thứ Hai, OpenAI đã để nhà phê bình công nghệ Marques Brownlee thử nghiệm công cụ này. Brownlee nhận xét kết quả “vừa đáng sợ vừa truyền cảm hứng.” Anh cho rằng Sora làm tốt với các cảnh quan và hiệu ứng phong cách, nhưng lại gặp khó khăn trong việc tái hiện các nguyên tắc vật lý cơ bản một cách thực tế. Một số nhà làm phim cũng đã xem trước công cụ này cho biết Sora tạo ra các lỗi hình ảnh kỳ lạ (visual defects).

Hai tuần trước, công ty đã tạm dừng quyền truy cập vào công cụ khi một nhóm nghệ sĩ tạo ra một lỗ hổng (backdoor) cho phép bất kỳ ai cũng có thể sử dụng Sora. Trong một tuyên bố được đăng trên cộng đồng AI Hugging Face, nhóm này cáo buộc OpenAI “đánh bóng nghệ thuật” (art washing) cho một sản phẩm có thể lấy đi kế sinh nhai của các nghệ sĩ như họ. Nhóm này, tự gọi mình là “Sora PR Puppets,” cho rằng công ty đang cố tạo dựng một câu chuyện tích cực cho sản phẩm bằng cách gắn kết với những người sáng tạo.

Được biết, OpenAI vẫn đang giải quyết các yêu cầu tuân thủ Đạo luật An toàn Trực tuyến tại Anh và Đạo luật Dịch vụ Kỹ thuật số ở EU.

Các công cụ AI chuyển văn bản thành video như Sora được xem là một cách để tiết kiệm chi phí trong việc tạo video giải trí và quảng cáo mới, nhưng cũng dấy lên lo ngại về mức độ dễ dàng để mạo danh con người thật trong chính trị và các lĩnh vực khác.

OpenAI cho biết họ đang chặn nội dung có chứa hình ảnh khỏa thân, và ưu tiên hàng đầu là ngăn chặn các hình thức lạm dụng gây nguy hại nhất, bao gồm nội dung lạm dụng tình dục trẻ em và deepfake (hình ảnh giả mạo tinh vi giống thật) tình dục.

Sản phẩm rất được mong đợi (highly anticipated product) này đã nhận được phản hồi lớn ngay khi ra mắt vào thứ Hai, khiến OpenAI phải tạm thời ngừng tạo tài khoản mới.

“Hiện tại chúng tôi đang gặp lưu lượng truy cập lớn và đã tạm thời vô hiệu hóa việc tạo tài khoản Sora,” theo thông báo trên trang web của công ty.

OpenAI lần đầu tiên giới thiệu Sora vào đầu năm nay, nhưng lúc đó cho biết họ muốn tham khảo ý kiến của các nghệ sĩ, nhà hoạch định chính sách và các bên liên quan khác trước khi phát hành công cụ mới này ra công chúng.

Công ty, hiện đang bị kiện bởi một số tác giả và tờ The New York Times về việc sử dụng các tác phẩm có bản quyền để huấn luyện ChatGPT, vẫn chưa tiết lộ những hình ảnh và nguồn video nào đã được sử dụng để huấn luyện Sora.

Sora sẽ được cung cấp cho những người đã đăng ký và trả phí sử dụng các công cụ của OpenAI. Người dùng ở Mỹ và “hầu hết các quốc gia quốc tế” sẽ được truy cập vào công cụ này, nhưng Sora sẽ không khả dụng ở Anh hoặc châu Âu.

OpenAI được biết đến với chatbot phổ biến là ChatGPT, nhưng công ty đang mở rộng sang các dạng trí tuệ nhân tạo tạo sinh khác. Họ đang phát triển một công cụ sao chép giọng nói (voice-cloning tool) và đã tích hợp công cụ tạo hình ảnh, Dall-E, vào các chức năng của ChatGPT.

Ảnh chụp màn hình của một video clip AI về “một cảnh rộng, yên bình về một gia đình voi ma mút len lông trong sa mạc mở”. Ảnh: The Guardian