Sora của OpenAI giúp chuyển đổi những đoạn văn bản thành những cảnh quay cảnh quay video phức tạp với nhiều nhân vật, các loại chuyển động cụ thể theo ý của người dùng dựa trên trí tuệ nhân tạo AI.
Sora là một mô hình sinh video mới do OpenAI phát triển. Theo công ty AI này, Sora có khả năng “tạo ra những cảnh quay thực tế và sáng tạo từ những chỉ dẫn bằng văn bản.” Mô hình này cho phép người dùng tạo ra những video sinh động lên đến một phút dựa trên những gợi ý mà họ viết ra.
Sora có thể tạo ra những “cảnh quay phức tạp với nhiều nhân vật, các loại chuyển động cụ thể, và những chi tiết chính xác về đối tượng và nền,” OpenAI viết trong bài giới thiệu về mô hình. Công ty cũng cho biết rằng mô hình có thể hiểu được cách các vật thể “tồn tại trong thế giới vật lý,” cũng như “giải thích chính xác các đạo cụ và tạo ra những nhân vật hấp dẫn có biểu cảm sống động.”

Mô hình cũng có thể sinh video dựa trên một hình ảnh tĩnh, hoặc bổ sung những khung hình bị thiếu trong một video có sẵn hoặc kéo dài nó. Những video do Sora tạo ra được trình bày trong bài viết của OpenAI bao gồm một cảnh quay không khí của California trong thời kỳ sốt vàng, một video như thể được quay từ bên trong một chuyến tàu ở Tokyo, và một số khác. Nhiều video có những dấu hiệu cho thấy chúng được tạo bởi AI – như sàn nhà di chuyển lạ trong một video của bảo tàng – và OpenAI nói rằng mô hình “có thể gặp khó khăn trong việc mô phỏng chính xác vật lý của một cảnh quay phức tạp,” nhưng kết quả tổng thể vẫn rất ấn tượng.
Cách đây vài năm, những mô hình sinh hình ảnh từ văn bản như Midjourney là tiên phong trong khả năng chuyển đổi từ ngôn ngữ sang hình ảnh. Nhưng gần đây, video đã có những bước tiến đáng kể: những công ty như Runway và Pika đã cho thấy những mô hình sinh video từ văn bản ấn tượng của riêng họ, và Lumiere của Google cũng là một đối thủ lớn của OpenAI trong lĩnh vực này. Giống như Sora, Lumiere cũng cung cấp cho người dùng những công cụ sinh video từ văn bản và cũng cho phép họ tạo ra video từ một hình ảnh tĩnh.
Hiện tại, Sora chỉ được cung cấp cho những “đội ngũ kiểm tra đỏ – red teamers” – những người đánh giá mô hình về những rủi ro và hại tiềm ẩn. OpenAI cũng mở cửa cho một số nghệ sĩ hội họa, nhà thiết kế, và nhà làm phim để nhận phản hồi. Công ty cũng lưu ý rằng mô hình hiện tại có thể không mô phỏng chính xác vật lý của một cảnh quay phức tạp và có thể không giải thích đúng những trường hợp nhân quả.
Đầu tháng này, OpenAI thông báo rằng họ sẽ thêm những dấu nước vào công cụ sinh hình ảnh từ văn bản DALL-E 3, nhưng cũng nói rằng chúng có thể “dễ dàng bị loại bỏ.” Giống như những sản phẩm AI khác của mình, OpenAI sẽ phải đối mặt với những hậu quả của việc những video giả, sinh bởi AI mà có thể bị nhầm lẫn với thực tế.