Midjourney chính thức bước vào cuộc đua video AI với mô hình V1, cho phép chuyển đổi ảnh thành video nghệ thuật và đặt mục tiêu xa hơn là xây dựng mô phỏng thế giới thực bằng AI.
Theo đó, Midjourney – startup nổi tiếng trong lĩnh vực tạo ảnh bằng AI – vừa chính thức công bố V1, mô hình tạo video đầu tiên của hãng, sau thời gian dài được cộng đồng chờ đợi.
Từ ảnh tĩnh đến chuyển động ấn tượng
V1 là một mô hình chuyển đổi từ ảnh sang video. Người dùng có thể tải lên một hình ảnh bất kỳ – hoặc sử dụng ảnh được tạo bởi các mô hình khác của Midjourney – và V1 sẽ tạo ra bốn đoạn video dài 5 giây, dựa trên hình ảnh đầu vào. Tương tự như các mô hình ảnh trước đó, V1 chỉ hoạt động qua nền tảng Discord và hiện tại chỉ hỗ trợ phiên bản web.
Sự xuất hiện của V1 đưa Midjourney vào cuộc cạnh tranh trực tiếp với các “ông lớn” trong lĩnh vực video AI như Sora (OpenAI), Gen-4 (Runway), Firefly (Adobe) hay Veo 3 (Google). Tuy nhiên, Midjourney từ lâu đã định vị mình khác biệt, khi ưu tiên phục vụ các nhu cầu sáng tạo nghệ thuật thay vì mục tiêu thương mại thuần túy.
Tầm nhìn xa hơn cả… video quảng cáo
Theo chia sẻ từ CEO David Holz, V1 không chỉ đơn thuần nhằm tạo ra các đoạn phim ngắn cho quảng cáo hay điện ảnh, mà là bước đệm để hiện thực hóa mục tiêu dài hạn: phát triển các mô hình AI có khả năng mô phỏng thế giới mở theo thời gian thực. Sau V1, Midjourney dự kiến sẽ tiếp tục phát triển mô hình tạo hình ảnh 3D và các hệ thống AI tương tác thời gian thực.

Vừa ra mắt đã gặp sóng gió pháp lý
V1 được giới thiệu chỉ một tuần sau khi Midjourney bị hai hãng phim lớn của Hollywood – Disney và Universal – đệ đơn kiện, với cáo buộc mô hình tạo ảnh AI của hãng đã tái hiện các nhân vật có bản quyền như Homer Simpson hay Darth Vader.
Các studio Hollywood hiện đang đau đầu trước làn sóng công nghệ AI sáng tạo, lo ngại rằng các mô hình này sẽ ảnh hưởng tiêu cực đến công việc của các nghệ sĩ, đạo diễn và nhà thiết kế truyền thống. Nhiều công ty truyền thông cho rằng sản phẩm AI của các startup như Midjourney được huấn luyện trên dữ liệu có bản quyền mà không có sự cho phép.
Trải nghiệm V1: Còn mới nhưng đầy hứa hẹn
Midjourney áp dụng mức phí tạo video cao gấp 8 lần so với tạo ảnh, đồng nghĩa người dùng sẽ tiêu tốn nhanh hơn hạn mức sử dụng hàng tháng nếu tạo video. Gói rẻ nhất để trải nghiệm V1 hiện có giá 10 USD/tháng, trong khi các gói Pro (60 USD) và Mega (120 USD) cho phép tạo video không giới hạn ở chế độ “chậm” (Relax mode). Hãng cho biết sẽ đánh giá lại mức giá trong thời gian tới.
V1 cũng cung cấp một số tuỳ chỉnh hữu ích:
- Người dùng có thể chọn chế độ hoạt ảnh tự động (tạo chuyển động ngẫu nhiên) hoặc mô tả cụ thể chuyển động mong muốn bằng văn bản.
- Ngoài ra, có thể tùy chỉnh độ mạnh yếu của chuyển động bằng cách chọn “low motion” hoặc “high motion”.
- Mỗi đoạn video dài 5 giây có thể được kéo dài thêm 4 giây, tối đa 4 lần, nghĩa là video có thể dài đến 21 giây.
Các bản demo ban đầu cho thấy V1 mang phong cách hình ảnh mang màu sắc siêu thực, đậm chất nghệ thuật – tương tự những gì người dùng từng thấy ở các mô hình ảnh trước đây của Midjourney. Dù nhận được phản hồi tích cực, khả năng cạnh tranh của V1 với những đối thủ mạnh như Sora hay Gen-4 vẫn cần thêm thời gian để kiểm chứng.
Nguồn: Midjourney
https://www.midjourney.com/updates/introducing-our-v1-video-model

