Trong ngữ cảnh: Midjourney v6 đã ra mắt như một món quà Giáng sinh dành cho những người đam mê AI. Phiên bản mới nhất của trình tạo hình ảnh này hứa hẹn mang lại những hình ảnh chân thực hơn, chức năng bổ sung và giải quyết một số thiếu sót đáng kể của công cụ. Tuy nhiên, người dùng có kinh nghiệm có thể cần phải tìm hiểu lại một số điều.
Phiên bản thứ sáu của Midjourney hiện có sẵn cho tất cả người dùng. Chỉ vài giờ sau khi ra mắt, mạng xã hội tràn ngập những hình ảnh giới thiệu những cải tiến của nó.
Để sử dụng Midjourney v6, chỉ cần nhập “-v 6” sau bất kỳ lời nhắc nào (hãy nhớ Midjourney hoạt động thông qua Discord). Người dùng cũng có thể kích hoạt bản cập nhật bằng cách nhập “/settings” vào máy chủ Midjourney Discord hoặc gửi tin nhắn trực tiếp đến bot Midjourney của máy chủ và chọn V6 từ menu thả xuống.
MidJourney v6 tốt hơn rất nhiều trong việc đưa từ vào hình ảnh �”�
Dưới đây là một vài ví dụ.
Lời nhắc trong ALT! pic.twitter.com/EAGdq65hEZ
– Ammaar Reshi (@ammaar) Ngày 21 tháng 12 năm 2023
Nhà thiết kế đồ họa Julie Wieland được so sánh Midjourney v6 cho một dự án độc lập đang phát triển thành sản phẩm của Hollywood, ca ngợi hiệu ứng ánh sáng nâng cao. Những người dùng khác đã đăng nhiều hình ảnh thực tế, một số không thể phân biệt được với tác phẩm chỉnh sửa bằng tay. Mặc dù lỗi vẫn xảy ra nhưng việc tìm kiếm chúng dường như mất nhiều thời gian hơn với mỗi phiên bản mới, điều này vừa hấp dẫn vừa đáng lo ngại.
Sự phát triển của Midjourney trong suốt ~1,5 năm pic.twitter.com/slfnIbDpXW
– Vensy (@vensykrishna) Ngày 21 tháng 12 năm 2023
Wieland cũng lưu ý rằng hệ thống nhắc nhở cập nhật yêu cầu cô phải đánh giá lại cách tiếp cận sử dụng Midjourney của mình. Các nhà phát triển khẳng định rằng khả năng hiểu ngôn ngữ tự nhiên của công cụ này đã được cải thiện. Người dùng Tatiana Tsiguleva ghi nhận những lời nhắc đó bây giờ cần có chỉ dẫn rõ ràng về phong cách, chủ đề, bối cảnh, bố cục và các yếu tố khác.
midjourney v6 thực sự có cảm giác như sản xuất phim độc lập đã phát triển thành sản phẩm của Hollywood �'�
giữa cuộc hành trình v6 + tráng lệ + lightroom pic.twitter.com/Akq86PpxuS
– Julie W. Thiết kế (@juliewdesign_) Ngày 21 tháng 12 năm 2023
Một tính năng mới đáng chú ý của Midjourney v6 là khả năng hiển thị văn bản dễ đọc. Trước đây, các từ bị cắt xén là dấu hiệu phổ biến của hình ảnh do AI tạo ra. Giờ đây, người dùng đang chia sẻ hình ảnh với văn bản theo nhiều phong cách khác nhau, chẳng hạn như bảng hiệu đèn neon hoặc phấn, thể hiện sự thành thạo của công cụ trong lĩnh vực này. Cải tiến này cũng giúp Midjourney tái tạo chính xác logo của các thương hiệu nổi tiếng như McDonald's hay Cô-ca Cô-la.

Hình ảnh bên dưới là một ví dụ khá hay về việc Midjourney đã đi được bao xa cũng như những thiếu sót còn tồn tại trong việc tạo hình ảnh AI. Nó mô tả một cách thuyết phục áp phích loạt phim Netflix hư cấu với sự tham gia của Leonardo DiCaprio trong vai Vladimir Lenin, thậm chí còn hiển thị chính xác tiêu đề và logo Netflix, điều mà các phiên bản trước đó không thể làm được.

Tuy nhiên, một áp phích Netflix đích thực có thể sẽ không sử dụng cùng một phông chữ cho từ “Netflix” bên dưới tiêu đề. Ngoài ra, ảnh thứ hai, tùy thuộc vào các quyết định sáng tạo, có thể không có tên chính trị gia Nga trong bảng chữ cái Latinh. Không rõ liệu Midjourney v6 có thể xử lý văn bản không phải tiếng Latinh hay không.
Phim 35mm vẫn về một khu chợ La Mã cổ đại vào ban ngày. Những người trong trang phục La Mã truyền thống đang trao đổi hàng hóa, có các quầy hàng bán trái cây, rau và đồ gốm, và ở phía sau là Đấu trường La Mã.
–v 6 (trên cùng)
–v 5.2 (dưới cùng) pic.twitter.com/ZHZyRs8MAz– Nick St. Pierre (@nickfloats) Ngày 21 tháng 12 năm 2023
So sánh Midjourney v5.2 và v6 trong miêu tả một khu chợ La Mã cổ đại minh họa một điểm khác. Hình ảnh v6 trông chân thực hơn so với phiên bản tiền nhiệm. Tuy nhiên, cả hai đều mô tả không chính xác Đấu trường La Mã bị tàn phá trong thời La Mã cổ đại. Điều này nêu bật cuộc đấu tranh liên tục của AI tạo sinh với bối cảnh và gợi ý rằng việc nhắc nhở cẩn thận có thể giảm thiểu các lỗi logic như vậy.
1. Lời nhắc: Một người đàn ông đứng một mình trong khu vực trống tối, nhìn chằm chằm vào tấm biển đèn neon có chữ “EMPTY” pic.twitter.com/LTcDE9T5eB
– Đuổi theo Lean (@chaseleantj) Ngày 21 tháng 12 năm 2023
Một sự phát triển thú vị khác là hình ảnh đa bảng. Mặc dù trình tạo hình ảnh AI vẫn phải đối mặt với những thách thức trong việc duy trì tính liên tục về hình ảnh trong chuỗi sự kiện, Midjourney v6 có thể tạo nên một bức tranh có nhiều khung, mỗi khung có một chủ đề hoặc góc độ khác nhau.


