Trở nên tốt hơn: Với tất cả các tin tức gần đây xoay quanh ChatGPT và các mô hình ngôn ngữ lớn khác, thật dễ dàng để quên rằng những người anh em họ của họ—trình tạo hình ảnh AI—vẫn đang được cải thiện. Người ta có thể đã tìm ra cách kết xuất mắt và tay mà không làm cho đối tượng trông giống như một thứ gì đó trong cơn ác mộng. tuy nhiên, kết quả vẫn khiến một số người kinh ngạc.
Đầu tuần này, phòng thí nghiệm nghiên cứu giữa hành trình đã phát hành bản beta cho phiên bản 5 của phần mềm hình ảnh AI tự đặt tên. Theo thông báo của nó thông qua Twitter, phiên bản mới nhất bổ sung chất lượng hình ảnh cao hơn, kết quả “đa dạng” hơn, phạm vi phong cách mở rộng hơn, kết cấu liền mạch, v.v.
Bắt đầu từ hôm nay, cộng đồng của chúng ta có thể thử nghiệm Midjourney V5. Nó có chất lượng hình ảnh cao hơn nhiều, đầu ra đa dạng hơn, phạm vi phong cách rộng hơn, hỗ trợ kết cấu liền mạch, tỷ lệ khung hình rộng hơn, gợi ý hình ảnh tốt hơn, dải động rộng hơn, v.v. Hãy cùng khám phá!
– Giữa hành trình (@midjourney) Ngày 15 tháng 3 năm 2023
Người dùng đã đăng hàng trăm kết quả tuyệt vời và cảm xúc về những cải tiến là khác nhau. Hầu hết đều ấn tượng vì AI hình ảnh đã phải vật lộn để tạo ra các khía cạnh như bóng, phản chiếu, mắt và tay. Dưới đây là hình ảnh chúng ta tạo bằng OpenAI’s Dall-E để làm ví dụ về nơi máy gặp sự cố.

Bố cục hơi khác và cảm giác chung là giống hoạt hình. Ánh sáng là tất cả sai. Mắt và tay bị biến dạng nặng. Chân bị vấy bẩn bởi đồ tạo tác, hộp đựng bỏng ngô và chỗ ngồi bên cạnh đối tượng cũng vậy. kết quả này là một trong bốn với các vấn đề tương tự ở các mức độ khác nhau.

Phiên bản 5 của Midjourney dường như đã được cải thiện về mặt này, ít nhất là từ những ví dụ mà những người khác đã chia sẻ. Kết quả từ những lời nhắc đơn giản bao quanh thung lũng kỳ lạ—đủ thực tế để vượt qua những bức ảnh chuyên nghiệp trong nhiều trường hợp, nhưng vẫn có chất lượng kỳ lạ mà bạn không thể đặt được. Mặc dù vô cùng thực tế, nhiều người đã mô tả những hình ảnh này là rùng rợn.
Giữa hành trình v5 là ở đây! (lần này là thật, lol)
Dưới đây là một số lời nhắc song song của tôi, v4 so với v5, cũng như một số lời nhắc mới và ảnh chụp đám đông. Tôi sẽ thêm nhiều hơn vào điều này khi tôi thử nghiệm.
ð§µ pic.twitter.com/qSEZWQBXou
– Nick St.Pierre (@nickfloats) Ngày 15 tháng 3 năm 2023
Kishalaya Kundu của chúng ta đã nói, “Thành thật mà nói, tôi sợ hơn là ấn tượng,” sau khi xem một loạt ảnh chụp Midjourney V5 gần như hoàn hảo. Nỗi sợ hãi là người ta có thể khá dễ dàng tạo ra một hình ảnh giả mạo và biến nó thành thật.

Bỏ qua yếu tố creep, so với V4, Midjourney V5 đã cải thiện đáng kể về chất lượng. Người thiết kế đồ họa Julie Wieland đã sử dụng Midjourney V4 (phát hành vào tháng 11 năm ngoái) một thời gian và nói rằng phiên bản 5 có “vô cùng thực tế” kết cấu da. Các hiệu ứng ánh sáng cũng tốt hơn nhiều, bao gồm phản chiếu, ánh sáng chói và bóng. Có lẽ quan trọng nhất là AI tạo ra bàn tay và đôi mắt trông tự nhiên nhất trong hầu hết thời gian.
�”� Mẹo của MJ: cuối cùng cũng có thể chụp ảnh qua cửa sổ với V5!
Tôi đã khao khát tính thẩm mỹ của “My Blueberry Nights” kể từ lần đầu tiên tôi dùng thử Dalle2 (và nó vẫn ổn-ish), nhưng v5 thật khó hiểu!
�’ tìm lời nhắc trong văn bản ALT của hình ảnh #tổng hợp #giữahành trìnhv5 pic.twitter.com/kAOagopucG
– Thiết kế của Julie W. (@juliewdesign_) Ngày 17 tháng 3 năm 2023
Wieland nói với Ars Technica: “Đôi mắt gần như hoàn hảo và không còn run nữa. “Các bàn tay luôn hoạt động chính xác, với năm ngón tay thay vì 7-10 ngón tay trên một bàn tay. MJ v5 hiện đối với tôi như cuối cùng cũng phải đeo kính sau khi bỏ qua thị lực kém trong một thời gian dài. Đột nhiên bạn nhìn thấy mọi thứ ở 4k; nó cảm thấy choáng ngợp một cách kỳ lạ nhưng cũng rất tuyệt vời.”
Ảnh phong cách đường phố những năm 1960 của một phụ nữ trẻ, ngồi, thuyền buồm, váy dior xanh, váy lụa xanh, váy xanh, lụa, vòng cổ ngọc trai, ngọc trai tiffany, vòng cổ ngọc trai tiffany, hoàng hôn, đại dương, chụp trên Agfa Vista 200, 4k –ar 16:9
v4 (trái) v5 (phải) pic.twitter.com/wz7GbI3fvA
– Nick St.Pierre (@nickfloats) Ngày 15 tháng 3 năm 2023
Midjourney cũng cải thiện độ phân giải gốc từ 512x512px lên 1024x1024px. Mức tăng phù hợp với Dall-E. Tuy nhiên, Phiên bản 4 có thể thay thế mẫu để tăng gấp đôi độ phân giải gốc. Không phải vô lý khi mong đợi V5 sử dụng kỹ thuật tương tự để tạo ra hình ảnh 2048×2048, nhưng đó là bản cập nhật tiếp theo.

Điểm mấu chốt là MidJourney chỉ mới xuất hiện trong bối cảnh AI một năm trước. Nhiều (không phải tất cả) những hình ảnh tràn ngập nguồn cấp dữ liệu Twitter trong tuần này vẫn chưa được xử lý. Trước đây, Weiland đã sử dụng kết hợp nhiều kỹ thuật để cải thiện chất lượng hình ảnh của Midjourney 4, bao gồm cả “outpainting” bằng Dall-E và chỉnh sửa trong Photoshop. Phiên bản 5 hứa hẹn ít chỉnh sửa hậu kỳ hơn và có lẽ hình ảnh hoàn hảo sớm hơn chúng ta có thể tưởng tượng. Viễn cảnh này thực sự vừa thú vị vừa đáng sợ.


