Hệ thống A.I mới DALL-E 2 của của OpenAI có thể tạo ra những hình ảnh đẹp mê hồn từ văn bản.
Vào tháng 1/2021, OpenAI đã giới thiệu hệ thống DALL-E – một mạng nơ-ron thông minh thế hệ mới. Công ty này cho biết hệ thống mới này có thể “lấy bất kỳ văn bản nào và tạo ra hình ảnh từ đó”, theo nhà khoa học và đồng sáng lập của OpenAI, Ilya Sutskever.
Để chứng minh cho tuyên bố trước đó, mới đây, OpenAI đã trở lại với một phiên bản thậm chí còn ấn tượng hơn của chương trình trước đó có tên là DALL-E. Theo trang web của OpenAI, “DALL-E 2 là một hệ thống A.I. (trí tuệ nhân tạo) mới có thể tạo ra hình ảnh và nghệ thuật thực tế từ mô tả bằng ngôn ngữ tự nhiên.”

Trang web đưa ra nhiều ví dụ về các tác phẩm của hệ thống A.I. này và chúng không có gì là quá ấn tượng. Ví dụ: các từ “một phi hành gia” “cưỡi ngựa” và “theo phong cách ảnh thực – photorealistic style” được hệ thống này tạo ra những bức ảnh.
Điều đáng ngạc nhiên ở đây là hệ thống A.I. hiểu vị trí đặt phi hành gia lên ngựa và thế nào là chân thực. OpenAI nói thêm rằng “DALL-E 2 có thể thực hiện các chỉnh sửa thực tế cho hình ảnh hiện có từ chú thích ngôn ngữ tự nhiên. Nó có thể thêm và xóa các yếu tố đặc biệt như hiệu ứng đổ bóng, phản chiếu và kết cấu bức ảnh.”
OpenAI giải thích rằng “DALL – E 2 đã học được mối quan hệ giữa hình ảnh và văn bản được sử dụng để mô tả chúng. Nó sử dụng một quy trình gọi là “khuếch tán – diffusion”, bắt đầu với một mẫu các chấm ngẫu nhiên và dần dần thay đổi mẫu đó theo hướng hình ảnh khi nó nhận ra các khía cạnh cụ thể của hình ảnh đó.”
“Tuyệt vời hơn nữa, chính sách nội dung của OpenAI không cho phép người dùng tạo nội dung bạo lực, nội dung người lớn hoặc yếu tố chính trị, trong số các danh mục khác, làm cho chương trình an toàn cho mọi người.” – OpenAI giải thích thêm.