Khoai tây nóng: Hơn 8.000 tác giả bao gồm những người nổi tiếng như James Patterson, Margaret Atwood và Jonathan Franzen đã ký một bức thư ngỏ yêu cầu các nhà lãnh đạo từ sáu công ty AI hàng đầu không sử dụng tác phẩm của họ cho các mô hình đào tạo mà không có sự đồng ý trước và đưa ra mức bồi thường.
Bức thư, được xuất bản bởi tổ chức của các nhà văn chuyên nghiệp The Authors Guild, được gửi tới các ông chủ của OpenAI, Alphabet, Meta, Stability AI, IBM và Microsoft. Nó kêu gọi các CEO về “sự bất công cố hữu” trong việc sử dụng các tác phẩm của các tác giả để đào tạo các mô hình ngôn ngữ lớn của họ mà không có sự đồng ý, tín dụng hoặc bồi thường.
“Những công nghệ này bắt chước và khơi dậy ngôn ngữ, câu chuyện, phong cách và ý tưởng của chúng ta. Hàng triệu cuốn sách, bài báo, bài tiểu luận và thơ có bản quyền cung cấp ‘thức ăn’ cho các hệ thống AI, những bữa ăn vô tận mà không có hóa đơn”, bức thư viết. .
“Bạn đang chi hàng tỷ USD để phát triển công nghệ AI. Thật công bằng khi bạn đền bù cho chúng tôi vì đã sử dụng các bài viết của chúng tôi, nếu không có nó thì AI sẽ trở nên tầm thường và cực kỳ hạn chế.”

Người ta cũng tuyên bố rằng nhiều văn bản sách mà các hệ thống AI được đào tạo đến từ các trang web vi phạm bản quyền khét tiếng.
NPR viết rằng một báo cáo sắp tới từ The Authors Guild cho thấy thu nhập của các nhà văn đã giảm 42% từ năm 2009 đến 2019, với thu nhập trung bình của một nhà văn toàn thời gian vào năm ngoái giảm xuống còn 23.000 USD. Với việc các AI sáng tạo như ChatGPT và Bard gây thêm áp lực cho họ và một số công ty đã thay thế công nhân bằng các hệ thống này, thật dễ hiểu sự tức giận bắt nguồn từ đâu.
Mary Rasenberger, Giám đốc điều hành của Hiệp hội Tác giả, cho biết mục đích của bức thư là thuyết phục các công ty AI giải quyết với các tác giả mà không đi theo con đường kiện tụng tốn kém và kéo dài. Không phải tất cả các tác giả đều tránh hành động pháp lý: Sarah Silverman, Paul Tremblay và Mona Awad là nguyên đơn trong các vụ kiện tập thể chống lại Meta và/hoặc OpenAI vì đã đào tạo các chương trình của họ trên các bản sao tác phẩm của họ bị vi phạm bản quyền.
OpenAI cho biết trong một tuyên bố (thông qua Tạp chí Phố Wall) rằng ChatGPT được đào tạo về “nội dung được cấp phép, nội dung có sẵn công khai và nội dung do người dùng và người đào tạo AI của con người tạo ra”, đồng thời nói thêm rằng công ty tôn trọng quyền của người sáng tạo và tác giả.
Không chỉ các tác giả có tác phẩm đang được sử dụng để đào tạo AI. Google đã cập nhật chính sách bảo mật của mình vào đầu tháng này để tuyên bố rõ ràng rằng công ty có quyền thu thập và phân tích hầu hết mọi thứ mọi người chia sẻ trên web để đào tạo hệ thống AI của mình.
Việc cạo văn bản của các công ty AI hiện đang là một vấn đề gây tranh cãi. Elon Musk cho biết Twitter đã giới hạn số lượng tweet mà các tài khoản có thể đọc mỗi ngày để giải quyết “mức độ cực cao” của việc thu thập dữ liệu và “thao túng hệ thống” trên nền tảng. Anh ta cũng đe dọa sẽ kiện Microsoft, công ty đã đầu tư hàng tỷ USD vào OpenAI, vì sử dụng trái phép dữ liệu Twitter.
Reddit cũng đã phải đối mặt với hàng loạt rắc rối kể từ khi tắt quyền truy cập miễn phí vào các API của mình để ngừng thu thập dữ liệu. Động thái này đã khiến hơn 8.000 subreddits trở nên tối tăm để phản đối và một số chuyển sang NSFW.


