Trong ngữ cảnh: Các máy biến áp được đào tạo trước (GPT) tạo ra như những máy biến áp được sử dụng trong chatbot ChatGPT của OpenAI và trình tạo hình ảnh Dall-E đang là xu hướng hiện tại trong nghiên cứu AI. Mọi người đều muốn áp dụng các mô hình GPT cho mọi thứ và nó đã gây ra tranh cãi đáng kể vì nhiều lý do.
Khoa học Mỹ lưu ý rằng một nhóm các nhà nghiên cứu đã đã phát triển một mô hình GPT có thể đọc được suy nghĩ của con người. Chương trình này không khác ChatGPT ở chỗ nó có thể tạo ra ngôn ngữ mạch lạc, liên tục từ lời nhắc. Sự khác biệt chính là lời nhắc là hoạt động của bộ não con người.
Nhóm nghiên cứu từ Đại học Texas ở Austin vừa được phát hành nghiên cứu của nó trong Khoa học thần kinh tự nhiên vào thứ Hai. Phương pháp này sử dụng hình ảnh từ máy fMRI để diễn giải những gì đối tượng đang “nghe, nói hoặc tưởng tượng”. Các nhà khoa học gọi kỹ thuật này là “không xâm lấn”, điều này thật mỉa mai vì việc đọc suy nghĩ của ai đó gần như là xâm lấn mà bạn có thể nhận được.
Tuy nhiên, nhóm nghiên cứu cho rằng phương pháp của họ không xâm lấn về mặt y tế. Đây không phải là lần duy nhất các nhà khoa học phát triển một công nghệ có thể đọc được suy nghĩ, nhưng đây là phương pháp thành công duy nhất không yêu cầu các điện cực kết nối với não của đối tượng.
chúng ta đã đào tạo và kiểm tra bộ giải mã của mình về phản ứng của não trong khi các đối tượng nghe những câu chuyện kể tự nhiên. đưa ra phản ứng não bộ đối với những câu chuyện mới không được sử dụng trong đào tạo, bộ giải mã đã khôi phục thành công ý nghĩa của những câu chuyện (3/7) pic.twitter.com/HmJDIB36WM
– Jerry Tang (@jerryptang) Ngày 30 tháng 9 năm 2022
Mô hình, được đặt tên một cách không tưởng tượng là GPT-1, là phương pháp duy nhất diễn giải hoạt động của não ở định dạng ngôn ngữ liên tục. Các kỹ thuật khác có thể đưa ra một từ hoặc cụm từ ngắn, nhưng GPT-1 có thể tạo thành các mô tả phức tạp giải thích ý chính của đối tượng đang nghĩ gì.
Ví dụ: một người tham gia đã nghe đoạn ghi âm của một người nào đó nói rằng: “Tôi chưa có bằng lái xe.” Mô hình ngôn ngữ giải thích hình ảnh fMRI có nghĩa là “Cô ấy thậm chí còn chưa bắt đầu học lái xe.” Vì vậy, mặc dù nó không đọc được nguyên văn suy nghĩ của người đó, nhưng nó có thể lấy ý tưởng chung và tóm tắt nó.
Các phương pháp xâm lấn có thể diễn giải các từ chính xác vì chúng được đào tạo để nhận biết các chức năng vận động vật lý cụ thể trong não, chẳng hạn như môi cử động để tạo thành một từ. Mô hình GPT-1 xác định đầu ra của nó dựa trên lưu lượng máu trong não. Nó không thể lặp lại chính xác những suy nghĩ vì nó hoạt động ở cấp độ cao hơn của chức năng thần kinh.
“Hệ thống của chúng ta hoạt động ở một cấp độ rất khác”, Trợ lý Giáo sư Alexander Huth từ Trung tâm Khoa học Máy tính và Khoa học Thần kinh của UT Austin cho biết trong một cuộc họp báo vào thứ Năm tuần trước. “Thay vì nhìn vào thứ động cơ cấp thấp này, hệ thống của chúng ta thực sự hoạt động ở cấp độ ý tưởng, ngữ nghĩa và ý nghĩa. Đó là những gì nó đang hướng tới.”
Cũng đọc: Những bộ óc công nghệ hàng đầu ký thư ngỏ yêu cầu tạm dừng sáu tháng để phát triển AI tiên tiến
Bước đột phá đến sau khi cung cấp các bình luận GPT-1 Reddit và các tài khoản “tự truyện”. Sau đó, họ đào tạo nó dựa trên các bản quét từ ba tình nguyện viên, mỗi người đã dành 16 giờ để nghe các câu chuyện được ghi lại khi ở trong máy fMRI. Điều này cho phép GPT-1 liên kết hoạt động thần kinh với các từ và ý tưởng trong bản ghi.
Sau khi được đào tạo, các tình nguyện viên lắng nghe những câu chuyện mới trong khi được quét và GPT-1 xác định chính xác ý tưởng chung về những gì người tham gia đang nghe. Nghiên cứu cũng sử dụng phim câm và trí tưởng tượng của tình nguyện viên để thử nghiệm công nghệ với kết quả tương tự.
Điều thú vị là GPT-1 diễn giải các phiên ghi âm chính xác hơn so với các câu chuyện bịa đặt của người tham gia khi diễn giải các phiên ghi âm. Người ta có thể quy kết nó thành bản chất trừu tượng của những suy nghĩ tưởng tượng so với những ý tưởng cụ thể hơn được hình thành từ việc lắng nghe điều gì đó. Điều đó nói rằng, GPT-1 vẫn còn khá gần khi đọc những suy nghĩ không thành lời.
bộ giải mã tương tự cũng hoạt động trên các phản ứng của não trong khi các đối tượng tưởng tượng kể chuyện, mặc dù bộ giải mã chỉ được đào tạo về dữ liệu lời nói được cảm nhận. chúng ta hy vọng rằng việc đào tạo bộ giải mã trên một số dữ liệu giọng nói tưởng tượng sẽ cải thiện hiệu suất hơn nữa (4/7) pic.twitter.com/z63D7Xe3Sa
– Jerry Tang (@jerryptang) Ngày 30 tháng 9 năm 2022
Trong một ví dụ, đối tượng tưởng tượng, “[I] đã đi trên một con đường đất xuyên qua một cánh đồng lúa mì, qua một con suối và cạnh một số tòa nhà bằng gỗ.” Người mẫu giải thích điều này là “Anh ấy phải đi bộ qua một cây cầu để sang phía bên kia và một tòa nhà rất lớn ở phía xa.” Vì vậy, nó đã bỏ lỡ một số chi tiết được cho là thiết yếu và bối cảnh quan trọng nhưng vẫn nắm bắt được các yếu tố trong suy nghĩ của người đó.
Máy có thể đọc được suy nghĩ có thể là hình thức gây tranh cãi nhất của công nghệ GPT. Mặc dù nhóm hình dung ra công nghệ giúp bệnh nhân ALS hoặc mất ngôn ngữ nói, nhưng họ thừa nhận khả năng sử dụng sai. Nó cần có sự đồng ý của đối tượng để hoạt động ở dạng hiện tại, nhưng nghiên cứu thừa nhận rằng những kẻ xấu có thể tạo ra một phiên bản ghi đè kiểm tra đó.
“Phân tích quyền riêng tư của chúng ta cho thấy rằng sự hợp tác của đối tượng hiện được yêu cầu để đào tạo và áp dụng bộ giải mã”, nó viết. “Tuy nhiên, những phát triển trong tương lai có thể cho phép các bộ giải mã bỏ qua các yêu cầu này. Hơn nữa, ngay cả khi các dự đoán của bộ giải mã là không chính xác nếu không có sự hợp tác của chủ thể, chúng có thể bị hiểu sai một cách có chủ ý cho các mục đích xấu. Vì những lý do này và các lý do không lường trước khác, điều quan trọng là phải nâng cao nhận thức về các rủi ro công nghệ giải mã não bộ và ban hành các chính sách bảo vệ quyền riêng tư về tinh thần của mỗi người.”
Tất nhiên, kịch bản này giả định rằng công nghệ fMRI có thể được thu nhỏ đủ để có thể thực tế bên ngoài môi trường lâm sàng. Bất kỳ ứng dụng nào ngoài nghiên cứu vẫn còn là một chặng đường dài.


