Scholar Labs dùng AI để hiểu sâu nội dung truy vấn và đề xuất các nghiên cứu liên quan, nhưng việc loại bỏ bộ lọc trích dẫn và impact factor đang gây tranh luận về độ tin cậy của kết quả.
Google vừa công bố đang thử nghiệm Scholar Labs – một công cụ tìm kiếm nghiên cứu mới ứng dụng AI, được thiết kế để trả lời những câu hỏi chuyên sâu trong lĩnh vực khoa học. Tuy vậy, phần trình diễn của Google cũng đặt ra câu hỏi lớn: liệu giới nghiên cứu có tin tưởng một công cụ bỏ qua các chỉ số đánh giá phổ biến, thay vào đó dựa vào mô hình ngôn ngữ để phân tích mối liên hệ giữa các khái niệm?
Scholar Labs hiện mới được mở cho một nhóm người dùng đăng nhập hạn chế. Công cụ sử dụng AI để nhận diện chủ đề cốt lõi trong câu hỏi của người dùng và phân tích mối liên quan giữa các khái niệm. Trong video demo, Google đưa ra ví dụ truy vấn về giao diện não – máy tính (BCI). Với nền tảng học thuật liên quan đến BCI, người viết nhanh chóng kiểm tra kết quả Scholar Labs đề xuất.
Kết quả đầu tiên là một bài tổng quan về BCI xuất bản năm 2024 trên Applied Sciences. Scholar Labs cũng giải thích lý do bài viết xuất hiện trong kết quả – chẳng hạn vì nghiên cứu đề cập đến EEG (tín hiệu điện não) và phân tích các thuật toán phổ biến trong lĩnh vực này.
Tuy nhiên, Scholar Labs lại thiếu những bộ lọc quen thuộc giúp đánh giá chất lượng nghiên cứu. Một trong số đó là số lượng trích dẫn – yếu tố thường được xem như thước đo mức độ ảnh hưởng của một công trình. Một nghiên cứu mới có thể chưa có trích dẫn, trong khi các công trình lâu đời có thể đạt đến hàng ngàn lượt. Chỉ số khác là “impact factor” của tạp chí khoa học – ví dụ Applied Sciences công bố hệ số ảnh hưởng 2,5, trong khi Nature đạt 48,5.

Phiên bản Google Scholar truyền thống cho phép sắp xếp theo mức độ liên quan, đồng thời hiển thị số trích dẫn. Nhưng với Scholar Labs, Google cho biết mục tiêu là tìm ra “các bài báo hữu ích nhất cho mục đích nghiên cứu” bằng cách đánh giá toàn văn, nơi công bố, tác giả, cũng như tần suất được trích dẫn – nhưng không cho phép lọc theo trích dẫn hay impact factor.
Theo Google, việc giới hạn theo hai chỉ số này có thể khiến người dùng bỏ lỡ các nghiên cứu quan trọng, nhất là trong các lĩnh vực giao thoa hoặc những bài mới xuất bản.
Một số nhà khoa học đồng tình. Matthew Schrag, Phó giáo sư thần kinh học tại Trung tâm Y khoa Đại học Vanderbilt, cho rằng các chỉ số truyền thống chỉ phản ánh “bối cảnh xã hội” của nghiên cứu, chứ không hoàn toàn thể hiện chất lượng thật. Schrag từng là người phát hiện nhiều dữ liệu bất thường trong các nghiên cứu nổi tiếng, dẫn tới nhiều bài báo bị rút lại.
Dù vậy, nhiều nhà khoa học vẫn dựa vào trích dẫn hoặc danh tiếng tạp chí khi tiếp cận lĩnh vực mới. James Smoliga, giáo sư tại Đại học Tufts và là người thường xuyên sử dụng Google Scholar, thừa nhận ông cũng dễ tin vào những nghiên cứu có nhiều trích dẫn, dù bản thân từng chứng minh lỗi sai trong một nghiên cứu rất nổi tiếng.
Để so sánh, khi thử truy vấn tương tự trên PubMed – cơ sở dữ liệu sinh y lớn của NIH – người viết sử dụng bộ lọc theo loại bài, thời gian và phạm vi nghiên cứu (chỉ chọn nghiên cứu lâm sàng trên người). PubMed cho phép loại trừ preprint và dùng các bộ lọc chi tiết, mang đến kết quả sat hơn. Hai trong sáu bài trả về đều tập trung vào EEG như giao diện BCI không xâm lấn cho bệnh nhân đột quỵ.
Google cho biết Scholar Labs cho phép người dùng yêu cầu “bài gần đây” và chỉ định mốc thời gian. Công cụ cũng phân tích toàn văn để tìm nội dung phù hợp nhất.
Theo Google, Scholar Labs là “hướng đi mới” và sẽ tiếp tục cải tiến dựa trên phản hồi người dùng. Hiện Google đang mở danh sách chờ.
Schrag tin rằng AI có vai trò trong hệ sinh thái khoa học, nhất là khi công nghệ có thể mở rộng phạm vi tìm kiếm và phát hiện các nghiên cứu ít được chú ý. Tuy nhiên, ông nhấn mạnh rằng đánh giá chất lượng khoa học vẫn là trách nhiệm của con người. Các nhà nghiên cứu cần hiểu tiêu chuẩn của lĩnh vực và tự đưa ra phán quyết cuối cùng, thay vì để thuật toán quyết định công trình nào là quan trọng.
Nguồn: The Verge
https://www.theverge.com/news/823213/google-scholar-labs-ai-search

