Công cụ AI thúc đẩy sự gia tăng của các bài nghiên cứu giả mạo trên Google Scholar
Một nghiên cứu mới đây từ Thụy Điển đã phát hiện ra rằng ngày càng nhiều bài báo khoa học giả mạo được xuất bản trên Google Scholar, với nguyên nhân đến từ việc sử dụng các công cụ AI mà không được khai báo hoặc thậm chí là việc sử dụng AI để tạo ra hoàn toàn các kết quả nghiên cứu giả.
Bài báo của Forbes đã đưa tin về phát hiện này, cảnh báo về một thực trạng đáng báo động trong lĩnh vực nghiên cứu khoa học. Nhóm nghiên cứu Thụy Điển đã tìm thấy hơn 130 bài báo trên Google Scholar vi phạm nguyên tắc học thuật, hoặc do sử dụng AI mà không được khai báo hoặc do được tạo ra hoàn toàn bởi các công cụ AI.
Phương pháp nghiên cứu của nhóm là quét dữ liệu trên Google Scholar để tìm kiếm những cụm từ đặc trưng mà các công cụ AI như ChatGPT hay Claude thường tạo ra, ví dụ như “theo bản cập nhật kiến thức cuối cùng của tôi” hoặc “Tôi không có quyền truy cập dữ liệu thời gian thực”. Các bài báo chứa các cụm từ này được đánh dấu để xem xét kỹ hơn về việc khai báo việc sử dụng AI. Kết quả cho thấy, 139 trong số 227 bài báo bị đánh dấu không hề đề cập đến việc sử dụng AI, dù việc này là rõ ràng.
Mặc dù chỉ là một mẫu nhỏ (0,0000003573%) trong hơn 389 triệu bản ghi của Google Scholar, nhưng nghiên cứu này cho thấy một vấn đề lớn. Nhà nghiên cứu Kristofer Rolf Söderström từ Đại học Lund, Thụy Điển, cho biết mục tiêu của họ là cảnh báo sớm về nguy cơ các công cụ AI bị lợi dụng để thao túng cơ sở bằng chứng của xã hội.
Theo ông Söderström, có hai rủi ro chính liên quan đến tình trạng này:
- Nguy cơ ngày càng tăng của việc xuất hiện các bài báo khoa học có vẻ đáng tin cậy nhưng thực chất là sai lệch, rất khó phát hiện do được tạo ra bởi AI.
- Khả năng các mô hình ngôn ngữ lớn (LLM) tạo ra một lượng lớn các bài báo giả mạo, làm ảnh hưởng đến tính toàn vẹn của kho dữ liệu khoa học.
Nhóm nghiên cứu cũng nhấn mạnh rằng AI không phải là vấn đề cốt lõi. Thay vào đó, họ chỉ trích văn hóa “xuất bản hoặc biến mất” (publish or perish) trong nhiều trường đại học, khiến các nhà nghiên cứu tìm cách sử dụng AI như một công cụ để đáp ứng yêu cầu xuất bản.
Thực trạng này càng trầm trọng hơn khi Google nắm giữ vai trò quá lớn trong việc kiểm soát thông tin học thuật, công cụ tìm kiếm và truy cập thông tin trực tuyến.
Nghiên cứu không đưa ra giải pháp đơn giản, nhưng đề xuất một cách tiếp cận đa chiều bao gồm các thành phần kỹ thuật, quy định và giáo dục để bảo vệ sự thật.
Kết luận:
Sự xuất hiện của các công cụ AI đã tạo ra cả cơ hội và thách thức đối với lĩnh vực nghiên cứu khoa học. Việc bảo vệ tính toàn vẹn của các bài báo khoa học, trong bối cảnh AI có thể bị lợi dụng để tạo ra thông tin giả mạo, là một vấn đề cấp bách cần được quan tâm. Cần có những nỗ lực chung từ các nhà nghiên cứu, các tổ chức học thuật và các công ty công nghệ để xây dựng các quy định và phương pháp hiệu quả nhằm đảm bảo tính trung thực và minh bạch trong nghiên cứu khoa học.

0 comments Blogger 0 Facebook
Đăng nhận xét