Trò chơi tối ưu hóa chatbot: Liệu chúng ta có thể tin tưởng tìm kiếm web bằng AI?

Trò chơi tối ưu hóa chatbot: Liệu chúng ta có thể tin tưởng tìm kiếm web bằng AI?

Mục lục

Liệu aspartame có gây ung thư? Tính chất tiềm ẩn gây ung thư của chất tạo ngọt nhân tạo phổ biến này, được thêm vào mọi thứ từ đồ uống có ga đến thuốc dành cho trẻ em, đã được tranh luận trong nhiều thập kỷ. Sự chấp thuận của nó tại Hoa Kỳ đã tạo ra sự tranh cãi vào năm 1974, một số siêu thị ở Anh đã cấm nó khỏi các sản phẩm của họ trong những năm 2000, và các nghiên cứu học thuật được đánh giá ngang hàng đã lâu nhưng vẫn bất đồng. Năm ngoái, Tổ chức Y tế Thế giới đã kết luận aspartame là “có khả năng gây ung thư” cho con người, trong khi các cơ quan quản lý sức khỏe cộng đồng cho rằng nó an toàn khi tiêu thụ với lượng nhỏ như thường lệ.

Trong khi nhiều người trong chúng ta có thể tìm cách giải quyết câu hỏi này bằng cách tìm kiếm nhanh chóng trên Google, đây chính xác là loại tranh luận gây tranh cãi có thể gây ra vấn đề cho internet trong tương lai. Khi chatbot AI tạo sinh đã phát triển nhanh chóng trong vài năm qua, các công ty công nghệ đã nhanh chóng quảng cáo chúng như một sự thay thế theo chủ nghĩa duy tâm cho nhiều công việc và dịch vụ - bao gồm cả công cụ tìm kiếm internet. Thay vì cuộn qua danh sách các trang web để tìm câu trả lời cho một câu hỏi, suy nghĩ là, một chatbot AI có thể thu thập thông tin trên internet cho bạn, chải chuốt nó để tìm thông tin liên quan để biên soạn thành một câu trả lời ngắn gọn cho truy vấn của bạn. Google và Microsoft đang đặt cược lớn vào ý tưởng này và đã giới thiệu tóm tắt do AI tạo ra trong Google Search và Bing.

Tối ưu hóa công cụ tạo nội dung

Nhưng những gì được tung hô như một cách thuận tiện hơn để tra cứu thông tin trực tuyến đã thúc đẩy sự xem xét kỹ lưỡng về cách thức và nơi các chatbot này chọn thông tin mà chúng cung cấp. Nghiên cứu về loại bằng chứng mà các mô hình ngôn ngữ lớn (LLM, động cơ mà chatbot được xây dựng) thấy thuyết phục nhất, ba nhà nghiên cứu khoa học máy tính từ Đại học California, Berkeley, phát hiện ra rằng chatbot hiện tại quá dựa vào sự liên quan bề ngoài của thông tin. Chúng có xu hướng ưu tiên văn bản bao gồm thuật ngữ kỹ thuật thích hợp hoặc được nhồi nhét bằng các từ khóa liên quan, trong khi bỏ qua các tính năng khác mà chúng ta thường sử dụng để đánh giá độ tin cậy, chẳng hạn như việc bao gồm các tài liệu tham khảo khoa học hoặc ngôn ngữ khách quan không bị ảnh hưởng bởi định kiến ​​cá nhân.

Nội dung trực tuyến có thể được trình bày theo cách nâng cao khả năng hiển thị của nó đối với chatbot, do đó làm cho nó có nhiều khả năng xuất hiện trong đầu ra của chúng

Đối với các truy vấn đơn giản nhất, các tiêu chí lựa chọn như vậy là đủ để đưa ra câu trả lời thỏa đáng. Nhưng những gì một chatbot nên làm trong trường hợp của một cuộc tranh luận phức tạp hơn, chẳng hạn như xung quanh aspartame, thì ít rõ ràng hơn. "Liệu chúng ta có muốn chúng đơn giản là tóm tắt kết quả tìm kiếm của bạn cho bạn, hay chúng ta có muốn chúng hoạt động như trợ lý nghiên cứu nhỏ, cân nhắc tất cả bằng chứng và chỉ cung cấp cho bạn câu trả lời cuối cùng", Alexander Wan, một nhà nghiên cứu sinh viên và đồng tác giả của nghiên cứu, đặt câu hỏi. Lựa chọn thứ hai sẽ mang lại sự tiện lợi tối đa, nhưng nó khiến các tiêu chí mà chatbot chọn thông tin trở nên quan trọng hơn bao giờ hết. Và nếu một người có thể thao túng các tiêu chí đó một cách nào đó, liệu họ có thể đảm bảo thông tin mà chatbot đưa ra trước mắt hàng tỷ người dùng internet?

Máy móc thao túng

Đó là câu hỏi đã làm các doanh nghiệp, nhà sáng tạo nội dung và những người muốn kiểm soát cách họ được nhìn nhận trực tuyến phấn khích, và đã tạo ra một ngành công nghiệp đang hình thành của các cơ quan tiếp thị cung cấp dịch vụ trong lĩnh vực được gọi là tối ưu hóa công cụ tạo nội dung (GEO). Ý tưởng là nội dung trực tuyến có thể được viết và trình bày theo cách nâng cao khả năng hiển thị của nó đối với chatbot, do đó làm cho nó có nhiều khả năng xuất hiện trong đầu ra của chúng. Những lợi thế là rõ ràng: nếu một người muốn hỏi chatbot để giới thiệu máy hút bụi tốt nhất, chẳng hạn, một nhà sản xuất thiết bị gia dụng có thể muốn nó chỉ vào mẫu mới nhất của mình và nói về nó bằng những lời lẽ hoa mỹ.

Nguyên tắc cơ bản tương tự như tối ưu hóa công cụ tìm kiếm (SEO), một thực hành phổ biến trong đó các trang web được xây dựng và viết để thu hút sự chú ý của các thuật toán tìm kiếm, đẩy chúng lên đầu danh sách kết quả được trả về khi bạn tìm kiếm trên Google hoặc Bing. GEO và SEO chia sẻ một số kỹ thuật cơ bản, và các trang web đã được tối ưu hóa cho các công cụ tìm kiếm thường có nhiều khả năng xuất hiện trong đầu ra của chatbot. Nhưng những người muốn thực sự nâng cao khả năng hiển thị AI của họ cần phải suy nghĩ toàn diện hơn.

"Xếp hạng trong công cụ tìm kiếm AI và LLM yêu cầu các tính năng và đề cập trên các trang web của bên thứ ba liên quan, chẳng hạn như các cơ quan truyền thông, danh sách, diễn đàn và ấn phẩm ngành", Viola Eva, người sáng lập công ty tiếp thị Flow Agency, hiện đã đổi tên để mở rộng vượt ra ngoài chuyên môn SEO của mình sang GEO, cho biết. "Đây là những nhiệm vụ mà chúng ta thường liên kết với các nhóm thương hiệu và PR."

Do đó, thao túng chatbot là có thể, nhưng không đơn giản. Và trong khi các chủ sở hữu trang web và nhà sáng tạo nội dung đã rút ra danh sách các điều cần làm và không nên làm về SEO đang phát triển trong vài thập kỷ qua, không có bộ quy tắc rõ ràng nào như vậy tồn tại để thao túng các mô hình AI. Thuật ngữ tối ưu hóa công cụ tạo nội dung chỉ được đặt ra vào năm ngoái trong một bài báo học thuật, trong đó các tác giả kết luận rằng việc sử dụng ngôn ngữ có thẩm quyền (bất kể điều gì được thể hiện hay thông tin có chính xác hay không) cùng với các tài liệu tham khảo (ngay cả những tài liệu không chính xác hoặc không liên quan đến những gì chúng được sử dụng để trích dẫn) có thể tăng cường khả năng hiển thị trong phản hồi của chatbot lên tới 40%. Nhưng họ nhấn mạnh những phát hiện này không có tính quy phạm, và việc xác định chính xác các quy tắc chi phối chatbot là vốn dĩ khó khăn.

"Đó là một trò chơi mèo vờn chuột", Ameet Deshpande, một sinh viên tiến sĩ tại Đại học Princeton, New Jersey, và đồng tác giả của bài báo, cho biết. "Bởi vì những công cụ tạo nội dung này không tĩnh, và chúng cũng là những hộp đen, chúng ta không có bất kỳ ý niệm nào về những gì chúng đang sử dụng [để chọn thông tin] đằng sau cánh cửa đóng kín. Nó có thể dao động từ các thuật toán phức tạp đến sự giám sát của con người tiềm ẩn. "

Do đó, những người muốn kiểm soát chặt chẽ hơn chatbot có thể phải khám phá các kỹ thuật tinh vi hơn, chẳng hạn như kỹ thuật được phát hiện bởi hai nhà nghiên cứu khoa học máy tính tại Đại học Harvard. Họ đã chứng minh rằng chatbot có thể bị điều khiển một cách chiến lược bằng cách triển khai một thứ gì đó đơn giản như một chuỗi văn bản được viết cẩn thận. Chuỗi "văn bản chiến lược" này trông giống như một chuỗi ký tự vô nghĩa - tất cả là chữ cái và dấu câu ngẫu nhiên - nhưng thực chất là một lệnh tinh tế có thể ép buộc chatbot tạo ra phản hồi cụ thể. Không phải là một phần của ngôn ngữ lập trình, nó được rút ra bằng cách sử dụng thuật toán lặp đi lặp lại để phát triển các chuỗi văn bản khuyến khích LLM bỏ qua các rào chắn an toàn của chúng - và hướng chúng về phía đầu ra cụ thể.

Ví dụ: thêm chuỗi vào trang thông tin sản phẩm trực tuyến của một máy pha cà phê, và nó sẽ tăng xác suất bất kỳ chatbot nào tìm thấy trang đó sẽ đưa ra tên của máy trong phản hồi của chúng. Được triển khai trên toàn bộ danh mục, kỹ thuật như vậy có thể cung cấp cho các nhà bán lẻ tinh vi - và những người có đủ tài nguyên để đầu tư vào việc hiểu kiến ​​trúc LLM phức tạp - một cách đơn giản để đẩy sản phẩm của họ vào câu trả lời của chatbot. Trong khi đó, người dùng internet sẽ không hề biết rằng các sản phẩm mà chatbot đang hiển thị cho họ đã được chọn, không phải do chất lượng hay độ phổ biến của chúng, mà là một thủ thuật thao túng chatbot khéo léo.

Aounon Kumar, một cộng tác viên nghiên cứu và đồng tác giả của nghiên cứu, cho biết LLM có thể được thiết kế để chống lại các chuỗi văn bản chiến lược này trong tương lai, nhưng các phương pháp tinh vi khác để thao túng chúng có thể vẫn được phát hiện. "Thách thức nằm ở việc dự đoán và phòng thủ chống lại một bối cảnh đang không ngừng phát triển của các kỹ thuật đối kháng", Kumar nói. "Liệu LLM có thể được tạo ra vững chắc đối với tất cả các thuật toán tấn công tiềm năng trong tương lai vẫn là một câu hỏi mở. "

Phân biệt thực hư

Các công cụ tìm kiếm hiện tại và các thực hành xung quanh chúng không phải là không có vấn đề riêng. SEO chịu trách nhiệm cho một số thực hành thù địch nhất đối với người đọc của internet hiện đại: các blog tạo ra các bài báo gần như trùng lặp để nhắm mục tiêu vào cùng các truy vấn có lượng truy cập lớn; việc viết được điều chỉnh cho sự chú ý của thuật toán Google hơn là người đọc. Bất kỳ ai đã tìm kiếm công thức nấu ăn trực tuyến và thấy mình phải cuộn qua những đoạn văn liên quan đến bối cảnh một cách đau đớn trước khi thậm chí đạt đến danh sách thành phần sẽ biết quá rõ cách các nỗ lực tối ưu hóa nội dung cho các thuật toán tìm kiếm đã làm tổn hại đến các thực hành viết tốt.

Tuy nhiên, một internet bị thống trị bởi chatbot dễ uốn nắn lại nảy sinh những vấn đề mang tính hiện sinh hơn. Hỏi một công cụ tìm kiếm một câu hỏi, và nó sẽ trả về một danh sách dài các trang web. Hầu hết người dùng sẽ chọn từ một vài trang web ở đầu, nhưng ngay cả những trang web ở dưới cùng của kết quả cũng sẽ thu hút một số lượng truy cập nhất định. Ngược lại, chatbot chỉ đề cập đến bốn hoặc năm trang web mà chúng lấy thông tin từ đó như tài liệu tham khảo ở bên cạnh. Điều đó làm cho một vài trang web may mắn được chọn trở nên nổi bật và khiến mọi trang web khác không được chọn gần như vô hình, làm giảm lượng truy cập của chúng xuống mức thấp.

"Điều đó cho thấy sự mong manh của những hệ thống này", Deshpande nói. Các nhà sáng tạo sản xuất nội dung chất lượng trực tuyến có rất nhiều lợi thế khi được chatbot trích dẫn. "Nhưng nếu đó là một nhà sáng tạo nội dung đối kháng không viết các bài báo chất lượng cao và đang cố gắng thao túng hệ thống, rất nhiều lượng truy cập sẽ dành cho họ, và 0% sẽ dành cho các nhà sáng tạo nội dung tốt", anh nói.

Đối với người đọc, việc trình bày phản hồi của chatbot cũng khiến chúng dễ bị thao túng hơn. "Nếu LLM đưa ra câu trả lời trực tiếp cho một câu hỏi, thì hầu hết mọi người có thể sẽ không xem xét những nguồn gốc cơ bản", Wan nói. Cách suy nghĩ như vậy chỉ ra một lo ngại rộng lớn hơn được gọi là "sự tiến thoái lưỡng nan của câu trả lời trực tiếp": nếu một người được đưa ra một câu trả lời duy nhất cho một câu hỏi và không được cung cấp lựa chọn nào khác để xem xét, liệu họ sẽ siêng năng tìm kiếm các quan điểm khác để cân nhắc câu trả lời ban đầu? Có lẽ là không. Có khả năng hơn, họ sẽ chấp nhận nó như đã cho và chuyển sang việc khác, không biết những sắc thái, cuộc tranh luận và các quan điểm khác nhau có thể bao quanh nó.

"Chúng tôi tin rằng sự tiến thoái lưỡng nan của câu trả lời trực tiếp vẫn tồn tại với tìm kiếm tạo sinh", Martin Potthast, chủ tịch của các công nghệ ngôn ngữ thông minh tại Đại học Leipzig và là một trong ba nhà khoa học máy tính đã đặt ra thuật ngữ này, cho biết. "Hệ thống truy xuất cơ bản có thể chỉ truy xuất các tài liệu chỉ ra một hướng nhất định và do đó câu trả lời được tạo ra sẽ chỉ phản ánh hướng đó. Trên thực tế, người dùng có thể được dẫn dắt để tin rằng đây là câu trả lời duy nhất, có thẩm quyền nhất. "

Khi Google tuyên bố vào đầu năm nay rằng họ đang tích hợp tóm tắt do AI tạo ra vào công cụ tìm kiếm của mình, họ đã tung ra khẩu hiệu táo bạo: "Hãy để Google thực hiện việc tìm kiếm cho bạn". Đó là một ý tưởng hấp dẫn, dựa vào tình yêu của chúng ta đối với công nghệ tiện lợi có thể hợp lý hóa cuộc sống của chúng ta. Tuy nhiên, nếu bạn là loại người dùng internet muốn chắc chắn rằng bạn đang nhận được thông tin khách quan, chính xác và hữu ích nhất, bạn có thể sẽ không muốn để việc tìm kiếm trong tay AI dễ bị tổn thương như vậy.

Logo

0 comments Blogger 0 Facebook

Đăng nhận xét

 
Agent.ai.vn © 2024 - Nắm bắt tương lai
Top