LANL và OpenAI hợp tác thúc đẩy an toàn AI trong đánh giá mối đe dọa sinh học

Mục lục:

Giới thiệu về dự án hợp tác
Lý do hợp tác
Phương pháp nghiên cứu
Kết quả nghiên cứu trước đây
Kết quả dự kiến
Vai trò của OpenAI và LANL
Kết luận

1. Giới thiệu về dự án hợp tác

Các nhà nghiên cứu tại Phòng thí nghiệm Quốc gia Los Alamos (LANL) đang hợp tác với OpenAI để tiến hành một nghiên cứu đánh giá nhằm tăng cường an toàn trí tuệ nhân tạo (AI).

2. Lý do hợp tác

Mối đe dọa sinh học do AI hỗ trợ có thể gây ra rủi ro đáng kể. Tuy nhiên, các nghiên cứu hiện tại chưa đánh giá được cách thức các mô hình đa phương thức tiên tiến có thể hạ thấp rào cản cho những người không chuyên gia trong việc tạo ra mối đe dọa sinh học.

3. Phương pháp nghiên cứu

Nhóm nghiên cứu sẽ xây dựng dựa trên các nghiên cứu trước đây và tuân theo Khung chuẩn bị của OpenAI, vạch ra một cách tiếp cận để theo dõi, đánh giá, dự báo và bảo vệ chống lại các rủi ro sinh học mới nổi.

4. Kết quả nghiên cứu trước đây

Trong các đánh giá trước đây, nhóm nghiên cứu nhận thấy ChatGPT-4 đã cung cấp một sự cải thiện nhỏ trong việc cung cấp thông tin có thể dẫn đến việc tạo ra các mối đe dọa sinh học. Tuy nhiên, các thử nghiệm này tập trung vào hiệu suất của con người trong các tác vụ viết (thay vì công việc thực hành sinh học) và đầu vào và đầu ra của mô hình bị giới hạn ở văn bản, loại trừ dữ liệu hình ảnh và giọng nói.

5. Kết quả dự kiến

Sử dụng các tác vụ và tài liệu thay thế, đánh giá sắp tới sẽ là thử nghiệm đầu tiên để kiểm tra các mô hình tiên tiến đa phương thức trong một môi trường phòng thí nghiệm bằng cách đánh giá khả năng của các chuyên gia trong việc thực hiện và khắc phục sự cố của một giao thức an toàn bao gồm các tác vụ thử nghiệm phòng thí nghiệm tiêu chuẩn.

6. Vai trò của OpenAI và LANL

OpenAI, với tư cách là một công ty tư nhân dành riêng cho việc phục vụ lợi ích công cộng, rất vui mừng được công bố một sự hợp tác độc đáo với Phòng thí nghiệm Quốc gia Los Alamos để nghiên cứu các khả năng sinh học.

LANL đã thành lập Nhóm đánh giá rủi ro và mối đe dọa AI (AIRTAG) để tập trung vào việc phát triển các chiến lược để hiểu lợi ích và giảm thiểu rủi ro, đồng thời giúp thúc đẩy việc triển khai an toàn các công cụ AI.

7. Kết luận

Các đánh giá mới này sẽ hỗ trợ Sắc lệnh hành pháp gần đây của Nhà Trắng về Phát triển và Sử dụng Trí tuệ nhân tạo An toàn, Bảo mật và Đáng tin cậy, trong đó các phòng thí nghiệm quốc gia của Bộ Năng lượng được giao nhiệm vụ hỗ trợ đánh giá các khả năng của các mô hình AI tiên tiến.

Dự án hợp tác này minh chứng cho loại công việc mà AIRTAG đang cố gắng thúc đẩy để giúp hiểu rõ rủi ro của AI, và cuối cùng là làm cho công nghệ AI an toàn và bảo mật hơn.

LANL và OpenAI hợp tác thúc đẩy an toàn AI trong đánh giá mối đe dọa sinh học