Mục lục:
- Claude: AI điều khiển máy tính như con người
- Thử nghiệm thực tế với Claude 3.5
- Phân tích và đánh giá
1. Claude: AI điều khiển máy tính như con người
Công ty khởi nghiệp trí tuệ nhân tạo Anthropic đã trình diễn một mô hình AI mới mang tên Claude, có khả năng tương tác với màn hình máy tính và điều khiển chuột, bàn phím "giống như con người", theo như tài liệu quảng cáo. Trong video demo, nhà nghiên cứu Sam Ringer cho thấy Claude thực hiện một số tác vụ nhập liệu đơn giản, sử dụng ảnh chụp màn hình máy tính Mac để tìm thông tin liên quan và gửi biểu mẫu. Đây là loại công việc mà rất nhiều nhân viên trên toàn thế giới làm hàng ngày. Tuy nhiên, Ringer lưu ý rằng đây chỉ là "ví dụ tiêu biểu" và mức độ chỉnh sửa video chưa được tiết lộ.
2. Thử nghiệm thực tế với Claude 3.5
Phiên bản sớm của Claude 3.5 Sonnet API hiện đã có sẵn để thử nghiệm. Giáo sư Ethan Mollick thuộc trường Wharton, Đại học Pennsylvania, đã tiến hành thử nghiệm với trò chơi trực tuyến Universal Paperclips. Ông đã hướng dẫn chương trình vào cửa sổ trình duyệt của trò chơi và "ra lệnh cho nó chiến thắng", sau đó ngồi lại và quan sát.
Kết quả thật thú vị. AI đã xác định được mục tiêu của trò chơi bằng cách phân tích giao diện dựa trên văn bản, sau đó sử dụng thử và sai để cố gắng chiến thắng – trong trường hợp này, cơ bản là chỉ làm cho các con số tăng lên. Nó có thể điều chỉnh giá của kẹp giấy để tăng doanh thu ảo bằng cách A/B testing cơ bản, giống như một người chơi thực sự. Tuy nhiên, nó không hoàn toàn tìm ra các bước cần thiết để tối ưu hóa quá trình, điều mà sẽ khá rõ ràng đối với người chơi là con người.
3. Phân tích và đánh giá
Khả năng của Claude cho thấy một bước tiến đáng kể trong lĩnh vực AI. Việc mô phỏng hành vi người dùng trên máy tính mở ra nhiều tiềm năng ứng dụng trong tự động hóa văn phòng, hỗ trợ khách hàng và nhiều lĩnh vực khác. Tuy nhiên, cũng cần lưu ý rằng video demo có thể đã được chỉnh sửa và hiệu quả của Claude trong các tình huống phức tạp hơn vẫn cần được đánh giá kỹ lưỡng. Sự thành công của Claude phụ thuộc vào khả năng xử lý thông tin phức tạp và khả năng thích ứng với các tình huống không lường trước được.
0 comments Blogger 0 Facebook
Đăng nhận xét