Mục lục

  1. Mở đầu: Sự trỗi dậy của AI Agent
  2. Agent AI là gì?
  3. Góc nhìn chuyên gia: 4 cải tiến chính của Agent AI trong năm 2025
    • 3.1. Khả năng sử dụng công cụ được nâng cao
    • 3.2. Hiểu rõ ngữ cảnh
    • 3.3. Trợ lý lập trình thông minh hơn
    • 3.4. Vấn đề an toàn và kiểm soát
  4. Kết luận: Một năm đầy thách thức và cơ hội

1. Mở đầu: Sự trỗi dậy của AI Agent

Trong thế giới công nghệ hiện đại, AI Agent đang là chủ đề nóng bỏng nhất. Các tập đoàn công nghệ hàng đầu như Google DeepMind, OpenAI và Anthropic đang chạy đua để nâng cấp các mô hình ngôn ngữ lớn (LLM), trao cho chúng khả năng tự mình thực hiện các nhiệm vụ. Được biết đến với cái tên "AI Agentic" trong giới công nghiệp, hệ thống này đã nhanh chóng trở thành mục tiêu mới của Thung lũng Silicon. Từ Nvidia đến Salesforce, tất cả đều đang bàn tán về cách chúng sẽ làm thay đổi ngành công nghiệp.

Như Sam Altman đã tuyên bố, năm 2025 có thể chứng kiến sự gia nhập lực lượng lao động của AI agent, tạo ra những thay đổi đáng kể trong hiệu suất của các công ty.

AI Agent: Bước tiến mới của trí tuệ nhân tạo

2. Agent AI là gì?

Một cách đơn giản, Agent AI là một hệ thống phần mềm có khả năng tự mình thực hiện các tác vụ, thường là với sự giám sát tối thiểu hoặc không cần giám sát. Độ phức tạp của tác vụ càng cao thì AI agent càng cần phải thông minh hơn. Hiện tại, nhiều người tin rằng các mô hình ngôn ngữ lớn đã đủ thông minh để cung cấp sức mạnh cho các agent có thể thực hiện một loạt các nhiệm vụ hữu ích, chẳng hạn như điền vào biểu mẫu, tìm kiếm công thức nấu ăn và thêm nguyên liệu vào giỏ hàng trực tuyến, hoặc sử dụng công cụ tìm kiếm để nghiên cứu trước cuộc họp và tạo bản tóm tắt nhanh.

Vào tháng 10 năm ngoái, Anthropic đã giới thiệu một trong những agent tiên tiến nhất: một bản mở rộng của mô hình ngôn ngữ lớn Claude, có tên là "sử dụng máy tính" (computer use). Đúng như tên gọi, tính năng này cho phép người dùng điều khiển Claude sử dụng máy tính tương tự như cách con người làm, bằng cách di chuyển con trỏ, nhấp vào nút và nhập văn bản. Thay vì chỉ trò chuyện với Claude, giờ đây bạn có thể yêu cầu nó thực hiện các tác vụ trên màn hình. Mặc dù vẫn còn khá cồng kềnh và dễ xảy ra lỗi, nhưng tính năng này đã được cung cấp cho một số người thử nghiệm, bao gồm các nhà phát triển bên thứ ba tại các công ty như DoorDash, Canva và Asana.

3. Góc nhìn chuyên gia: 4 cải tiến chính của Agent AI trong năm 2025

Để hiểu rõ hơn về những gì sắp xảy ra, MIT Technology Review đã phỏng vấn Jared Kaplan, đồng sáng lập và nhà khoa học trưởng của Anthropic. Dưới đây là 4 cách mà các AI Agent sẽ trở nên tốt hơn vào năm 2025.

3.1. Khả năng sử dụng công cụ được nâng cao

Kaplan nhấn mạnh rằng, AI có hai hướng phát triển chính. Thứ nhất, độ phức tạp của các nhiệm vụ mà hệ thống có thể thực hiện. Thứ hai, các loại môi trường hoặc công cụ mà AI có thể sử dụng. Chúng ta đã chứng kiến các hệ thống AI siêu phàm trong việc chơi cờ bàn như AlphaGo. Nhưng việc chỉ giới hạn trong một môi trường chơi cờ bàn là không đủ để AI trở nên hữu ích. Với các mô hình văn bản, mô hình đa phương thức, và bây giờ là khả năng sử dụng máy tính, chúng ta đang tiến gần hơn đến việc đưa AI vào nhiều tình huống và nhiệm vụ khác nhau, làm cho nó trở nên hữu dụng hơn.

Jared Kaplan, đồng sáng lập và nhà khoa học trưởng của Anthropic

"Tôi thấy rằng khả năng sử dụng máy tính sẽ cải thiện nhanh chóng về cách các mô hình có thể thực hiện các tác vụ khác nhau và phức tạp hơn. Đồng thời, chúng sẽ nhận ra khi nào chúng mắc lỗi hoặc khi nào cần xin phản hồi từ người dùng." - Kaplan chia sẻ.

3.2. Hiểu rõ ngữ cảnh

Để Agent AI trở nên hữu ích, chúng cần hiểu rõ ngữ cảnh và các ràng buộc trong từng tình huống cụ thể. Ví dụ như vai trò của người dùng, phong cách viết, hoặc nhu cầu của tổ chức. Theo Kaplan, Claude có thể tìm kiếm thông tin trong các tài liệu, Slack của bạn, và thực sự học được điều gì hữu ích. Điều này không chỉ làm cho hệ thống hữu ích hơn mà còn an toàn hơn, khi chúng thực hiện đúng những gì người dùng mong đợi.

Ngoài ra, nhiều tác vụ không yêu cầu Claude phải suy luận nhiều. Chúng có thể nhanh chóng mở Google Docs mà không cần phải suy nghĩ quá lâu. Vì vậy, sự cải tiến ở đây không chỉ là về khả năng suy luận mà còn là việc áp dụng suy luận một cách hiệu quả khi cần thiết, tránh lãng phí thời gian khi không cần thiết.

3.3. Trợ lý lập trình thông minh hơn

Anthropic đã cho ra mắt phiên bản beta ban đầu của "sử dụng máy tính" cho các nhà phát triển để thu thập phản hồi. Khi các hệ thống này trở nên tốt hơn, chúng có thể được sử dụng rộng rãi hơn và thực sự cộng tác với bạn trong các hoạt động khác nhau. Các công ty như DoorDash, Browser Company và Canva đang thử nghiệm các tương tác trình duyệt khác nhau, thiết kế chúng với sự trợ giúp của AI.

"Tôi kỳ vọng sẽ có những cải tiến hơn nữa đối với các trợ lý lập trình. Đây là một điều rất thú vị đối với các nhà phát triển. Có rất nhiều sự quan tâm đến việc sử dụng Claude 3.5 để lập trình, không chỉ là tự động hoàn thành code như vài năm trước. Nó thực sự hiểu điều gì sai với code, gỡ lỗi, chạy code, xem điều gì xảy ra và sửa nó", Kaplan cho biết.

3.4. Vấn đề an toàn và kiểm soát

Anthropic được thành lập với mong muốn giải quyết các lo ngại về an toàn khi AI phát triển nhanh chóng. Theo Kaplan, đây là một vấn đề ngày càng trở nên cấp thiết khi AI Agent ngày càng được tích hợp sâu hơn vào công việc hàng ngày. Một trong những thách thức lớn nhất là "prompt injection", một cuộc tấn công bằng cách chèn các prompt độc hại vào LLM để khiến nó làm những điều không mong muốn.

"Prompt injection có lẽ là một trong những điều số 1 mà chúng tôi đang nghĩ đến khi sử dụng agent trên diện rộng. Đặc biệt quan trọng đối với việc sử dụng máy tính, bởi vì nếu tính năng này được triển khai ở quy mô lớn, có thể có những trang web độc hại cố gắng thuyết phục Claude làm những điều không nên làm." - Kaplan giải thích.

Ngoài ra, với các mô hình tiên tiến hơn, nguy cơ cũng sẽ tăng lên. Do đó, cần có một chính sách mở rộng mạnh mẽ để ngăn chặn việc lạm dụng AI, ví dụ như trong các hoạt động khủng bố.

4. Kết luận: Một năm đầy thách thức và cơ hội

Kaplan rất hào hứng về tiềm năng hữu ích của AI, đồng thời thừa nhận rằng sẽ có rất nhiều thách thức trong năm tới. 2025 sẽ là một năm thú vị và đầy biến động, với những bước tiến mới của AI Agent, hứa hẹn sẽ thay đổi cách chúng ta làm việc và tương tác với công nghệ.


0 comments Blogger 0 Facebook

Đăng nhận xét

 
Agent.ai.vn © 2024 - Nắm bắt tương lai
Top