Mục lục

  1. Dẫn Nhập: Kỷ Nguyên AI Hỗ Trợ Lập Trình
  2. Những "Chiến Binh" AI Xuất Sắc Nhất
  3. Những "Kẻ Thất Bại" Đáng Thất Vọng
  4. Lời Khuyên Cuối: Lựa Chọn Công Cụ Phù Hợp

1. Dẫn Nhập: Kỷ Nguyên AI Hỗ Trợ Lập Trình

Tôi đã gắn bó với công nghệ đủ lâu để không còn dễ bị kích động hay ngạc nhiên. Nhưng khi ChatGPT của OpenAI ra mắt và có thể viết một plugin WordPress hoạt động trơn tru cho trang thương mại điện tử của vợ tôi, tôi đã thực sự bất ngờ. Đây là khởi đầu cho hành trình khám phá sâu hơn về chatbot và lập trình có sự hỗ trợ của AI. Từ đó, tôi đã thử nghiệm 11 mô hình ngôn ngữ lớn (LLM) với bốn bài kiểm tra thực tế.

Tuy nhiên, không phải chatbot nào cũng có thể code tốt như nhau. Sau 18 tháng thử nghiệm, 5 trong số 11 LLM vẫn chưa thể tạo ra các plugin hoạt động được. Trong bài viết này, tôi sẽ chia sẻ kết quả thử nghiệm chi tiết và đưa ra hai chatbot mà tôi thực sự khuyên dùng, dù chúng có giá 20 đô la mỗi tháng. Ngoài ra, tôi cũng sẽ chỉ ra những chatbot mà bạn nên tránh cho đến khi chúng cải thiện hiệu suất.

Hình ảnh về lập trình và code

AI không thể viết toàn bộ ứng dụng phức tạp, nhưng chúng cực kỳ giỏi trong việc viết vài dòng code hoặc sửa lỗi. Nếu bạn muốn hiểu rõ hơn về các bài kiểm tra coding của tôi, hãy đọc bài viết này: "Cách tôi kiểm tra khả năng coding của chatbot AI - và bạn cũng có thể".

Bảng so sánh hiệu suất của các chatbot:

Chatbot Số bài test đã vượt qua
ChatGPT Plus 4/4
Perplexity Pro 4/4
Grok 3/4
ChatGPT Free 3/4
Perplexity Free 3/4
Meta AI 1/4
Meta Code Llama 1/4
Claude 3.5 Sonnet 1/4
Gemini Advanced 1/4
Microsoft Copilot 0/4

2. Những "Chiến Binh" AI Xuất Sắc Nhất

Dưới đây là đánh giá chi tiết về những chatbot đã thể hiện tốt nhất trong các bài kiểm tra của tôi:

ChatGPT Plus: “Quán quân” toàn diện cho lập trình

  • Ưu điểm: Vượt qua tất cả các bài kiểm tra, code mạnh mẽ, có app riêng cho Mac.

  • Nhược điểm: Đôi khi đưa ra kết quả "ảo", chưa có app cho Windows, đôi khi "khó tính"

  • Chi tiết: Giá 20 đô la mỗi tháng, hỗ trợ LLM GPT-4o, GPT-4, GPT-3.5, giao diện web và app Mac, xác thực đa yếu tố, đã vượt qua cả 4 bài test. ChatGPT Plus với GPT-4 và GPT-4o đã vượt qua tất cả các bài kiểm tra của tôi. Một trong những tính năng yêu thích của tôi là app riêng. Tôi có thể làm việc trên trình duyệt, IDE và app ChatGPT Mac trên các màn hình riêng biệt, điều này rất tiện lợi. Công cụ Prompt Builder của Logitech cũng có thể sử dụng GPT-4o, cho phép tôi tạo prompt bằng một cú nhấn chuột.

    Tuy nhiên, GPT-4o đôi khi đưa ra kết quả với hai lựa chọn, trong đó một đáp án sai. Dù vậy, một thử nghiệm nhanh sẽ giúp tôi xác định đáp án đúng. Hiện tại, tôi vẫn thích dùng GPT-4 hơn khi coding.

Perplexity Pro: “Chuyên gia” thử nghiệm LLM

  • Ưu điểm: Hỗ trợ nhiều LLM, hiển thị tiêu chí tìm kiếm, nguồn tin tốt.

  • Nhược điểm: Chỉ đăng nhập bằng email, không có app desktop.

  • Chi tiết: Giá 20 đô la mỗi tháng, hỗ trợ nhiều LLM (GPT-4o, Claude 3.5 Sonnet, Sonar Large, Claude 3 Opus, Llama 3.1 405B), giao diện web, không có xác thực đa yếu tố, vượt qua cả 4 bài test.

    Perplexity Pro có thể chạy nhiều LLM khác nhau, đây là một tính năng rất hay. Bạn có thể chọn model khác nhau trong phần cài đặt. Với coding, GPT-4o vẫn là lựa chọn tốt nhất. Ngoài ra, bạn có thể kiểm tra chéo code bằng các LLM khác nhau, đây là một cách hay để "review" code của mình bằng AI.

Grok: “Ngựa ô” bất ngờ từ X

  • Ưu điểm: LLM khác biệt so với ChatGPT, mô tả tốt, miễn phí.

  • Nhược điểm: Chỉ hoạt động trên trình duyệt, có thể không miễn phí lâu dài.

  • Chi tiết: Hiện tại miễn phí, sử dụng LLM Grok-1, giao diện web, xác thực đa yếu tố, vượt qua 3/4 bài test.

    Grok đã làm tôi ngạc nhiên. Mặc dù tôi không đặt nhiều kỳ vọng vào một LLM được "đính kèm" vào mạng xã hội X, nhưng nó đã làm khá tốt, đặc biệt là có một LLM không dựa trên OpenAI. Grok đã mắc một lỗi nhỏ, nhưng có thể khắc phục bằng một prompt chi tiết hơn.

    Đây là một "chiến binh" đáng để theo dõi.

ChatGPT Free: “Lựa chọn” miễn phí tốt nhất cho coding

  • Ưu điểm: Miễn phí, vượt qua hầu hết các bài test.

  • Nhược điểm: Bị giới hạn số lượng prompt, có thể bị ngắt giữa chừng.

  • Chi tiết: Miễn phí, hỗ trợ LLM GPT-4o, GPT-3.5, giao diện web, app Mac, xác thực đa yếu tố, vượt qua 3/4 bài test ở chế độ GPT-3.5.

    ChatGPT miễn phí có giới hạn. Nếu lưu lượng truy cập cao, bạn chỉ có thể dùng GPT-3.5. Công cụ này cũng giới hạn số lượng truy vấn trước khi chuyển sang phiên bản cũ hơn hoặc tắt hoàn toàn. Dù vậy, GPT-3.5 vẫn làm tốt hơn các chatbot khác và nó chỉ thất bại trong một bài kiểm tra với công cụ lập trình khá "dị".

Perplexity Free: “Trợ lý” miễn phí cho coding và nghiên cứu

  • Ưu điểm: Miễn phí, vượt qua hầu hết các bài test, nhiều công cụ nghiên cứu.
  • Nhược điểm: Giới hạn với GPT-3.5, hạn chế số lượng prompt.
  • Chi tiết: Miễn phí, sử dụng LLM GPT-3.5, giao diện web, không có xác thực đa yếu tố, vượt qua 3/4 bài test.

Perplexity Free dựa trên GPT-3.5 và có kết quả tốt hơn các chatbot miễn phí khác. Ngoài ra, Perplexity còn cung cấp nhiều nguồn thông tin hơn cho các câu hỏi nghiên cứu, trích dẫn nguồn rõ ràng và gợi ý các câu hỏi tìm kiếm khác.

3. Những "Kẻ Thất Bại" Đáng Thất Vọng

Tôi đã thử nghiệm 11 LLM, và 6 trong số đó đã vượt qua hầu hết các bài kiểm tra. Những chatbot còn lại, bao gồm một vài chatbot được quảng cáo là tuyệt vời cho coding, chỉ vượt qua 1 trong các bài kiểm tra, thậm chí Copilot của Microsoft còn không vượt qua bài kiểm tra nào.

Dưới đây là danh sách các "kẻ thất bại":

  • Meta AI: Tạo giao diện người dùng đẹp nhưng không có chức năng, tìm thấy bug nhưng không giải quyết được.
  • Meta Code Llama: Được thiết kế dành riêng cho coding, nhưng lại thất bại trong các bài kiểm tra khác nhau so với Meta AI.
  • Claude 3.5 Sonnet: Được quảng cáo lý tưởng cho coding, nhưng chỉ vượt qua 1 bài kiểm tra.
  • Gemini Advanced: Phiên bản chuyên nghiệp của chatbot Gemini, chỉ vượt qua 1 bài kiểm tra.
  • Microsoft Copilot: Bất ngờ khi công ty nổi tiếng về công cụ lập trình lại có một chatbot thể hiện kém như vậy.

4. Lời Khuyên Cuối: Lựa Chọn Công Cụ Phù Hợp

Bạn có thể có chatbot yêu thích, nhưng hãy nhớ rằng, các bài kiểm tra của tôi chỉ tập trung vào các công việc lập trình hàng ngày. Hãy sử dụng chatbot nào phù hợp nhất với nhu cầu của bạn. Nếu bạn đang tìm kiếm một chatbot đa năng với chi phí hợp lý, hãy chọn một chatbot có thể đáp ứng nhiều nhu cầu khác nhau của bạn.

Mặc dù kết quả hiện tại khá bất ngờ, nhưng lĩnh vực AI đang phát triển với tốc độ rất nhanh. Chúng tôi sẽ quay lại với các bài kiểm tra và kết quả cập nhật trong tương lai.

Hãy cho chúng tôi biết trải nghiệm của bạn với các chatbot AI này nhé!

0 comments Blogger 0 Facebook

Đăng nhận xét

 
Agent.ai.vn © 2024 - Nắm bắt tương lai
Top