Mô hình AI mới của Alibaba sánh ngang GPT-4o của OpenAI về khả năng lập trình

Mục lục

Giới thiệu

Bài báo từ South China Morning Post đưa tin về sự ra mắt của Qwen2.5 Coder, một mô hình trí tuệ nhân tạo (AI) mã nguồn mở mới của Alibaba. Mô hình này được đánh giá là ngang ngửa hoặc vượt trội so với các mô hình hàng đầu của Mỹ, như GPT-4o của OpenAI và Claude 3.5 Sonnet của Anthropic, về khả năng lập trình. Điều này cho thấy sự cạnh tranh ngày càng khốc liệt giữa các công ty công nghệ Trung Quốc và Mỹ trong lĩnh vực AI mã nguồn mở.

Qwen2.5 Coder: Khả năng lập trình vượt trội

Theo thông cáo báo chí từ nhóm nghiên cứu Qwen, Qwen2.5 Coder đã đạt được hoặc vượt qua GPT-4o và Claude 3.5 Sonnet trong các bài kiểm tra lập trình như HumanEval, EvalPlus và Aider. Phiên bản hàng đầu của Qwen2.5 Coder thậm chí còn thể hiện tốt hơn trong 9/12 bài đánh giá so với hai đối thủ cạnh tranh đến từ Mỹ. Đây là một bước tiến đáng kể, bởi trước đây, các mô hình ngôn ngữ lớn (LLM) mã nguồn mở thường kém hơn các mô hình độc quyền về khả năng lập trình. Sự cải thiện hiệu suất của Qwen2.5 Coder một phần là nhờ vào tập dữ liệu huấn luyện toàn diện, bao gồm các kho lưu trữ mã nguồn từ Github, với hơn 92 ngôn ngữ lập trình khác nhau.

Cạnh tranh mã nguồn mở và cuộc đua công nghệ Mỹ - Trung

Sự phát triển của Qwen2.5 Coder diễn ra trong bối cảnh cạnh tranh mã nguồn mở ngày càng gia tăng. Meta Platforms, công ty mẹ của Facebook, gần đây đã công khai các mô hình Llama của mình cho các cơ quan chính phủ Mỹ để phát triển các ứng dụng quốc phòng và an ninh quốc gia. Meta nhấn mạnh tầm quan trọng của các mô hình mã nguồn mở trong cuộc cạnh tranh công nghệ Mỹ - Trung, cho rằng Trung Quốc cũng đang tích cực đầu tư và phát triển các mô hình tương tự để vượt mặt Mỹ. Ahsen Khaliq, chuyên gia hàng đầu về học máy tại Hugging Face (cộng đồng phát triển học máy lưu trữ nhiều mô hình mã nguồn mở), nhận định trợ lý lập trình AI của Alibaba có thể nâng cao hiệu quả bằng cách hỗ trợ phát triển mã nguồn an toàn, riêng tư và cục bộ thông qua tích hợp với các công cụ môi trường phát triển tích hợp (IDE).

Các mô hình AI lập trình khác tại Trung Quốc

Alibaba không phải là công ty duy nhất tại Trung Quốc phát triển các mô hình AI lập trình. Baidu, gã khổng lồ tìm kiếm, đã ra mắt công cụ lập trình Miaoda, cho phép lập trình phần mềm bằng ngôn ngữ tự nhiên. ByteDance, công ty mẹ của TikTok, cũng đã phát hành MarsCode, hỗ trợ nhiều IDE phổ biến và hơn 100 ngôn ngữ lập trình, có khả năng tự động hoàn thiện và sửa lỗi mã nguồn.

Kết luận

Sự xuất hiện của Qwen2.5 Coder và các mô hình AI lập trình khác tại Trung Quốc cho thấy sự bứt phá mạnh mẽ của các công ty công nghệ Trung Quốc trong cuộc đua AI toàn cầu. Sự cạnh tranh mã nguồn mở giữa Mỹ và Trung Quốc ngày càng quyết liệt, hứa hẹn sẽ mang lại nhiều đột phá công nghệ trong tương lai.

Logo

0 comments Blogger 0 Facebook

Đăng nhận xét

 
Agent.ai.vn © 2024 - Nắm bắt tương lai
Top