Dracarys: Ngọn Lửa Mới Cho Lập Trình AI Mở Nguồn

Cho những ai yêu thích bộ phim truyền hình Game of Thrones, "Dracarys" là một từ mang ý nghĩa đặc biệt. Đó là câu lệnh để rồng phun lửa.

Trong thế giới AI thế hệ mới, nhờ Abacus.ai, "Dracarys" cũng có ý nghĩa riêng của nó. Dracarys là tên gọi của một dòng mô hình ngôn ngữ lớn (LLM) mã nguồn mở mới, được thiết kế dành riêng cho lập trình.

Abacus.ai, một nền tảng phát triển và cung cấp công cụ AI, đã không xa lạ gì với việc đặt tên công nghệ của mình theo những con rồng trong truyền thuyết. Hồi tháng 2, công ty đã cho ra mắt Smaug-72B, lấy tên con rồng từ tác phẩm kinh điển "The Hobbit". Trong khi Smaug là một LLM đa năng, Dracarys lại được tối ưu hóa cho các nhiệm vụ lập trình.

Phiên bản đầu tiên của Dracarys được Abacus.ai áp dụng công thức "Dracarys" vào mô hình 70B tham số. Công thức này bao gồm việc tinh chỉnh tối ưu hóa, cùng với các kỹ thuật khác.

Bindu Reddy, Giám đốc điều hành và đồng sáng lập Abacus.ai, chia sẻ với VentureBeat: "Đó là sự kết hợp giữa tập dữ liệu huấn luyện và các kỹ thuật tinh chỉnh để nâng cao khả năng lập trình của bất kỳ LLM mã nguồn mở nào. Chúng tôi đã chứng minh rằng nó cải thiện cả Qwen-2 72B và LLama-3.1 70b."

Gen AI cho Lập Trình: Một Không Gian Nhanh Chóng Phát Triển

Thị trường tổng thể của gen AI trong lĩnh vực phát triển ứng dụng và lập trình đang sôi động.

GitHub Copilot là người tiên phong trong lĩnh vực này, giúp các nhà phát triển hoàn thành mã và thực hiện các nhiệm vụ phát triển ứng dụng. Nhiều startup, bao gồm Tabnine và Replit, cũng đã tích hợp các tính năng mang sức mạnh của LLM đến với các nhà phát triển.

Và dĩ nhiên, các nhà cung cấp LLM cũng góp mặt. Dracarys cung cấp một phiên bản tinh chỉnh của mô hình đa năng Llama 3.1 của Meta. Anthropic's Claude 3.5 Sonnet cũng nổi lên trong năm 2024 như một LLM phổ biến và hiệu quả cho lập trình.

Reddy cho biết: "Claude 3.5 là một mô hình lập trình rất tốt, nhưng nó là mã nguồn đóng. Công thức của chúng tôi cải thiện mô hình mã nguồn mở, và Dracarys-72B-Instruct là mô hình lập trình tốt nhất trong lớp của nó."

Những Con Số Nói Lên Khả Năng Lập Trình AI Của Dracarys

Theo các điểm chuẩn LiveBench dành cho các mô hình mới, công thức Dracarys đã mang lại sự cải thiện đáng kể.

LiveBench đánh giá mô hình meta-llama-3.1-70b-instruct turbo đạt điểm lập trình là 32.67. Phiên bản được tinh chỉnh bởi Dracarys nâng điểm lên 35.23. Đối với qwen2, kết quả còn ấn tượng hơn. Mô hình qwen2-72b-instruct hiện có điểm lập trình là 32.38. Sử dụng công thức Dracarys đẩy điểm số lên 38.95.

Mặc dù hiện tại qwen2 và Llama 3.1 là hai mô hình duy nhất được áp dụng công thức Dracarys, nhưng Abacus.ai dự định sẽ triển khai công thức này cho nhiều mô hình hơn trong tương lai.

Reddy chia sẻ: "Chúng tôi cũng sẽ phát hành phiên bản Dracarys cho Deepseek-coder và Llama-3.1 400b."

Dracarys Sẽ Giúp Lập Trình Doanh Nghiệp Như Thế Nào?

Dracarys hứa hẹn sẽ mang lại nhiều lợi ích cho các nhà phát triển và doanh nghiệp, nhờ hiệu suất lập trình được cải thiện.

Hiện tại, Abacus.ai cung cấp trọng lượng mô hình trên Hugging Face cho cả mô hình Llama và Qwen2 dựa trên Dracarys. Reddy nhấn mạnh rằng các mô hình tinh chỉnh cũng có sẵn trong dịch vụ Doanh nghiệp của Abacus.ai.

Reddy chia sẻ: "Chúng là lựa chọn tuyệt vời cho các doanh nghiệp không muốn gửi dữ liệu của họ đến các API công khai như OpenAI và Gemini. Chúng tôi cũng sẽ cung cấp Dracarys trên dịch vụ ChatLLM phổ biến của mình, dành cho các nhóm nhỏ và chuyên gia, nếu có đủ nhu cầu."

Dracarys, với sức mạnh của nó, hứa hẹn sẽ là một ngọn lửa mới, thắp sáng tương lai của lập trình AI mã nguồn mở. Cùng chờ xem những bước phát triển tiếp theo của Dracarys và cách nó sẽ định hình lại ngành công nghiệp AI trong thời gian tới.


Blog post image

0 comments Blogger 0 Facebook

Đăng nhận xét

 
Agent.ai.vn © 2024 - Nắm bắt tương lai
Top