Alibaba Ra Mắt Mô Hình AI Chuyên Cho Toán Học, Vượt Mặt Cả OpenAI và Google

Gã khổng lồ thương mại điện tử Trung Quốc, Alibaba, vừa qua đã công bố một bước tiến mới trong lĩnh vực trí tuệ nhân tạo (AI) với việc ra mắt Qwen2-Math, một nhóm các mô hình ngôn ngữ lớn (LLM) chuyên biệt cho toán học.

Alibaba khẳng định Qwen2-Math có khả năng giải quyết các vấn đề toán học vượt trội hơn cả những LLM hàng đầu đến từ Mỹ như GPT-4o của OpenAI.

Nhóm phát triển Qwen, trực thuộc mảng điện toán đám mây của Alibaba, chia sẻ: “Trong năm qua, chúng tôi đã tập trung nghiên cứu và nâng cao khả năng lập luận cho các mô hình ngôn ngữ lớn, đặc biệt chú trọng đến khả năng giải quyết các bài toán số học và toán học phức tạp”.

Qwen2-Math được xây dựng dựa trên nền tảng của Qwen2, dòng LLM mà Alibaba đã giới thiệu vào tháng 6. Nhóm mô hình mới này bao gồm ba mô hình với các quy mô tham số khác nhau, cho phép xử lý thông tin và đưa ra kết quả chính xác hơn.

Theo thông tin từ nhóm Qwen, mô hình Qwen2-Math-72B-Instruct, sở hữu số lượng tham số lớn nhất, đã vượt qua các LLM hàng đầu của Mỹ trong các bài kiểm tra toán học tiêu chuẩn. Đáng chú ý, Qwen2-Math-72B-Instruct đã "đánh bại" GPT-4o của OpenAI, Claude 3.5 Sonnet của Anthropic, Gemini 1.5 Pro của Google và Llama-3.1-405B của Meta Platforms.

Nhóm nghiên cứu khẳng định Qwen2-Math có thể xử lý tốt các bài kiểm tra toán học bằng cả tiếng Anh và tiếng Trung, bao gồm GSM8K (bộ dữ liệu gồm 8.500 bài toán tiểu học), OlympiadBench (bài kiểm tra khoa học song ngữ đa phương thức bậc cao) và thậm chí là kỳ thi tuyển sinh đại học "khét tiếng" của Trung Quốc - Gaokao.

Mặc dù vậy, nhóm Qwen cũng thừa nhận Qwen2-Math vẫn còn một số hạn chế, ví dụ như mới chỉ hỗ trợ tiếng Anh. Alibaba cho biết, trong tương lai gần, các mô hình song ngữ và đa ngôn ngữ sẽ được phát triển.

Thành công của Qwen2-Math tiếp tục khẳng định vị thế của Alibaba trong lĩnh vực AI, sau khi mô hình Qwen-72B-Instruct của họ leo lên vị trí số 1 trong bảng xếp hạng các mô hình mã nguồn mở toàn cầu.

Việc Alibaba theo đuổi hướng đi mã nguồn mở cho phép các nhà phát triển bên thứ ba tự do tiếp cận, sửa đổi và cải tiến các mô hình AI của họ. Điều này hứa hẹn sẽ tạo ra một cộng đồng phát triển AI sôi động, thúc đẩy sự tiến bộ chung của lĩnh vực này.

Sự ra mắt của Qwen2-Math là một minh chứng rõ ràng cho thấy khoảng cách về AI giữa Trung Quốc và Mỹ đang dần được thu hẹp. Các mô hình AI đến từ Trung Quốc đang ngày càng chứng tỏ được khả năng cạnh tranh sòng phẳng với các đối thủ "nặng ký" đến từ Thung lũng Silicon. Điều này hứa hẹn sẽ tạo ra một cuộc đua phát triển AI khốc liệt và đầy tiềm năng trong tương lai.

Alibaba Ra Mắt Mô Hình AI Chuyên Cho Toán Học, Vượt Mặt Cả OpenAI và Google