HyperWrite ra mắt Reflection 70B: Mô hình ngôn ngữ nguồn mở mạnh mẽ nhất thế giới

HyperWrite, công ty khởi nghiệp về viết AI, vừa công bố Reflection 70B, một mô hình ngôn ngữ lớn (LLM) mới dựa trên Llama 3.1-70B Instruct của Meta. Reflection 70B được trang bị một kỹ thuật tự sửa lỗi mới và đạt hiệu suất vượt trội trong các điểm chuẩn của bên thứ ba, chính thức trở thành "vua" mới trong lĩnh vực mô hình ngôn ngữ nguồn mở.

Matt Shumer, đồng sáng lập kiêm CEO của HyperWrite, đã chia sẻ thông tin này trên mạng xã hội X, cho biết Reflection 70B hiện là "mô hình AI nguồn mở hàng đầu thế giới". Kết quả đánh giá hiệu suất dựa trên các điểm chuẩn như MMLU và HumanEval, được kiểm chứng bởi công cụ LLM Decontaminator của LMSys để loại bỏ các sai lệch, cho thấy Reflection 70B vượt trội so với các mô hình trong dòng Llama của Meta và cạnh tranh ngang ngửa với các mô hình thương mại hàng đầu.

Khả năng tự sửa lỗi - điểm khác biệt của Reflection 70B

Điểm nổi bật của Reflection 70B chính là khả năng tự nhận biết và sửa chữa lỗi. Shumer chia sẻ rằng: "Tôi đã suy nghĩ về ý tưởng này trong nhiều tháng. Các LLM thường bị "ảo giác", nhưng chúng không thể tự điều chỉnh. Điều gì sẽ xảy ra nếu bạn dạy cho một LLM cách nhận biết và sửa chữa lỗi của chính nó?".

Reflection 70B sử dụng kỹ thuật "reflection tuning", cho phép mô hình phân tích lý luận của mình và đánh giá độ chính xác trước khi đưa ra kết quả cuối cùng. Mô hình này cũng giới thiệu các token đặc biệt mới cho việc lập luận và sửa lỗi, giúp người dùng tương tác một cách có cấu trúc hơn.

Thử nghiệm và ứng dụng

Bạn có thể tự mình trải nghiệm Reflection 70B thông qua trang web "playground" demo. Tuy nhiên, do sức hút lớn của mô hình mới, trang web đã bị quá tải, và đội ngũ HyperWrite đang nỗ lực tìm kiếm thêm GPU để đáp ứng nhu cầu sử dụng.

Reflection 70B đã được thử nghiệm với một số câu hỏi cơ bản mà nhiều mô hình AI, kể cả những mô hình độc quyền hàng đầu, thường gặp khó khăn, ví dụ như đếm số lần xuất hiện chữ "r" trong từ "Strawberry" hay xác định số nào lớn hơn giữa 9.11 và 9.9. Mặc dù tốc độ xử lý có phần chậm, Reflection 70B vẫn đưa ra câu trả lời chính xác sau khoảng 60 giây.

Tương lai của Reflection và HyperWrite

Reflection 70B hiện đã có sẵn để tải xuống trên Hugging Face, và API sẽ được cung cấp thông qua Hyperbolic Labs trong thời gian tới. Đây mới chỉ là bước khởi đầu của dòng sản phẩm Reflection. Shumer cho biết Reflection 405B, một mô hình lớn hơn và mạnh mẽ hơn, sẽ được phát hành vào tuần tới.

HyperWrite cũng đang tích hợp Reflection 70B vào sản phẩm trợ lý viết AI chính của mình. Reflection 405B được kỳ vọng sẽ vượt trội cả những mô hình nguồn đóng hàng đầu hiện nay như GPT-4 của OpenAI.

Vai trò của Glaive trong quá trình phát triển

Một yếu tố quan trọng góp phần vào thành công của Reflection 70B là dữ liệu tổng hợp được tạo bởi Glaive, một công ty khởi nghiệp chuyên tạo ra các tập dữ liệu dành riêng cho từng trường hợp sử dụng. Glaive cho phép đào tạo nhanh chóng các mô hình ngôn ngữ nhỏ, tập trung vào các nhiệm vụ cụ thể, góp phần dân chủ hóa công nghệ AI.

Nhờ công nghệ của Glaive, đội ngũ Reflection có thể tạo ra dữ liệu tổng hợp chất lượng cao để huấn luyện Reflection 70B trong thời gian ngắn, chỉ mất 3 tuần để hoàn thành 5 lần lặp lại quá trình đào tạo.

HyperWrite - công ty khởi nghiệp AI hiếm hoi đến từ Long Island

HyperWrite, ban đầu được biết đến với tên Otherside AI, đã được thành lập từ năm 2020 tại Melville, New York. Sản phẩm chính của họ, HyperWrite, ban đầu là một tiện ích mở rộng của Chrome giúp người dùng soạn thảo email và phản hồi dựa trên các điểm then chốt.

Sản phẩm này đã phát triển mạnh mẽ, được hơn 2 triệu người dùng sử dụng vào tháng 11 năm 2023, và đã mang về cho hai nhà sáng lập Matt Shumer và Jason Kuperberg một vị trí trong danh sách "30 Under 30" của Forbes.

Kết luận

Sự ra đời của Reflection 70B đánh dấu một cột mốc quan trọng cho AI nguồn mở, cung cấp cho các nhà phát triển và nhà nghiên cứu một công cụ mạnh mẽ có khả năng cạnh tranh với các mô hình độc quyền. Với phương pháp lập luận và sửa lỗi độc đáo, Reflection hứa hẹn sẽ đặt ra một tiêu chuẩn mới cho những gì các mô hình nguồn mở có thể đạt được trong tương lai. Sự cạnh tranh trong lĩnh vực AI đang ngày càng khốc liệt, và Reflection 70B đang khẳng định vị thế của mình như một đối thủ đáng gờm đối với các "ông lớn" trong ngành.


Blog post image

0 comments Blogger 0 Facebook

Đăng nhận xét

 
Agent.ai.vn © 2024 - Nắm bắt tương lai
Top