Supermaven: Trợ lý mã hóa AI thu hút đầu tư từ OpenAI và Perplexity
Jacob Jackson, một doanh nhân trẻ tuổi, đã sớm nhận ra tiềm năng của AI trong lĩnh vực công nghệ. Khi còn là sinh viên khoa học máy tính tại Đại học Waterloo, anh đã đồng sáng lập Tabnine, một trợ lý mã hóa AI đã thu hút gần 60 triệu USD đầu tư từ các quỹ đầu tư mạo hiểm. Sau khi bán Tabnine cho Codata vào năm 2019, Jackson gia nhập OpenAI với vai trò thực tập sinh và làm việc tại đây cho đến năm 2022.
Sau khoảng thời gian tại OpenAI, Jackson lại tràn đầy năng lượng để thành lập một công ty mới, Supermaven, tập trung vào hỗ trợ các quy trình phát triển phần mềm thông thường.
“Kể từ khi tôi tạo ra Tabnine, các công cụ như ChatGPT và GitHub Copilot đã thay đổi cách thức các nhà phát triển làm việc,” Jackson chia sẻ với TechCrunch. “Đây là thời điểm vô cùng thú vị để phát triển các công cụ dành cho nhà phát triển vì công nghệ nền tảng đã được cải thiện đáng kể kể từ khi tôi bắt đầu Tabnine – điều này đã thu hút nhiều nhà phát triển hơn quan tâm đến việc sử dụng các công cụ AI để đẩy nhanh quy trình làm việc của họ.”
Supermaven là một nền tảng mã hóa AI, tương tự như Tabnine, nhưng được nâng cấp về cả chất lượng và kỹ thuật.
Mô hình AI do Supermaven tự phát triển, Babble, có khả năng hiểu một khối lượng lớn mã cùng một lúc, nhờ vào cửa sổ ngữ cảnh 1 triệu token. (Trong khoa học dữ liệu, token là các phần dữ liệu thô được phân chia, giống như các âm tiết “fan”, “tas” và “tic” trong từ “fantastic”).
Ngữ cảnh của một mô hình, hay còn gọi là cửa sổ ngữ cảnh, đề cập đến dữ liệu đầu vào (ví dụ: mã) mà mô hình xem xét trước khi tạo ra đầu ra (ví dụ: mã bổ sung). Ngữ cảnh dài có thể ngăn chặn các mô hình “quên” nội dung của tài liệu và dữ liệu gần đây, đồng thời tránh việc lạc đề và suy luận sai.
“Cửa sổ ngữ cảnh lớn của chúng tôi giúp giảm tần suất xảy ra hiện tượng ảo giác vì nó cho phép mô hình lấy câu trả lời từ ngữ cảnh trong những trường hợp mà nếu không, nó sẽ phải đoán,” Jackson chia sẻ.
1 triệu token là một cửa sổ ngữ cảnh lớn, tuy nhiên, nó vẫn nhỏ hơn so với Magic, một công ty khởi nghiệp mã hóa AI khác, với 100 triệu token. Trong khi đó, Code Assist, công cụ hỗ trợ mã mới được Google giới thiệu, cũng có ngữ cảnh 1 triệu token giống như Supermaven.
Vậy lợi thế của Supermaven so với các đối thủ là gì? Jackson khẳng định rằng Babble có độ trễ thấp hơn nhờ vào “kiến trúc mạng thần kinh mới.” Anh từ chối tiết lộ thêm thông tin về kiến trúc này ngoài việc nó được phát triển “từ đầu.”
“Supermaven dành 10 đến 20 giây để xử lý kho lưu trữ mã của nhà phát triển để làm quen với API và các quy ước mã độc đáo của kho lưu trữ đó,” Jackson nói. “Với độ trễ thấp hơn nhờ vào cơ sở hạ tầng phục vụ mô hình nội bộ, công cụ của chúng tôi vẫn phản hồi tốt khi hoạt động với các lời nhắc dài đi kèm với các kho lưu trữ mã lớn.”
Thị trường cho các công cụ mã hóa AI rất lớn và đang phát triển. Polaris Research dự đoán thị trường này sẽ đạt 27,17 tỷ USD vào năm 2032. Đa số các nhà phát triển tham gia cuộc khảo sát gần đây của GitHub cho biết họ đã sử dụng các công cụ AI ở một mức độ nào đó, và hơn 1,8 triệu người – cùng khoảng 50.000 doanh nghiệp – đang trả tiền cho GitHub Copilot.
Tuy nhiên, Supermaven – cùng với các công ty khởi nghiệp cạnh tranh như Cognition, Anysphere, Poolside, Codeium và Augment – phải vượt qua những thách thức về đạo đức và pháp lý.
Các doanh nghiệp thường e ngại việc phơi bày mã độc quyền cho bên thứ ba; ví dụ, Apple được cho là đã cấm nhân viên sử dụng Copilot vào năm ngoái, do lo ngại về rò rỉ dữ liệu bí mật. Một số công cụ tạo mã được đào tạo bằng cách sử dụng mã có giấy phép hạn chế hoặc bản quyền đã được chứng minh là “nôn” ra mã đó khi được nhắc theo một cách nhất định, gây ra rủi ro pháp lý (ví dụ: các nhà phát triển kết hợp mã đó có thể bị kiện). Và, do AI thường mắc lỗi, các công cụ hỗ trợ mã hóa có thể dẫn đến việc thêm nhiều mã sai và không an toàn vào các kho lưu trữ mã.
Jackson cho biết Supermaven không sử dụng dữ liệu khách hàng để đào tạo các mô hình của mình. Tuy nhiên, anh thừa nhận rằng công ty lưu giữ dữ liệu trong một tuần để “làm cho hệ thống nhanh và phản hồi tốt,” anh nói. Về vấn đề bản quyền, Jackson không phủ nhận một cách rõ ràng rằng Babble được đào tạo trên mã được bảo vệ bằng quyền sở hữu trí tuệ – chỉ là nó được “đào tạo gần như hoàn toàn trên mã có sẵn công khai thay vì thu thập dữ liệu trên internet công khai” để “giảm thiểu tiếp xúc với nội dung độc hại trong quá trình đào tạo.”
Khách hàng dường như không bị những điều này ngăn cản. Jackson cho biết hơn 35.000 nhà phát triển đang sử dụng Supermaven, và một phần đáng kể trong số đó đang trả tiền cho các gói Pro cao cấp (10 USD mỗi tháng) và Team (10 USD mỗi tháng cho mỗi người dùng). Doanh thu thường niên lặp lại của Supermaven đã đạt 1 triệu USD trong năm nay nhờ vào cơ sở người dùng đã tăng gấp 3 lần kể từ khi nền tảng này được ra mắt vào tháng 2.
Sự tăng trưởng ấn tượng này đã thu hút sự chú ý của các quỹ đầu tư mạo hiểm.
Tuần này, Supermaven đã công bố vòng tài trợ bên ngoài đầu tiên: 12 triệu USD do Bessemer Venture Partners dẫn đầu và các nhà đầu tư thiên thần nổi tiếng bao gồm John Schulman, đồng sáng lập OpenAI và Denis Yarats, đồng sáng lập Perplexity. Jackson cho biết kế hoạch sử dụng số tiền này để tuyển dụng các nhà phát triển (hiện tại Supermaven có đội ngũ 5 người) và phát triển trình chỉnh sửa văn bản của Supermaven, hiện đang trong giai đoạn thử nghiệm beta.
“Chúng tôi dự định sẽ tăng trưởng đáng kể cho đến cuối năm,” anh nói thêm. “Mặc dù có những khó khăn cho ngành công nghệ nói chung, nhưng thị trường cho các trợ lý mã hóa AI đã phát triển nhanh chóng. Sự tăng trưởng của chúng tôi kể từ khi ra mắt vào tháng 2 – cũng như vòng tài trợ gần đây nhất – đã định vị tốt cho chúng tôi khi bước vào năm sau.”

0 comments Blogger 0 Facebook
Đăng nhận xét