Mục lục
- Mở đầu: Sự bùng nổ của AI và câu hỏi về ứng dụng thực tế
- Phương pháp nghiên cứu: Khám phá thế giới AI qua góc nhìn của nhà phát triển
- Kết quả nghiên cứu: Sự khác biệt trong việc sử dụng AI theo khu vực, ngành và quy mô công ty
- 3.1. Ngành và quy mô công ty: Những ai đang dẫn đầu?
- 3.2. Địa lý: Ai đang sử dụng AI và sử dụng như thế nào?
- Cuộc chiến giữa các "ông lớn" AI: Musk và Zuckerberg
- Tương lai của AI mở: Liệu có cạnh tranh được với AI độc quyền?
- Kết luận: Những điều cần theo dõi trong hành trình AI đầy biến động
1. Mở đầu: Sự bùng nổ của AI và câu hỏi về ứng dụng thực tế
Từ khi ChatGPT của OpenAI xuất hiện vào cuối năm 2022, số lượng Mô hình Ngôn ngữ Lớn (LLM) đã tăng lên chóng mặt. Ước tính các doanh nghiệp đã chi 154 tỷ USD cho AI vào năm 2023, và một khảo sát toàn cầu của McKinsey cho thấy 65% công ty đang sử dụng thường xuyên AI tạo sinh (GenAI) trong hoạt động kinh doanh. Tuy nhiên, đằng sau những con số khổng lồ và sự hào hứng, chúng ta vẫn chưa thực sự hiểu rõ công nghệ này đang được sử dụng như thế nào và ở đâu.
Bài viết này sẽ cung cấp một góc nhìn sâu hơn, đi xa hơn các khảo sát thông thường với các nhà quản lý kinh doanh. Chúng tôi sẽ phân tích dữ liệu thực tế về cách các nhà phát triển phần mềm đang tương tác với một số LLM mã nguồn mở hàng đầu. Đây là những mô hình có thể truy cập, sửa đổi và phân phối lại một cách tự do với ít hạn chế.
2. Phương pháp nghiên cứu: Khám phá thế giới AI qua góc nhìn của nhà phát triển
Để tìm kiếm dữ liệu sử dụng cụ thể, chúng tôi đã tìm đến nền tảng phát triển phổ biến GitHub, một kho lưu trữ quan trọng cho code AI và các tài nguyên khác. Nền tảng này chứa nhiều LLM mã nguồn mở đáng chú ý như Grok, Llama của Meta, Yi của tập đoàn 01.AI Trung Quốc và Mistral của công ty khởi nghiệp AI cùng tên đến từ Pháp.
Ưu điểm của GitHub là khả năng xác định nhà phát triển nào đã tải xuống ("forked") code LLM nào để xây dựng ứng dụng AI. Điều này cung cấp thông tin chi tiết về LLM nào đang được các nhà phát triển ưa chuộng. Vì các nhà phát triển là những người thúc đẩy các giới hạn công nghệ, việc theo dõi hành vi của họ có thể cho thấy xu hướng AI.
Ngoài ra, bản chất mở của GitHub cũng cho phép chúng tôi xác định được một tỷ lệ đáng kể quốc gia cư trú, ngành nghề và quy mô công ty của các nhà phát triển. Dù không hoàn toàn chính xác, dữ liệu của chúng tôi cung cấp một bức tranh về cách các nhà phát triển từ các quốc gia, quy mô công ty và ngành khác nhau đang tiếp nhận LLM. Chúng tôi cũng đã so sánh số liệu áp dụng AI với việc sử dụng TensorFlow, một trong những công cụ phát triển máy học phổ biến nhất được Google phát hành vào năm 2015.
3. Kết quả nghiên cứu: Sự khác biệt trong việc sử dụng AI theo khu vực, ngành và quy mô công ty
3.1. Ngành và quy mô công ty: Những ai đang dẫn đầu?
Ở giai đoạn đầu của việc áp dụng AI, chúng tôi nhận thấy sự khác biệt đáng kể giữa các ngành. Các công ty công nghệ dẫn đầu (48,3% số lượng fork), nhưng ngành giáo dục cũng có tỷ lệ sử dụng LLM khá cao (26,3%).
Sự thể hiện mạnh mẽ của các tổ chức giáo dục phản ánh mức độ nghiên cứu về LLM và GenAI. Tại INSEAD, chúng tôi cũng nhận thấy sự quan tâm sâu sắc của các giảng viên và sinh viên trong việc tìm hiểu khả năng và hạn chế của chúng. Vì chi phí phát triển LLM hiện đại rất lớn, các nhà nghiên cứu có thể sử dụng các mô hình mã nguồn mở thay vì các sản phẩm độc quyền của OpenAI và Anthropic.
Chúng tôi nhận thấy việc sử dụng LLM ở các ngành truyền thống thấp hơn nhiều, đặc biệt là những ngành sản xuất và bán sản phẩm vật lý. Điều này cho thấy vai trò quan trọng của công nghệ và giáo dục đại học trong việc thúc đẩy sự đổi mới trong nền kinh tế.
Chúng tôi dự đoán các công ty khởi nghiệp nhỏ sẽ đi đầu trong việc áp dụng AI mở. Tuy nhiên, trong khi các công ty khởi nghiệp dẫn đầu, vẫn có sự tham gia đáng kể của các công ty thuộc mọi quy mô. Điều này khác với TensorFlow, nơi các công ty lớn là người dùng lớn nhất.
3.2. Địa lý: Ai đang sử dụng AI và sử dụng như thế nào?
Không có gì đáng ngạc nhiên khi Bắc Mỹ là khu vực thống trị hoạt động LLM của các nhà phát triển trên GitHub, với hơn 50% số lượng fork bắt nguồn từ đây. Tuy nhiên, sự thống trị của Bắc Mỹ trong LLM thấp hơn so với TensorFlow, nơi khu vực này chiếm hơn 60% số lượng fork.
Dù phần lớn nhất quán giữa các khu vực, vẫn có một số khác biệt đáng chú ý. Các công ty khởi nghiệp có thị phần fork hàng đầu ở mọi khu vực, ngoại trừ Bắc Mỹ. Tại đây, các công ty lớn nhất (có hơn 10.000 nhân viên) lại dẫn đầu. Điều này có thể phản ánh sự trưởng thành hơn của việc áp dụng AI ở Mỹ và Canada, nơi các công ty có nhiều thời gian hơn để hiểu rõ lợi ích của công nghệ này.
Điều đáng chú ý hơn là sự thống trị của các mô hình LLM của Mỹ. Llama chiếm thị phần lớn ở tất cả các khu vực, với Grok ở vị trí thứ hai. Dữ liệu của chúng tôi không cho thấy các nhà phát triển thể hiện bất kỳ sự ưu ái khu vực nào đối với LLM địa phương, chẳng hạn như Mistral ở châu Âu.
4. Cuộc chiến giữa các "ông lớn" AI: Musk và Zuckerberg
Llama rõ ràng đang hưởng lợi từ quyết định áp dụng chiến lược mã nguồn mở cho LLM của họ từ sớm, bắt đầu với việc phát hành các trọng số cho Llama 2 vào tháng 11 năm 2023. Vị trí dẫn đầu của họ cũng được củng cố bởi thương hiệu Meta.
Với các mô hình Grok, Musk đang tìm cách thách thức Meta để giành vị trí dẫn đầu trong phân khúc mã nguồn mở, đồng thời cạnh tranh với cựu cộng tác viên Sam Altman, CEO của OpenAI. Kể từ khi phát hành Grok 2 vào tháng 8 năm 2023, xAI của Musk đã áp dụng chiến lược kết hợp, trong đó mô hình mới nhất của họ vẫn ở chế độ riêng tư, mặc dù họ công bố các trọng số cho các mô hình trước đó.
Điều thú vị là Grok hoạt động tốt dù xuất hiện muộn, đặc biệt là ở Trung Quốc và các khu vực khác trên thế giới. Mối liên hệ chặt chẽ của nó với X có thể là một lợi thế, cũng như sức hút của Musk. Điều thú vị là liệu vai trò mới của ông trong chính phủ Mỹ có ảnh hưởng đến mức độ chấp nhận trong tương lai hay không.
Ngoài khu vực, dữ liệu của chúng tôi cho thấy những khác biệt khác trong cơ sở người dùng của hai mô hình này. Grok có trọng số cao hơn một chút trong lĩnh vực công nghệ, trong khi Llama dường như phổ biến hơn trong số những người thuộc lĩnh vực giáo dục. Cuối cùng, Llama phổ biến hơn một chút trong số các tổ chức lớn, trong khi Grok được liên kết nhiều hơn với các công ty khởi nghiệp.
5. Tương lai của AI mở: Liệu có cạnh tranh được với AI độc quyền?
Chúng ta vẫn đang ở giai đoạn đầu của sự phát triển và chấp nhận LLM. Khả năng dự đoán tương lai là rất khó khăn do sự cạnh tranh gay gắt giữa các công ty hàng đầu, chưa kể đến áp lực từ địa chính trị. Liệu một chính quyền Trump quyết đoán hơn có ảnh hưởng đến khả năng thống trị GenAI của Mỹ?
Phân tích của chúng tôi, dựa trên hành động của các nhà phát triển thực tế, cung cấp thông tin chi tiết về tình hình hiện tại. Quan trọng hơn, nó cung cấp một điểm chuẩn cho các phân tích trong tương lai và cơ hội để phát hiện các xu hướng về sở thích của nhà phát triển đối với các LLM cụ thể.
Chúng tôi đặc biệt quan tâm đến việc theo dõi động lực chấp nhận các mô hình mã nguồn mở. Liệu chúng có thể cạnh tranh hiệu quả với các mô hình độc quyền hoàn toàn hay không? Liệu Meta hoặc xAI có thể thay đổi cam kết của họ đối với mã nguồn mở không? Hiện tại, chúng đang phải đối mặt với những hạn chế về quyền truy cập dữ liệu đến chi phí, nhưng chúng dường như có những cơ hội lớn nhất cho sự đổi mới đáng kể.
Ilia Polosukhin, đồng sáng lập của Near.ai và đồng tác giả của bài báo mang tính bước ngoặt "Attention is all you need", cho biết: "tương lai của AI nên mở và có thể truy cập được cho tất cả mọi người. Khi các nhà phát triển tiếp tục đẩy mạnh các giới hạn của những gì có thể đạt được với công nghệ này, các mô hình có thể truy cập không cần xin phép sẽ là nền tảng để xây dựng những đột phá mới".
6. Kết luận: Những điều cần theo dõi trong hành trình AI đầy biến động
Bức tranh về AI chắc chắn sẽ thay đổi và phát triển theo thời gian. Chúng tôi hy vọng rằng, điều này sẽ cho phép chúng tôi tiếp tục lập bản đồ các xu hướng chấp nhận và cung cấp các chỉ số tốt hơn về nơi chúng ta có thể hướng tới trong hành trình AI mang tính cách mạng này.
0 comments Blogger 0 Facebook
Đăng nhận xét