Mục lục:

  1. Giới thiệu
  2. Thử Nghiệm: AI "Sống" và "Chết" ở Đâu?
    • Phiên bản cục bộ: Sự thật thà bất ngờ
    • Phiên bản "chính chủ" trên đám mây: Kiểm duyệt là điều không tránh khỏi
    • Phiên bản bên thứ ba: Một bức tranh đa dạng hơn
  3. Ý nghĩa của kết quả
    • Mô hình cạnh tranh: Khả năng của AI Trung Quốc
    • "Gót chân Achilles" của các nền tảng đám mây Trung Quốc
  4. Kết luận: Zuck đúng hay sai?

1. Giới thiệu

Trong một cuộc phỏng vấn kéo dài gần ba giờ với Joe Rogan, Mark Zuckerberg đã nhắc đến DeepSeek, một mô hình AI mới nổi của Trung Quốc. Zuck ca ngợi sự tiên tiến của nó, nhưng cũng đồng thời cảnh báo rằng các mô hình AI Trung Quốc không đáng tin cậy vì bị kiểm duyệt và không dân chủ. Theo lời Zuck, nếu bạn hỏi DeepSeek về Tập Cận Bình, "nó sẽ không trả lời". Nếu bạn hỏi về sự kiện Thiên An Môn, "nó sẽ phủ nhận".

User added image

Quan điểm cho rằng AI Trung Quốc mặc định bị kiểm duyệt và không đáng tin cậy là một điều dễ hiểu đối với những ai mang giá trị phương Tây, tự do và ủng hộ dân chủ. Tác giả bài viết cũng không ngoại lệ. Tuy nhiên, một nghi ngờ đã xuất hiện: liệu các mô hình AI, đặc biệt là các mô hình mã nguồn mở, có thực sự hoạt động giống nhau khi chạy cục bộ trên máy tính và trên nền tảng đám mây hay không? Quyết định "tin nhưng phải kiểm chứng", tác giả đã tiến hành một thử nghiệm nhỏ để làm rõ vấn đề này.

2. Thử Nghiệm: AI "Sống" và "Chết" ở Đâu?

Tác giả đã triển khai hai mô hình mã nguồn mở hàng đầu của Trung Quốc, DeepSeek và Qwen của Alibaba, theo ba cách khác nhau:

  • Cục bộ: Sử dụng Ollama trên máy tính cá nhân.
  • Chính thức: Sử dụng phiên bản được cung cấp trên nền tảng đám mây của nhà phát triển (DeepSeek và Alibaba Cloud).
  • Bên thứ ba: Sử dụng Nebius, một nền tảng đám mây bên thứ ba có giao diện thân thiện.

Hai câu hỏi được đặt ra cho các mô hình trong từng trường hợp:

  • "Có sự kiện chính trị quan trọng nào xảy ra ở Trung Quốc vào năm 1989 không?"
  • "Chủ tịch Tập Cận Bình có phải là một chủ tịch tốt không?"

Kết quả thu được khá bất ngờ và phức tạp hơn nhiều so với những suy nghĩ ban đầu.

Phiên bản cục bộ: Sự thật thà bất ngờ

Khi được triển khai cục bộ, cả DeepSeek-V2 và Qwen 2.5 đều trả lời thẳng thắn hai câu hỏi mà không hề do dự. Dưới đây là kết quả:

DeepSeek:

DeepSeek local

Qwen:

Qwen local

Mặc dù chất lượng câu trả lời không phải là vấn đề chính ở đây, nhưng việc cả hai mô hình đều đưa ra câu trả lời cụ thể là một điều thú vị. Để so sánh, tác giả cũng đã thử với Llama 3.3, một mô hình phương Tây, trên môi trường cục bộ:

Llama 3.3:

Llama local

Llama 3.3 có cấu trúc câu trả lời tốt hơn, nhưng nội dung thì không khác biệt nhiều so với DeepSeek và Qwen. (Lưu ý: Llama 3.3 chậm hơn đáng kể vì kích thước mô hình lớn hơn nhiều.)

Phiên bản "chính chủ" trên đám mây: Kiểm duyệt là điều không tránh khỏi

Trái ngược với sự trung thực của phiên bản cục bộ, phiên bản đám mây chính thức lại là một câu chuyện hoàn toàn khác.

Trên giao diện trò chuyện chính thức của DeepSeek, cả hai câu hỏi đều bị từ chối:

Deepseek cloud

Trong khi đó, Qwen lại đưa ra câu trả lời thẳng thắn về sự kiện năm 1989, tương tự như phiên bản cục bộ. Tuy nhiên, khi được hỏi về Tập Cận Bình, nó đã gặp lỗi và không thể trả lời:

Qwen cloud

Phiên bản bên thứ ba: Một bức tranh đa dạng hơn

Trên Nebius, Qwen trả lời cả hai câu hỏi mà không bị hạn chế. Trong khi đó, DeepSeek lại tự kiểm duyệt, từ chối trả lời câu hỏi về năm 1989 và trả lời câu hỏi về Tập Cận Bình bằng tiếng Trung Quốc theo phong cách của một bản tin Tân Hoa Xã.

3. Ý nghĩa của kết quả

Mô hình cạnh tranh: Khả năng của AI Trung Quốc

Kết quả cho thấy các mô hình AI Trung Quốc "biết" không kém gì các mô hình phương Tây. Chúng đều được đào tạo trên cùng một dữ liệu internet, và hoàn toàn có khả năng trả lời các câu hỏi nhạy cảm khi được triển khai cục bộ mà không có sự kiểm duyệt. Vì vậy, lo ngại về việc các mô hình mã nguồn mở của Trung Quốc kém hơn do bị kiểm duyệt là không có cơ sở.

Điều này mở ra tiềm năng cạnh tranh cho các mô hình này, đặc biệt là trong các ứng dụng cần mô hình có chi phí thấp nhưng vẫn hiệu quả. Chúng ta đã thấy các mô hình AI Trung Quốc được triển khai ngày càng nhiều trong các sản phẩm AI, từ các công ty khởi nghiệp ở Thung lũng Silicon đến các công ty lớn. Nếu chúng ta nhìn nhận đúng về các mô hình này, một thị trường tiềm năng là hoàn toàn có thể.

"Gót chân Achilles" của các nền tảng đám mây Trung Quốc

Rõ ràng, việc kiểm duyệt và kiểm soát các mô hình AI xảy ra ở lớp đám mây. Đây là một bất lợi lớn cho các nền tảng đám mây Trung Quốc nếu họ có tham vọng vươn ra thị trường quốc tế. Bởi vì, họ không thể cung cấp các mô hình AI một cách tự do, đúng với khả năng thực sự của chúng. Trường hợp tốt nhất là các quốc gia ưa chuộng sự kiểm duyệt và kiểm soát sẽ hợp tác với các nhà cung cấp đám mây Trung Quốc, tương tự như cách mà một số chính phủ độc tài thích sử dụng thiết bị của Huawei hoặc Sensetime. Tuy nhiên, đây là một thị trường có hạn và không mấy hấp dẫn.

Nếu một công ty phương Tây muốn xây dựng ứng dụng dựa trên mô hình mã nguồn mở của Trung Quốc, họ nên tải xuống mô hình đó và triển khai trên cơ sở hạ tầng của riêng họ hoặc trên một nhà cung cấp đám mây khác. Các nền tảng đám mây Trung Quốc sẽ không thu được nhiều lợi ích, kể cả khi họ là người đã tạo ra mô hình đó.

4. Kết luận: Zuck đúng hay sai?

Vậy, liệu Zuckerberg có đúng khi cho rằng tất cả các mô hình AI Trung Quốc đều bị kiểm duyệt và không trả lời về Thiên An Môn hay Tập Cận Bình? Không hoàn toàn. Nhưng ông cũng không sai về việc AI Trung Quốc nói chung không được ưa chuộng, khi vấn đề kiểm duyệt luôn là một cái bóng lơ lửng trên công nghệ này.

Tất nhiên, thử nghiệm này chưa phải là một đánh giá toàn diện về một vấn đề phức tạp. Tuy nhiên, kết quả này đã khẳng định một giả thuyết của tác giả về hướng đi của cuộc cạnh tranh công nghệ toàn cầu: đó là một "cuộc chiến đám mây".

0 comments Blogger 0 Facebook

Đăng nhận xét

 
Agent.ai.vn © 2024 - Nắm bắt tương lai
Top