
Tôi đã chạy 7 lời nhắc thực tế trên Gemini 3 và Claude Sonnet 4.6 — kết quả đã khiến tôi ngạc nhiên
Trong năm qua, cuộc đua AI đã trở thành một trận chiến không chỉ về hiệu năng mà còn về cá tính. Hai mô hình đang được nhắc đến nhiều nhất hiện nay là Gemini 3 và Claude Sonnet 4.6 — cả hai đều được thiết kế để đủ mạnh cho công việc thực tế, đồng thời đủ nhanh để phục vụ như các trợ lý AI hàng ngày.
Theo lý thuyết, chúng tiếp cận vấn đề rất khác nhau. Gemini 3 Flash do Google phát triển tập trung vào tốc độ, nhằm đáp ứng nhanh, hỗ trợ các ứng dụng thời gian thực và thực hiện các tác vụ khối lượng lớn như tóm tắt, lập kế hoạch và phân tích nhanh. Ngược lại, Claude Sonnet 4.6 của Anthropic chú trọng sâu vào khả năng lập luận, viết lách và tư duy có cấu trúc — những lĩnh vực mà Anthropic đã đầu tư mạnh mẽ.
Câu hỏi rõ ràng nảy sinh: mô hình nào thực sự tốt hơn cho công việc hàng ngày?
Để trả lời, tôi đã đưa ra cùng bảy lời nhắc, mỗi lời nhắc được thiết kế để đánh giá khả năng suy luận, lập kế hoạch, sáng tạo và tính hữu dụng trong thực tiễn. Những lời nhắc này phản ánh các nhiệm vụ mà người dùng thường dựa vào AI: từ ra quyết định, chỉnh sửa, giải quyết vấn đề đến xây dựng chiến lược.
Kết quả không hoàn toàn như tôi mong đợi. Ở một số lĩnh vực, tốc độ và cấu trúc của Gemini mang lại ưu thế. Ở những lĩnh vực khác, độ sâu suy luận và sự rõ ràng trong viết của Claude lại tỏa sáng ngay lập tức.
1. Lời nhắc chiến lược (tư duy toàn cục)
Image credit: Future
Prompt: “Hãy suy nghĩ như một chiến lược gia công nghệ. Câu hỏi: Liệu các trợ lý AI có thay thế smartphone trong 10 năm tới không? Hãy chia câu trả lời thành: Lập luận mạnh mẽ nhất ỦNG HỘ, lập luận mạnh mẽ nhất PHẢN ĐỐI, các rào cản công nghệ chính. Điều gì cần xảy ra để khả năng này trở nên khả dĩ và ước lượng xác suất.”
Gemini 3 đã đưa ra một khung mô tả chuyển đổi khá vững chắc — đặc biệt là khái niệm “tính toán dựa trên ý định” và sự khác biệt giữa giao diện và khả năng tính toán.
Claude Sonnet 4.6 cung cấp một phân tích chiến lược chi tiết, cân nhắc tới sự bền bỉ của hệ sinh thái, giới hạn phần cứng và yếu tố hành vi, đồng thời đưa ra một ước tính xác suất thực tế.
Người thắng: Claude, nhờ câu trả lời toàn diện bao gồm cả sự trì trệ của thị trường, các rào cản và các kịch bản thực tiễn, đúng như những gì một chiến lược gia công nghệ thực thụ sẽ cân nhắc.
2. Lời nhắc tư duy liên ngành
Image credit: Future
Prompt: “Giải thích cách ba lĩnh vực này giao thoa: AI, kinh tế và tâm lý học. Sau đó dự đoán một thay đổi lớn có thể xảy ra vào năm 2035 nhờ sự giao thoa này.”
Gemini 3 đã đưa ra một khái niệm thú vị về “nền kinh tế ủy thác đại lý”, trong đó các tác nhân AI cá nhân bảo vệ người dùng khỏi sự thao túng, nhưng dự đoán của nó mang tính suy đoán hơn và ít dựa trên động lực kinh tế hiện tại.
Claude Sonnet 4.6...
0 comments Blogger 0 Facebook
Đăng nhận xét