Kiểm tra từ OmniCalculator cho thấy Claude và ChatGPT không phải là thông minh nhất

Kiểm tra từ OmniCalculator cho thấy Claude và ChatGPT không phải là thông minh nhất

Báo cáo cho thấy Grok 4.2 đạt hiệu suất tốt nhất về logic và giải quyết vấn đề

Claude vẫn dẫn đầu về chất lượng viết và tông giọng

ChatGPT vẫn là chatbot AI được ưa chuộng nhất, ngay cả khi người dùng đang rời sang Claude, nhưng liệu nó có phải là AI thông minh nhất? Một báo cáo mới từ OmniCalculator cho thấy ChatGPT có thể không phải là AI thông minh nhất hiện nay.

Khi xét đến khả năng toán học có thể định lượng của các chatbot AI, mô hình AI miễn phí thông minh nhất, khá bất ngờ, là Grok 4.2 (mô hình Grok 4.2 của xAI). Điều này không phản ánh phong cách viết hay các năng lực khác, nhưng cho thấy ưu thế về khả năng tính toán.

Credit: Getty Images

Credit: Omnicalculator

Phong cách nổi bật của Claude

Sự tăng trưởng gần đây của Claude được thúc đẩy bởi người dùng muốn rời bỏ ChatGPT do các thỏa thuận AI với quân đội gây tranh cãi, đồng thời cũng nhờ cách Claude soạn thảo câu trả lời và viết phản hồi.

Báo cáo OmniCalculator nhấn mạnh Claude 4.6 là mô hình xuất sắc nhất trong việc xử lý tài liệu dài mà không mất tính mạch lạc và duy trì giọng điệu đồng nhất. Đối với hầu hết người dùng, sự nhất quán này quan trọng hơn khả năng logic hay toán học thô.

Bí mật: Đột phá Parkinson

Claude cũng sẵn sàng thừa nhận sự không chắc, khiến câu trả lời mang giọng điệu cân nhắc, như thể suy nghĩ sâu sắc hơn.

Credit: Omnicalculator

Các mô hình cũ, bao gồm các phiên bản trước của ChatGPT và Claude, được phát hiện sửa đổi hoặc nghi ngờ lại câu trả lời của mình trong khoảng 60 % thời gian trong các tình huống giải quyết vấn đề phức tạp. Grok 4.2 giảm tỷ lệ không ổn định này xuống 33,1 %, khiến khả năng quay lại giữa chừng giảm đáng kể.

Các lĩnh vực chuyên môn

Sự khác biệt về năng lực không hề nhỏ. Viết tốt và lập luận mạnh mẽ có liên quan nhưng không đồng nhất. Một mô hình có thể tạo ra văn phong tinh tế nhưng vẫn mắc những lỗi logic tinh vi, hoặc đưa ra đáp án đúng nhưng ngôn ngữ vụng về.

Không mô hình nào hoàn hảo. Ngay cả các mô hình hàng đầu cũng mắc lỗi trong các bài toán tương đối đơn giản. “AI thông minh nhất” phụ thuộc vào ngữ cảnh: mô hình tốt nhất để soạn email có thể không phải là lựa chọn tốt nhất cho việc giải quyết vấn đề kỹ thuật, và trợ lý lập trình đáng tin cậy nhất không nhất thiết tạo ra văn bản tự nhiên nhất.

Khi cuộc cạnh tranh ngày càng gay gắt, các công ty có khả năng sẽ tập trung vào thế mạnh của mình, tinh chỉnh các khả năng cụ thể thay vì theo đuổi giải pháp đa năng. Câu trả lời cho “AI nào thông minh nhất?” có lẽ sẽ luôn là “phụ thuộc vào mục đích sử dụng”.

Bí mật: 16 Câu Lệnh Google Gemini AI Để Tạo Ra Những Bức Chân Dung Nghệ Thuật Đen Trắng Tuyệt Đẹp

AI comparison, language models, Grok