OpenAI ra mắt GPT‑5.5, Anthropic tung ra Claude Opus 4.7

OpenAI đã chính thức giới thiệu mô hình mới nhất mang tên GPT‑5.5 vào ngày 23‑4, chỉ một tuần sau khi Anthropic công bố Claude Opus 4.7. Với sự xuất hiện của hai mô hình đỉnh cao từ hai phòng thí nghiệm AI hàng đầu thế giới, chúng tôi đã tiến hành so sánh trực tiếp để xem bên nào vượt trội hơn.
Cảnh báo: Spoiler – Chúng tôi nhận định Claude Opus 4.7 có lợi thế rõ rệt trong lập trình chuyên sâu và các tác vụ tự động hóa thông minh (agentic), trong khi GPT‑5.5 lại ghi điểm cao hơn ở hầu hết các bài kiểm tra đánh giá (benchmark).
—

GPT‑5.5 và Opus 4.7: Bảng xếp hạng

Trên bảng xếp hạng Arc Prize, GPT‑5.5 đã vượt qua Opus 4.7.
Trên bảng Arena (dựa trên bình chọn của người dùng), phiên bản Claude Opus 4.7 Thinking đang giữ vị trí số một về tổng thể.
Tại chỉ số năng lực Epoch Capabilities Index (ECI), GPT‑5.4 Pro hiện dẫn đầu, theo sau lần lượt là Gemini 3.1 Pro ở vị trí thứ hai và GPT‑5.4 ở vị trí thứ ba.

—

GPT‑5.5 và Opus 4.7: Kết quả các bài kiểm tra (Benchmark)

Bài kiểm tra	GPT‑5.5	Claude Opus 4.7
SWE‑Bench Pro	58,6 %	64,3 %
Terminal‑Bench 2.0	82,7 %	69,4 %
Humanity’s Last Exam	40,6 %	31,2 %
Humanity’s Last Exam (có hỗ trợ công cụ)	52,2 %	54,7 %
BrowseComp	84,4 %	79,3 %
GPQA Diamond	93,6 %	94,2 %
ARC‑AGI‑1 (Đã xác minh)	94,5 % (Cao)	92 % (Cao)
ARC‑AGI‑2 (Đã xác minh)	83,3 % (Cao)	68,3 % (Cao)

Bí mật: OpenAI nghỉ hưu GPT‑4o, mô hình “kẻ xu nịnh”

Đối với bài kiểm tra Humanity’s Last Exam, chúng tôi sử dụng kết quả đã được xác thực từ Artificial Analysis (xem tại đây). Đáng chú ý, Anthropic tự báo cáo rằng Opus 4.7 đạt 46,9 % trong bài kiểm tra này.
—

Tính sẵn có và Giá cả

GPT‑5.5 – Đã khả dụng cho người dùng các gói OpenAI Plus, Pro, Business và Enterprise trên ChatGPT và Codex. Giá API khởi điểm ở mức 5 USD cho mỗi 1 triệu token đầu vào và 30 USD cho mỗi 1 triệu token đầu ra (với cửa sổ ngữ cảnh lên đến 1 triệu token).
Claude Opus 4.7 – Dành cho khách hàng gói Pro và Max; giá API là 5 USD cho mỗi 1 triệu token đầu vào và 25 USD cho mỗi 1 triệu token đầu ra.

—

Bộ tính năng nổi bật

GPT‑5.5 – Cải thiện đáng kể khả năng lập trình tự động (agentic), thao tác trên máy tính, xử lý các công việc tri thức và hỗ trợ nghiên cứu khoa học cơ bản. Ngoài ra, mô hình này còn tích hợp ChatGPT Images 2.0 mới để tạo hình ảnh.
Claude Opus 4.7 – Tối ưu hóa cho lập trình chuyên sâu, phân tích hình ảnh thị giác và xử lý tài liệu. Công cụ Claude Design của Anthropic cho phép tạo trực quan hóa dữ liệu, đồ họa và slide thuyết trình (tuy nhiên chưa hỗ trợ tạo hình ảnh đầy đủ như các công cụ chuyên biệt).

Bí mật: iPad 12 wait continues: Apple xác nhận một cách tinh tế rằng sẽ không có mẫu mới trong nhiều tháng

ChatGPT sở hữu kho tích hợp ứng dụng và mua sắm phong phú hơn; trong khi đó, việc Anthropic mới đây mua lại OpenClaw đã mang lại cho họ lợi thế vượt trội về các khả năng tự động hóa thông minh (agentic).
Tóm tắt nhanh (TL;DR): Đối với các tác vụ chuyên nghiệp hàng ngày, GPT‑5.5 cung cấp bộ tính năng toàn diện và rộng rãi hơn. Tuy nhiên, nếu bạn cần giải quyết các bài toán lập trình phức tạp và đòi hỏi khả năng tự động hóa thông minh (agentic), Claude Opus 4.7 là lựa chọn mạnh mẽ hơn.
—
Thông tin tiết lộ: Ziff Davis, công ty chủ quản của Mashable, đã khởi kiện OpenAI vào tháng 4 năm 2025, cáo buộc hành vi vi phạm bản quyền trong quá trình đào tạo và vận hành các hệ thống AI của họ.