OpenAI ra mắt các mô hình GPT‑5.4 mini và nano

Những điểm nổi bật

GPT‑5.4 mini chạy nhanh gấp đôi so với GPT‑5 mini.
Các mô hình mới tập trung vào các tác vụ đại lý, lập trình và quy trình làm việc đa phương tiện.
Các nhà phát triển có thể kết hợp mô hình lập kế hoạch lớn với các “sub‑agent” có chi phí thấp hơn.

—
OpenAI đang liên tục nâng cấp các mô hình ngôn ngữ lớn chủ lực của mình, từ GPT‑5.3 lên GPT‑5.4. Mỗi thế hệ mới thường mang lại hiệu suất và độ chính xác cao hơn.

Vào ngày 5 tháng 3, OpenAI đã ra mắt GPT‑5.4 Thinking, một mô hình suy nghĩ hiệu năng cao, chuyên sâu.
Hai ngày trước đó, họ công bố GPT‑5.3 Instant, tập trung vào các cuộc hội thoại hàng ngày, hữu ích và lưu loát hơn.

Tuần này, OpenAI giới thiệu các mô hình GPT‑5.4 mini và GPT‑5.4 nano, được thiết kế cho các khối lượng công việc AI nhanh, hiệu quả và quy mô lớn — thực chất là các phiên bản “ngân sách” của mô hình ngôn ngữ.
—

Các mô hình nhỏ hơn cho quy trình AI

Đối với nhiều quy trình AI, mô hình tối ưu là mô hình cân bằng giữa hiệu năng mạnh mẽ, thời gian phản hồi nhanh và khả năng sử dụng công cụ đáng tin cậy.

“Các mô hình này được xây dựng cho các khối lượng công việc mà độ trễ trực tiếp ảnh hưởng tới trải nghiệm sản phẩm: trợ lý lập trình cần phản hồi nhanh, các sub‑agent thực hiện các nhiệm vụ hỗ trợ nhanh chóng, hệ thống sử dụng máy tính để chụp và giải thích ảnh chụp màn hình, và các ứng dụng đa phương tiện có thể suy luận trên hình ảnh trong thời gian thực.” – OpenAI

“Trong những bối cảnh này, mô hình tốt nhất thường không phải là mô hình lớn nhất — mà là mô hình có thể phản hồi nhanh, sử dụng công cụ một cách ổn định, và vẫn thực hiện tốt các nhiệm vụ chuyên môn phức tạp.” – OpenAI

So với GPT‑5 mini, GPT‑5.4 mini cải thiện đáng kể về lập trình, suy luận, hiểu đa phương tiện và sử dụng công cụ, đồng thời chạy nhanh gấp đôi. GPT‑5.4 nano là mô hình nhỏ nhất và nhanh nhất, hướng tới các tác vụ phân loại, trích xuất, xếp hạng và hỗ trợ lập trình đơn giản.
—

Bí mật: Apple Intelligence sẽ cho phép bạn chọn mô hình AI của bên thứ ba trong iOS 27

Cải tiến hiệu năng

| Thử nghiệm | GPT‑5.4 mini | GPT‑5 mini |
|———————–|————–|————|
| SWE‑bench Pro | 54.38 % | 45.69 % |
| Terminal‑Bench 2.0 | 60.00 % | 38.20 % |
| GPQA Diamond | 88.01 % | — |
| OSWorld‑Verified | 72.13 % | 42 % |
GPT‑5.4 mini đạt mức chuẩn của GPT‑5.4 trong khi vẫn duy trì tốc độ thực thi nhanh hơn.
GPT‑5.4 nano đạt 52.39 % trên SWE‑bench Pro và 46.30 % trên Terminal‑Bench 2.0 — thấp hơn mini nhưng vẫn tốt hơn đáng kể so với GPT‑5 mini.
—

Những điểm nổi bật từ thử nghiệm của khách hàng

Hebbia (công ty chuyên xây dựng công cụ phân tích tài liệu) cho biết GPT‑5.4 mini mang lại hiệu năng toàn diện mạnh mẽ với chi phí thấp hơn nhiều, đồng thời đạt tỉ lệ thành công cao hơn và khả năng trích xuất thông tin tốt hơn so với mô hình GPT‑5.4 lớn hơn.
Notion (nền tảng làm việc kỹ thuật số) nhận thấy GPT‑5.4 mini xử lý tốt các tác vụ tập trung, định nghĩa rõ ràng — chẳng hạn như định dạng trang phức tạp — với độ chính xác ấn tượng, thường vượt trội hơn GPT‑5.2 trong khi chỉ tiêu tốn một phần nhỏ tài nguyên tính toán. Mô hình này cũng cho phép gọi công cụ một cách ổn định cho các đại lý tùy chỉnh trong Notion.
—

Sub‑agent và các nhiệm vụ đa phương tiện

Các hệ thống đại lý có thể kết hợp các mô hình có kích thước khác nhau: mô hình lớn lên kế hoạch, mô hình nhỏ hơn thực thi các công việc phụ. Trong bối cảnh này, GPT‑5.4 mini có thể thực hiện công việc sub‑agent như tìm kiếm trong codebase, rà soát tệp tin và xử lý tài liệu.
OpenAI lưu ý rằng GPT‑5.4 mini mạnh mẽ trong các nhiệm vụ đa phương tiện, đặc biệt là những việc liên quan đến sử dụng máy tính. Nó có thể nhanh chóng giải thích các ảnh chụp màn hình của giao diện người dùng phức tạp để hoàn thành công việc một cách nhanh chóng.
—

Bí mật: Apple thực hiện local privilege escalation vượt qua M5 Memory Integrity Enforcement (MIE)

Khả dụng và giá cả

GPT‑5.4 mini có sẵn qua API, Codex và ChatGPT. Người dùng miễn phí và người dùng Go‑tier có thể truy cập nó thông qua tùy chọn “Thinking” trong menu Plus; các người dùng khác sẽ nhận nó như một dự phòng khi tốc độ của GPT‑5.4 Thinking bị giới hạn.
GPT‑5.4 nano chỉ có qua API.

Bảng giá

GPT‑5.4 mini: 0,75 USD cho mỗi triệu token đầu vào, 4,50 USD cho mỗi triệu token đầu ra (cửa sổ ngữ cảnh 400 nghìn token).
GPT‑5.4 nano: 0,20 USD cho mỗi triệu token đầu vào, 1,25 USD cho mỗi triệu token đầu ra.

Để so sánh, GPT‑5.4 đầy đủ được định giá 2,50 USD cho mỗi triệu token đầu vào và 15,00 USD cho mỗi triệu token đầu ra.
—

Còn bạn thì sao?

Bạn đã thử nghiệm các mô hình AI nhỏ hơn như GPT‑5.4 mini hoặc nano trong quy trình làm việc của mình chưa? Bạn thích dùng các mô hình lớn nhất để có khả năng tối đa, hay những mô hình nhanh hơn, rẻ hơn đáp ứng đủ nhu cầu thời gian thực cho lập trình, phân tích tài liệu, hay các quy trình đại lý? Hãy chia sẻ trải nghiệm của mình.
—
Tags: GPT-5.4 mini, AI model pricing, AI agents