Chỉ chưa đầy hai tuần sau khi ra mắt GPT‑5.4 — bản cập nhật được công bố chỉ hai ngày sau GPT‑5.3 — công ty đã tung ra hai mô hình mới vào thứ Ba: GPT‑5.4 Mini và GPT‑5.4 Nano.
Đây không phải là các phiên bản rút gọn của mô hình flagship; chúng là những “mô hình” được thiết kế riêng cho những công việc mà việc chờ nửa phút để nhận câu trả lời là không thể chấp nhận. OpenAI mô tả chúng là “các mô hình nhỏ nhất có khả năng cao nhất cho tới nay”, đồng thời cho biết GPT‑5.4 Mini nhanh hơn gấp hai lần so với GPT‑5 Mini. Nếu bạn từng chứng kiến một trợ lý lập trình suy nghĩ trong 45 giây trước khi chỉnh sửa ba dòng mã, bạn sẽ hiểu được sức hút của một mô hình nhanh.
—
Tại sao lại có mô hình “kém chính xác hơn”?
Độ chính xác không phải lúc nào cũng là yếu tố quyết định. Nếu bạn đang vận hành một chatbot dịch vụ khách hàng trả lời khoảng 200 câu hỏi mỗi ngày, bạn không cần một mô hình đạt điểm cao nhất trong các kỳ thi tiến sĩ. Bạn cần một mô hình có thể phản hồi trong chưa đầy một giây và chi phí chỉ vài đồng cho mỗi câu trả lời. Đó chính là khoảng trống mà các mô hình này được xây dựng để lấp đầy.
Tuy nhiên, điều này không có nghĩa là các mô hình này “ngu ngốc” hay không đáng tin cậy. Trên các tiêu chuẩn đo lường lập trình, GPT‑5.4 Mini đạt 54,4 % trên SWE‑Bench Pro — một bài kiểm tra đo khả năng sửa lỗi thực tế trên GitHub — so với 45,7 % của GPT‑5 Mini cũ và 57,7 % của GPT‑5.4 đầy đủ.
Trên OSWorld‑Verified, một bài kiểm tra khả năng điều khiển máy tính để bàn bằng cách đọc ảnh chụp màn hình, Mini đạt 72,1 %, chỉ hơi thấp hơn mô hình flagship (75,0 %) — và cả hai đều vượt qua mức chuẩn của con người (72,4 %). GPT‑5.4 Nano ghi 52,4 % trên SWE‑Bench Pro và 39,0 % trên OSWorld — thấp hơn Mini, nhưng vẫn là một bước tiến lớn so với các mô hình Nano trước đây.
“GPT‑5.4 đánh dấu một bước tiến cho cả mô hình Mini và Nano trong các đánh giá nội bộ của chúng tôi,” Phó CTO Perplexity Jerry Ma nói sau khi thử nghiệm cả hai. “Mini cung cấp khả năng suy luận mạnh mẽ, trong khi Nano đáp ứng nhanh và hiệu quả cho các quy trình hội thoại trực tiếp.”
—
Các khả năng làm việc mới
Thay vì định tuyến mọi tác vụ qua một mô hình flagship đắt tiền, bạn giờ có thể xây dựng hệ thống trong đó mô hình lớn lên kế hoạch và phối hợp trong khi các mô hình nhỏ hơn thực hiện công việc “vật lý” song song — ví dụ tìm kiếm trong codebase, đọc tài liệu, hoặc xử lý biểu mẫu. Như đã thấy trong so sánh GPT‑5.4 vs. Grok 4.20, vị trí của mô hình trong quy trình làm việc quan trọng không kém việc lựa chọn mô hình.
Giá (API)
- GPT‑5.4 Mini – $0.75 cho mỗi triệu token đầu vào và $4.50 cho mỗi triệu token đầu ra.
- GPT‑5.4 Nano – $0.20 cho mỗi triệu token đầu vào và $1.25 cho mỗi triệu token đầu ra (khoảng bốn lần rẻ hơn Mini ở phần đầu vào).
Khả dụng
- GPT‑5.4 Mini – Có sẵn ngay hôm nay cho người dùng Free và Go thông qua tùy chọn “Thinking” trong menu plus. Người đăng ký trả phí khi đạt giới hạn tốc độ GPT‑5.4 sẽ tự động chuyển sang Mini.
- GPT‑5.4 Nano – Hiện chỉ có qua API; OpenAI đang định vị nó như một công cụ dành cho các nhà phát triển chứ không phải sản phẩm tiêu dùng.
Tags: OpenAI, GPT-5.4, AI models







