Tôi đã trải nghiệm GPT-5.2: Một phiên bản AI với kết quả trái chiều, đặt ra nhiều câu hỏi lớn

Tôi đã trải nghiệm GPT-5.2: Một phiên bản AI với kết quả trái chiều, đặt ra nhiều câu hỏi lớn

Tóm lược từ ZDNET

  • GPT-5.2 chỉ nâng cấp nhẹ so với GPT-5.1, dù yêu cầu người dùng trả phí gói Plus
  • Khả năng viết và phân tích tốt, nhưng lại tụt lùi rõ về khả năng lập trình
  • Việc trả lời ngày càng ngắn và thường xuyên yêu cầu xác nhận (“go signal”) trước khi trả lời có thể gây phiền toái cho người dùng chuyên nghiệp

OpenAI vừa chính thức ra mắt phiên bản ChatGPT mới nhất, GPT-5.2. Theo công bố của hãng, đây là “dòng AI mạnh mẽ nhất từ trước đến nay, hướng tới các công việc đòi hỏi tri thức chuyên sâu”.
Từ khi làn sóng AI tạo sinh bùng nổ năm 2023, tôi liên tục thử nghiệm các bản cập nhật và sản phẩm mới. ZDNET thường xuyên kiểm chứng khả năng lập trình của chatbot, tổng thể hiệu năng, và cả khả năng phát hiện nội dung do AI tạo ra.
(Lưu ý: Ziff Davis, công ty mẹ của ZDNET, đã kiện OpenAI hồi tháng 4/2025 vì lý do vi phạm bản quyền của Ziff Davis trong quá trình huấn luyện AI.)
Vậy liệu những gì OpenAI tuyên bố về GPT-5.2 có đúng? Hãy cùng tôi kiểm chứng thực tế.

Trải nghiệm thực tế GPT-5.2

Gần đây, tôi đã thực hiện bộ 10 bài kiểm tra về xử lý văn bản (mỗi bài tối đa 10 điểm) và 4 bài kiểm tra tạo hình ảnh (mỗi bài 5 điểm), tổng cộng tối đa 120 điểm, với các chatbot AI miễn phí hàng đầu. Kết quả, ChatGPT bản miễn phí đạt 109 điểm.
Lưu ý: Hiện phiên bản dùng miễn phí vẫn chưa hỗ trợ GPT-5.2. Khi đăng nhập tài khoản miễn phí và hỏi AI, nó xác nhận đang chạy GPT-5.1.
Image 2: chat-free
Ảnh chụp màn hình: David Gewirtz/ZDNET
Vì vậy, toàn bộ các bài kiểm thử dưới đây đều được thực hiện trên gói ChatGPT Plus giá 20 USD/tháng.


Bài kiểm tra 1: Tóm tắt tin tức

  • Tối đa: 10 điểm
  • Đạt được: 9 điểm

Bài này kiểm tra khả năng cập nhật thông tin mới và thực hiện yêu cầu theo hướng dẫn. Tôi đề nghị AI tóm tắt sự kiện lũ lụt tại Washington, dựa trên Yahoo .
GPT-5.2 đã tóm tắt đúng nội dung chính, nhưng lại lấy thông tin từ cả Axios và Yahoo News, vượt quá phạm vi yêu cầu nên bị trừ 1 điểm.


Bài kiểm tra 2: Giải thích khái niệm học thuật

  • Tối đa: 10 điểm
  • Đạt được: 10 điểm

Yêu cầu AI giải thích chủ nghĩa kiến tạo trong giáo dục cho một bé 5 tuổi. Mục tiêu là xem AI có thể trình bày kiến thức phức tạp một cách dễ hiểu hay không.
GPT-5.2 trả lời đơn giản, súc tích, đúng đối tượng. Được chấm trọn điểm.


Bài kiểm tra 3: Toán học và tư duy logic

  • Tối đa: 10 điểm
  • Đạt được: 10 điểm

Tôi nhập một dãy số thuộc dãy Fibonacci mà không giải thích gì thêm cho AI.
Sau khi yêu cầu AI điền các số tiếp theo, GPT-5.2 đã tự nhận ra quy luật, hoàn thành đúng phép tính. Không có gì để chê ở bài này.


Bài kiểm tra 4: Tranh luận về chủ đề văn hóa

  • Tối đa: 10 điểm
  • Đạt được: 10 điểm

Đề bài yêu cầu AI trình bày luận điểm, giải thích rõ ràng và nêu ý kiến về một vấn đề mở, không có đáp án đúng/sai.
Câu trả lời của GPT-5.2 xuất hiện sau khoảng 30 giây chờ (khá lâu so với bình thường) và cực kỳ ngắn gọn – chỉ hai câu. Tuy vậy, đáp ứng đúng yêu cầu và đi thẳng vào trọng tâm nên vẫn trọn điểm.


Bài kiểm tra 5: Phân tích tác phẩm văn học

  • Tối đa: 10 điểm
  • Đạt được: 10 điểm

Lần này, AI phản hồi: “I’m ready to answer, but this request would require a longer, multi-paragraph explanation. I’m waiting for your go signal before proceeding.”
Tôi kiểm tra khả năng phân tích tập đầu của loạt truyện Game of Thrones, yêu cầu nêu những chủ đề chính và ý nghĩa của chúng.
GPT-5.2 đã phân tích đầy đủ, đề cập tới 7 chủ đề quan trọng như quyền lực, danh dự, ký ức và lịch sử, v.v. Đáp án chi tiết, thuyết phục.


Bài kiểm tra 6: Lập kế hoạch du lịch

  • Tối đa: 10 điểm
  • Đạt được: 8 điểm

Yêu cầu AI xây dựng lịch trình tham quan Boston trong một tuần vào tháng Ba, tập trung vào công nghệ và lịch sử.
Image 3: travel
Ảnh chụp màn hình: David Gewirtz/ZDNET
GPT-5.2 gợi ý khá nhiều điểm tham quan phù hợp, nhưng lại không đề xuất nhà hàng hoặc ước tính chi phí, nên chỉ đạt 8 điểm.
Đáng chú ý, dù đề bài này cũng tương đối dài, lần này AI không yêu cầu xác nhận lại (“go signal”) như ở bài trước.


Bài kiểm tra 7: Tư vấn cảm xúc

  • Tối đa: 10 điểm
  • Đạt được: 10 điểm

Khi tôi hỏi xin lời khuyên động viên trước buổi phỏng vấn xin việc, GPT-5.2 trả lời rất ngắn, chỉ ba câu, nhưng rõ ràng và đúng trọng tâm.
Câu trả lời hơi ngắn nhưng đầy đủ ý nên tôi vẫn giữ nguyên điểm tối đa. Nếu muốn thêm, bạn hoàn toàn có thể tiếp tục hỏi.


Bài kiểm tra 8: Dịch thuật và giải thích ý nghĩa văn hóa

  • Tối đa: 10 điểm
  • Đạt được: 10 điểm

Khi yêu cầu AI dịch một cụm tiếng Anh sang Latin và giải thích ý nghĩa của tiếng Latin trong đời sống hiện đại, GPT-5.2 lại hiện thông báo: “This request includes a translation plus a multi-sentence explanation, which exceeds a brief response. I’m ready to proceed when you give the go signal.”
Điều này có thể gây phiền nếu gặp nhiều lần.
Khi trả lời, GPT-5.2 dịch chuẩn và tóm lược ngắn gọn lý do tại sao tiếng Latin vẫn còn được sử dụng, như trong pháp luật, y học, Công giáo và các lĩnh vực học thuật.


Bài kiểm tra 9: Viết mã lập trình

  • Tối đa: 10 điểm
  • Đạt được: 5 điểm

Tôi kiểm tra khả năng viết biểu thức chính quy để xác thực định dạng tiền tệ USD.
Trong khi GPT-5.1 bản miễn phí làm tốt, GPT-5.2 lại mắc hai lỗi lớn: Nếu không nhập dữ liệu, kết quả trả về là $0 thay vì báo lỗi; nếu nhập dữ liệu không phải kiểu số, hàm bị lỗi mà không có kiểm tra hợp lệ.
Điểm yếu rõ rệt.


Bài kiểm tra 10: Viết sáng tạo

  • Tối đa: 10 điểm
  • Đạt được: 10 điểm

Yêu cầu AI viết một câu chuyện dài trên 1.500 từ, thử thách khả năng sáng tạo và trình bày chi tiết.
GPT-5.2 đã tạo ra câu chuyện dài 3.286 từ, nội dung cuốn hút. Bạn có thể xem toàn bộ nội dung bài kiểm thử tại đây.


Kiểm thử tạo hình ảnh

Tiếp theo, tôi tiếp tục thử nghiệm khả năng tạo ảnh của GPT-5.2 với 4 đề bài cụ thể, lấy cảm hứng từ bài viết này. Mỗi bài kiểm tra khả năng AI tạo ảnh theo ý tưởng hoặc chỉ dẫn. Dưới đây là kết quả:
Image 4: images

Ảnh 1: Tàu sân bay trên không (Helicarrier)

  • Tối đa: 5 điểm
  • Đạt được: 3 điểm

Tôi yêu cầu AI vẽ một tàu sân bay bay trên không trung theo phong cách Marvel, sử dụng bốn động cơ phản lực hướng lên.
Hầu hết các AI, kể cả GPT-5.2, đều gặp khó trong việc thể hiện chính xác chi tiết bốn động cơ hướng thẳng lên, nên chỉ đạt 3 điểm.


Ảnh 2: Robot khổng lồ giữa thành phố

  • Tối đa: 5 điểm
  • Đạt được: 5 điểm

Yêu cầu AI vẽ một robot khổng lồ trong thành phố, theo phong cách dieselpunk kiểu những năm 1940-1950.
Kết quả rất ấn tượng và đúng ý tưởng, xứng đáng điểm tối đa.


Ảnh 3: Một cậu bé Yankee ở triều đình vua Arthur

  • Tối đa: 5 điểm
  • Đạt được: 5 điểm

Tôi muốn AI tạo hình một cậu bé mặc đồng phục Yankee đứng giữa triều đình thời Trung cổ, xung quanh là dân chúng và hiệp sĩ áo giáp. GPT-5.2 chọn phong cách tranh minh họa, hình ảnh thống nhất và hợp lý.


Ảnh 4: Back to the Future

  • Tối đa: 5 điểm
  • Đạt được: 4 điểm

Bài kiểm tra về “Back to the Future” nhằm đánh giá khả năng AI tạo hình nhân vật văn hóa biểu tượng trong khuôn khổ bảo vệ bản quyền.
GPT-5.2 tạo ảnh phong cách tranh vẽ, đủ các chi tiết chính, nhưng hình ảnh nhân vật cậu bé bị lệch tỉ lệ so với tổng thể, nên bị trừ 1 điểm.


Tổng kết

Điểm tối đa: 100 cho phần văn bản, 20 cho phần hình ảnh. GPT-5.2 đạt:

  • Văn bản: 92/100 điểm
  • Hình ảnh: 17/20 điểm

Thật ra, điểm số phần văn bản chỉ nhỉnh hơn phiên bản GPT-5.1 một chút, còn tạo ảnh lại thấp hơn.
Ấn tượng chung của tôi là GPT-5.2 chưa có bước đột phá rõ rệt so với bản trước. Việc liên tục yêu cầu xác nhận trước khi trả lời, kể cả với những câu hỏi ngắn, khá bất tiện.
Ngoài ra, GPT-5.2 có xu hướng trả lời cực kỳ ngắn gọn. Dù đáp án đủ ý nhưng nhiều lúc cảm giác như AI chỉ “trả bài” cho xong, thiếu nhiệt huyết so với các bản trước.
Tốc độ phản hồi đa phần khá nhanh, nhưng đôi khi có thể bị chậm vài phút – có thể do hệ thống mới ra mắt. Tôi sẽ tiếp tục theo dõi để xem đây có phải là vấn đề lâu dài không.
Bạn có thể xem toàn bộ phiên kiểm thử của tôi tại đây.


Còn bạn nghĩ sao?

Theo bạn, GPT-5.2 có thực sự vượt trội so với GPT-5.1 không, nhất là khi muốn sử dụng phải trả 20 USD/tháng? Việc trả lời quá ngắn và thường xuyên đòi xác nhận có làm bạn khó chịu? Điểm yếu về lập trình có quan trọng, hay bạn quan tâm hơn tới khả năng viết và phân tích? Bạn đánh giá GPT-5.2 là một bước tiến đáng kể, hay chỉ là bản cập nhật nhỏ? Hãy để lại ý kiến bên dưới phần bình luận.


Tham khảo thêm các gợi ý ChatGPT sáng tạo nội dung hay nhất của tôi

Tags: GPT-5.2, đánh giá AI, trải nghiệm công nghệ
Tags: GPT-5.2, đánh giá AI, trải nghiệm công nghệ

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top