Việc phát hiện hình ảnh do AI tạo ra đang ngày càng trở nên khó khăn. Dĩ nhiên, những dấu hiệu thường thấy (https://lifehacker.com/tech/all-the-ways-to-tell-a-picture-was-made-with-ai) vẫn còn đó, nhưng chúng đang dần mất đi hiệu quả mỗi khi một mô hình tạo ảnh mới ra đời. Trước đây, bạn có thể dễ dàng “phát hiện” ảnh AI nhờ những lỗi cơ bản như bàn tay thừa hoặc thiếu ngón; nhưng giờ đây, điều đó không còn đảm bảo nữa.
Một nhược điểm cố hữu của các mô hình tạo ảnh AI trước đây là khả năng xử lý chữ viết. Tổng thể bức ảnh có thể trông rất thuyết phục, nhưng nếu quan sát kỹ phần văn bản, bạn thường sẽ thấy chúng không thực sự “chính xác”. Đôi khi một vài ký tự đúng, đôi khi chỉ gần đúng, nhưng phổ biến nhất là các bất thường: chữ bị lặp lại vô nghĩa, ký tự lạ không phải chữ cái, hoặc các nét chữ bị hòa lẫn, xoắn vào nhau một cách kỳ quặc. Những chi tiết kỳ lạ này khiến tôi liên tưởng đến cách ngôn ngữ trong “Star Wars” (https://en.wikipedia.org/wiki/Languages_in_Star_Wars) xuất hiện khi AI cố gắng bắt chước tiếng Anh Mỹ.
OpenAI’s Images 2.0 Có Khả Năng Tạo Ra Hình Ảnh AI Cực Kỳ Chân Thực
Tuy nhiên, các mô hình AI mới nhất đang trở nên rất xuất sắc trong việc tạo ra văn bản. Thực tế, mô hình mới nhất của OpenAI dành cho ChatGPT, Images 2.0, có khả năng tạo ra văn bản chân thực đến kinh ngạc (https://techcrunch.com/2026/04/21/chatgpts-new-images-2-0-model-is-surprisingly-good-at-generating-text/), với số lượng lớn đến mức tôi nghi ngờ liệu nhiều người trong chúng ta (hoặc thậm chí bất kỳ ai) còn có thể nhận ra chúng là giả hay không. Theo OpenAI, Images 2.0 là mô hình hình ảnh đầu tiên của công ty có khả năng “tư duy”: mô hình này dành thời gian để phân tích từng bước của yêu cầu, từ đó tạo ra những hình ảnh chi tiết và chính xác hơn, cũng như khả năng sinh ra tới tám hình ảnh chỉ với một câu lệnh (prompt) (tính năng này hiện chỉ dành cho người dùng trả phí). Người dùng miễn phí vẫn có thể tận dụng một số lợi ích của Images 2.0, chẳng hạn như chức năng kiểm chứng thông tin thông qua tìm kiếm web. Công ty cho biết “kết quả mang lại cảm giác ít giống AI hơn và trông như được thiết kế có chủ đích hơn”, điều này đồng nghĩa với việc các hình ảnh do ChatGPT tạo ra sẽ trở nên khó nhận diện hơn rất nhiều trong tương lai.
Công ty tự hào về sự đa dạng của các loại hình ảnh mà mô hình có thể tạo ra – không chỉ những bức ảnh siêu thực, mà còn cả ảnh chụp màn hình giao diện máy tính, ảnh ghép tạp chí, đống gạo (một chi tiết khối lượng lớn rất khó để tái tạo), trang tạp chí, và thậm chí cả các bài tiểu luận viết tay. Họ thậm chí còn tuyên bố có thể mô phỏng chữ viết tay tinh vi đến mức bao gồm cả những vết cà phê loang trên giấy. Bạn có thể lướt qua các ví dụ trên bài thông báo chính thức của OpenAI để chiêm ngưỡng độ chân thực đáng kinh ngạc (https://openai.com/index/introducing-chatgpt-images-2-0/). Bài đăng cũng đưa ra các ví dụ khác như: ảnh chụp thực tế siêu chi tiết, trang truyện tranh, poster phim, và hình ảnh với các tỷ lệ khung hình khác nhau—từ tỷ lệ tiêu chuẩn đến chế độ toàn cảnh (panorama) trên iPhone.
Tất cả những tiến bộ này vừa ấn tượng vừa đáng lo ngại, nhưng đối với tôi, cải tiến về khả năng tạo văn bản mới thực sự đưa mọi thứ lên một tầm cao mới. Nhiều mô hình hiện nay đã khá thành thục trong việc tạo ra hình ảnh đánh lừa người xem, nhưng mức độ chi tiết của chữ và văn bản trong các ví dụ này là điều tôi chưa từng thấy trước đây. Tôi đã yêu cầu ChatGPT tạo một thực đơn cho nhà hàng Ý, liệt kê năm món chính và hai món tráng miệng—và để AI tự quyết định chi tiết các món. ChatGPT đã tạo ra một thực đơn trông rất thật, không có lỗi sai rõ ràng nào. Sau đó, tôi yêu cầu nó viết một bài báo tin tức thông báo rằng đội Red Sox và Yankees sẽ đổi thành phố; kết quả cũng không có sai sót đáng chú ý nào.
Tôi không nói rằng những hình ảnh này hoàn hảo: chúng vẫn mang một “vẻ ngoài đặc trưng của AI” mà những con mắt tinh tường hoặc người quan sát kỹ lưỡng vẫn có thể nhận ra. OpenAI thừa nhận Images 2.0 gặp khó khăn với một số nhiệm vụ phức tạp, chẳng hạn như giải đố, hoặc xử lý các chi tiết nằm trong khu vực bị che khuất, ở vị trí kỳ lạ như trên các bề mặt bị lật ngược. Tuy nhiên, điều đó không thực sự quan trọng khi những hình ảnh mà mô hình này tạo ra đã đủ ấn tượng để đánh lừa phần lớn người xem. Đồ họa thông tin, ảnh chụp, bản đồ, truyện tranh, poster phim—bất cứ thứ gì bạn có thể tưởng tượng: mọi người sẽ bắt đầu sử dụng công cụ này, và bạn sẽ thấy ngày càng nhiều hình ảnh AI xuất hiện trong cuộc sống mà không hề hay biết.
Tags: AI-generated images, ChatGPT Updates, Image detection






