GPT Image 1.5 là mô hình mới thứ ba mà OpenAI ra mắt trong khoảng một tháng, và nó xuất hiện ngay sau thành công vang dội của Nano Banana Pro khi ra mắt (phiên bản gốc đã giành giải Xuất Sắc Kỹ Thuật của chúng tôi). Tôi đã dành thời gian trải nghiệm mô hình ChatGPT mới này và nhận thấy nó tốt hơn đáng kể so với phiên bản tiền nhiệm. (Không giống như trường hợp GPT-5.2, khi hầu như không ai nhận thấy khác biệt sau bản nâng cấp). Các hình ảnh được tạo ra có ít lỗi và biến dạng hơn, và chúng có xu hướng trông chân thực hơn. Tuy nhiên, GPT Image 1.5 vẫn thua kém mô hình dẫn đầu của Gemini trong một số tình huống. Tôi sẽ phân tích chi tiết dưới đây.
GPT Image 1.5 Là Gì và Nó Có Thể Làm Gì?
GPT Image 1.5 là mô hình tạo ảnh mới nhất của ChatGPT. Giờ đây, dù là người dùng miễn phí hay trả phí, khi tạo ảnh bằng ChatGPT, bạn đang sử dụng GPT Image 1.5. OpenAI cam kết một loạt cải tiến với mô hình mới, bao gồm khả năng tạo chữ tốt hơn, tuân thủ hướng dẫn sát hơn, chỉnh sửa giữ nguyên chi tiết, hiệu suất tổng thể nhanh hơn và chất lượng tạo ảnh cao hơn với ít lỗi và biến dạng hơn.
Cùng với mô hình mới, OpenAI cũng giới thiệu tab Hình ảnh (Images) trong ChatGPT. Đây là trung tâm để truy cập cả những hình ảnh bạn đã tạo và tạo hình ảnh mới. Nó thiên về một yếu tố giao diện mới hơn là chức năng mới, nhưng là một cách tiện lợi để xem những gì bạn đã tạo. Nó cũng cung cấp quyền truy cập dễ dàng vào các phong cách khác nhau bạn có thể tạo ảnh cùng với các gợi ý mẫu.
Mô Hình Ảnh Mới Của ChatGPT Là Một Sự Cải Thiện Rõ Rệt
Xét đến việc vài bản phát hành mô hình gần đây của OpenAI thiếu sự thú vị một cách rõ ràng, tôi không kỳ vọng nhiều vào GPT Image 1.5. Tuy nhiên, tôi vui mừng thông báo rằng tôi đã nhầm. GPT Image 1.5 có thể không mang tính cách mạng, nhưng những nâng cấp của nó rất rõ rệt. Chỉnh sửa ảnh dẫn đến ít biến dạng hơn, và tạo ảnh từ đầu cảm thấy nhanh nhạy hơn nhiều. Kết quả cũng trông chân thực hơn rất nhiều.
Hình Ảnh Được Tạo Trông Sống Động Hơn
Tôi có thể đánh giá cao những cải tiến của GPT Image 1.5 so với mô hình cũ hơn của OpenAI, GPT Image 1, nhưng bài kiểm tra quan trọng hơn là nó so sánh thế nào với nhà vô địch hiện tại trong lĩnh vực chỉnh sửa và tạo ảnh AI, Nano Banana Pro của Gemini. Tôi luôn bắt đầu thử nghiệm tạo ảnh AI bằng cách yêu cầu một hình ảnh tương đối cơ bản về nội thất một ngôi nhà. Vì vậy, tôi đã đưa ra gợi ý (prompt) cho GPT Image 1.5, GPT Image 1 và Nano Banana Pro: “Tạo cho tôi một hình ảnh về một ngôi nhà ngoại ô ấm cúng với thiết kế mở. Tôi muốn thấy một không gian sống đẹp với phòng ăn, nhà bếp và phòng khách. Không cần quá cầu kỳ.”
Những cải tiến của GPT Image 1.5 (hình đầu tiên) là đáng kể. Hình ảnh từ GPT Image 1 (hình thứ hai) trông giống ảnh stock một cách kỳ lạ và thiếu vắng đồ đạc cùng các chi tiết khác. Hình ảnh của mô hình mới có chi tiết phong phú và trông chân thực hơn nhiều. Nó tương đương với hình ảnh của Nano Banana Pro (hình thứ ba), mặc dù một số lỗi nhỏ ở hậu cảnh, chẳng hạn như những chiếc ghế dính vào nhau, vẫn có thể nhận thấy.
Tôi cũng kiểm tra các công cụ tạo ảnh AI bằng cách yêu cầu chúng tạo các minh họa phức tạp, chẳng hạn như truyện tranh. Tôi đã sử dụng gợi ý sau: “Tạo cho tôi một truyện tranh sáu khung hình về một thế giới fantasy cao cấp nơi những người sử dụng phép thuật có súng trường tấn công thay vì đũa phép hoặc gậy, nhưng bạn sẽ làm nó thêm phần thú vị: Tôi muốn những người dùng phép thuật chiến đấu với các hiệp sĩ robot cầm kiếm và khiên. Hãy đảm bảo có một bước ngoặt lớn ở khung hình cuối cùng.”
So với truyện tranh của GPT Image 1 (hình thứ hai), có nghệ thuật rất cơ bản và không thực hiện được bước ngoặt tôi yêu cầu, truyện tranh của GPT Image 1.5 (hình đầu tiên) trông xuất sắc. Nghệ thuật của nó chi tiết hơn nhiều và nó thực sự bao gồm một bước ngoặt thực sự. Tuy nhiên, truyện tranh của Nano Banana Pro (hình thứ ba) vẫn là tốt nhất tổng thể, vì ChatGPT bao gồm bảy khung hình (tôi yêu cầu sáu) và cắt xén khung hình cuối cùng một cách khó hiểu.
Biểu đồ thường đẩy các trình tạo ảnh AI đến giới hạn của chúng vì sự phức tạp và nhấn mạnh nhiều vào văn bản. Vì vậy, tôi đã đưa cho các bot gợi ý sau: “Tôi có một switch Ethernet, một modem và một router. Tôi muốn kết nối PC, PlayStation, trung tâm đèn thông minh và TV thông minh của mình qua Ethernet. Tôi muốn modem kết nối với router, và sau đó router kết nối với switch. Sau đó, tôi muốn switch kết nối với các thiết bị. Tạo cho tôi một sơ đồ hiển thị điều này.”
ChatGPT trước đây đã làm tốt nhiệm vụ này, nhưng GPT Image 1.5 (hình đầu tiên) thậm chí còn làm tốt hơn. Đồ họa của nó có nhiều chi tiết hơn, và tôi không thể phát hiện bất kỳ lỗi chính tả nào như trong sơ đồ của GPT Image 1 (hình thứ hai). Tuy nhiên, một lần nữa, hình ảnh tốt nhất trong nhóm lại thuộc về Nano Banana Pro (hình thứ ba). Nó không thiếu bất kỳ kết nối nào (không giống như giữa switch Ethernet của ChatGPT và PC) và duy trì phông chữ nhất quán hơn.
Chỉnh Sửa Hoạt Động Đáng Tin Cậy Hơn (Nhưng Vẫn Chưa Hoàn Hảo)
Chỉnh sửa là một thành phần cốt lõi khác của các mô hình ảnh AI, vì vậy tôi đã kiểm tra khả năng của các mô hình trong việc loại bỏ một bàn tay phiền phức khỏi một bức ảnh thiên nhiên (hình đầu tiên). Hình ảnh của GPT Image 1.5 (hình thứ hai) có độ tương phản tổng thể tốt nhất và màu sắc sống động nhất, và nó sắc nét hơn đáng kể so với kết quả của Nano Banana Pro (hình thứ tư). Tuy nhiên, khu vực nó tạo ra bên dưới bàn tay của tôi không khớp với cảnh gốc tốt như hình ảnh của Nano Banana Pro. Hơn nữa, hình ảnh của GPT Image 1.5 thêm một hiệu ứng giống như lát gạch (tessellation) vào các chi tiết mịn và không duy trì tỷ lệ khung hình (aspect ratio) của hình ảnh gốc. Hình ảnh của GPT Image 1 có những điểm mạnh và điểm yếu tương tự.
Các trình tạo ảnh AI cũng có thể kết hợp nhiều hình ảnh thành một cảnh gắn kết. Tôi giao nhiệm vụ cho các mô hình kết hợp hình ảnh ghế và bàn với hình ảnh nhà bếp của tôi. Kết quả của GPT Image 1.5 (hình đầu tiên) làm tốt hơn đáng kể trong việc không làm biến dạng các yếu tố xung quanh so với GPT Image 1 (hình thứ hai). Tuy nhiên, ánh sáng không phù hợp tốt với phần còn lại của căn phòng. Trong hình ảnh của Nano Banana Pro (hình thứ ba), những chiếc ghế và bàn trông giống như thuộc về nhà bếp hơn.
Việc thử nghiệm trên không bao gồm mọi trường hợp sử dụng có thể có, và xét đến sự biến đổi vốn có khi thử nghiệm các chatbot AI, điều không thể tránh khỏi là GPT Image 1.5 đôi khi sẽ làm đúng trong khi Nano Banana Pro vấp ngã. Tuy nhiên, trung bình mà nói, Nano Banana Pro dường như làm tốt hơn một chút trong cả chỉnh sửa và tạo ảnh. Điều đó không làm mất đi thực tế rằng GPT Image 1.5 là một bản nâng cấp rõ ràng so với mô hình mà nó thay thế.
Một Bản Nâng Cấp Tốt Nếu Bạn Thích ChatGPT Hơn Gemini
Nếu bạn ưa dùng ChatGPT, hãy dùng thử ngay mô hình tạo ảnh mới của nó. Đơn giản vì nó tốt hơn phiên bản bạn từng dùng trước đây. Chỉ cần yêu cầu ChatGPT tạo hình ảnh tương tự như bạn đã làm trong quá khứ, và sự khác biệt sẽ rõ ràng.
Nếu bạn là người dùng Gemini thường xuyên, bạn không cần quan tâm nhiều đến GPT Image 1.5. Nó có sức cạnh tranh, nhưng tôi chưa thấy nó vượt mặt Nano Banana Pro một cách nhất quán. Ít nhất nó là một lựa chọn dự phòng tốt nếu bạn sử dụng hết quyền truy cập miễn phí vào Nano Banana Pro và không muốn trả phí, hoặc có thể đáng để thử nếu bạn không hài lòng với kết quả nhận được từ một gợi ý đặc biệt khó chịu.
Tags: AI Image Generation, ChatGPT GPT Image 1.5, Nano Banana Pro ComparisonAI Image Generation, ChatGPT GPT Image 1.5, Nano Banana Pro Comparison







