Đó là thông tin được OpenAI cho biết trên blog ngày 21/4.
"Không chỉ hình dung bối cảnh ảnh phức tạp, nó còn hiện thực hóa tầm nhìn của người dùng hiệu quả nhưng vẫn tuân theo hướng dẫn, bảo toàn các chi tiết được yêu cầu".
Theo công ty, ChatGPT với Images 2.0 có thể hiển thị chi tiết nhỏ vốn "làm khó" mô hình AI tạo ảnh, như văn bản nhỏ, biểu tượng, yếu tố giao diện người dùng, bố cục dày đặc cũng như các ràng buộc về phong cách. Tất cả ảnh tạo ra đều ở độ phân giải đến 2K.
Lần đầu tiên, OpenAI cũng tích hợp khả năng suy luận vào mô hình tạo ảnh khi Images 2.0 có "khả năng tư duy", cho phép tìm kiếm trên web, tạo ra nhiều hình ảnh từ một yêu cầu duy nhất, tự động kiểm tra trước khi hiển thị. Nhờ đó, công cụ có thể tạo banner, menu cho quán ăn... với nhiều kích thước khác nhau, cũng như truyện tranh nhiều khung hình. Chế độ này mất nhiều thời gian xử lý hơn so với thông thường, nhưng cho độ chính xác cao hơn.
AI mới cũng có khả năng hiển thị văn bản không phải chữ La-tinh với các ngôn ngữ như tiếng Nhật, tiếng Hàn, tiếng Hindi và tiếng Bengali. Kiến thức của mô hình được cập nhật đến tháng 12/2025
ChatGPT Images 2.0 hỗ trợ dải tỷ lệ khung hình rộng từ 3:1 đến 1:3, có thể thiết lập trực tiếp qua câu lệnh.
Thử nghiệm thực tế với tiếng Việt cho thấy, so với bản cũ Image 1.5 cuối năm ngoái, ChatGPT với Images 2.0 cho khả năng tạo ảnh nhanh và chính xác. Chữ tiếng Việt hiển thị gần như không gặp các lỗi liên quan đến chính tả hay hiển thị sai, kể cả với văn bản dài.
Năm ngoái, Google cũng ra mắt công cụ Nano Banana Pro nâng cấp khả năng tạo chữ chính xác, hỗ trợ làm đồ họa, sơ đồ, điều mà các mô hình AI khác chưa làm được khi đó. Công cụ có thể được ứng dụng cho những đồ họa như infographic, biển quảng cáo, sơ đồ minh họa, bản ghi chú, công thức nấu ăn...

