Bạn từng sử dụng Nano-Banana và tạo hình nhân vật cho bạn bè, thêm hiệu ứng vui nhộn cho đối thủ? Giờ đây, phiên bản nâng cấp với tên gọi chính thức là Gemini 3 Pro Image, nhưng cộng đồng vẫn quen gọi thân mật là Nano Banana Pro!
Nếu Nano-Banana Flash gây ấn tượng nhờ tốc độ và chi phí thấp, thì bản Pro lại mở ra hàng loạt khả năng vượt trội như: xử lý logic, truy xuất dữ liệu thời gian thực, và xuất ảnh 4K sắc nét. Đây là lúc bạn thỏa sức sáng tạo với các tác vụ phức tạp hơn bao giờ hết!
Bài hướng dẫn này sẽ cùng bạn khám phá toàn bộ tính năng cao cấp của Nano Banana Pro thông qua Gemini Developer API. Nếu muốn tìm hiểu kỹ về cách ra lệnh hiệu quả, hãy xem hướng dẫn prompting.
Nội dung bao gồm:
- Sử dụng Nano Banana Pro trên Google AI Studio
- Thiết lập dự án
- Khởi tạo Client
- Sinh ảnh cơ bản
- Quy trình “tư duy”
- Tích hợp tìm kiếm thời gian thực
- Sinh ảnh 4K sắc nét
- Đa ngôn ngữ
- Trộn ảnh nâng cao
- Các demo chỉ có ở bản Pro
Lưu ý: Nếu muốn trải nghiệm tương tác, hãy thử python cookbook hoặc Javascript Notebook trên AI Studio.
—
1) Sử dụng Nano Banana Pro trên Google AI Studio
Bạn có thể trải nghiệm Nano Banana Pro trực tiếp trên Gemini app, nhưng môi trường tốt nhất để lập trình viên phát triển và thử nghiệm là Google AI Studio. Tại đây, bạn có thể khám phá mọi mô hình AI trước khi đưa vào ứng dụng thực tế với Gemini API.
Chỉ cần truy cập aistudio.google.com, đăng nhập bằng tài khoản Google, chọn Nano Banana Pro (Gemini 3 Pro Image) trong danh sách model.
Khác với Nano-Banana, phiên bản Pro không hỗ trợ miễn phí. Do đó, bạn cần một API key đã kích hoạt thanh toán (chi tiết ở phần thiết lập dự án bên dưới).

Mẹo: Bạn có thể lập trình web app Nano Banana ngay trên AI Studio hoặc chỉnh sửa, trải nghiệm các ứng dụng mẫu có sẵn.
—
2) Thiết lập dự án
Để bắt đầu, bạn cần chuẩn bị:
- API key từ Google AI Studio
- Đã kích hoạt thanh toán cho dự án Google Cloud
- Cài đặt Google Gen AI SDK cho Python hoặc JavaScript/TypeScript
Nếu đã có đủ các điều kiện trên, chuyển sang bước tiếp theo. Nếu chưa, thực hiện tuần tự như sau:
Bước A: Lấy API Key
Khi đăng nhập lần đầu vào AI Studio, hệ thống sẽ tự động tạo một Google Cloud project kèm API key.
Truy cập trang quản lý API key, nhấn biểu tượng “copy” để lấy API key.

Bước B: Kích hoạt thanh toán
Nano Banana Pro không hỗ trợ miễn phí, bạn cần bật chế độ thanh toán cho dự án Google Cloud.
Truy cập trang quản lý dự án, nhấn Set up billing bên cạnh tên dự án và làm theo hướng dẫn.

Nano Banana Pro có chi phí thế nào?
Hiện tại, ảnh 1K/2K có giá khoảng $0,134 mỗi ảnh, ảnh 4K là $0,24 (chưa bao gồm chi phí token đầu vào/ra).
Mẹo tiết kiệm: Sử dụng Batch API sẽ giảm chi phí 50%, nhưng thời gian nhận ảnh có thể lên tới 24h.
Bước C: Cài đặt SDK
Chọn SDK phù hợp với ngôn ngữ bạn đang dùng.
Python:
Yêu cầu Python 3, SDK từ bản 1.52 trở lên
pip install -U "google-genai>=1.52.0"
pip install Pillow
JavaScript / TypeScript:
Yêu cầu SDK từ bản 1.30 trở lên
npm install @google/genai
Lưu ý: Các ví dụ dưới đây sử dụng Python SDK.
—
3) Khởi tạo Client
Để sử dụng Nano Banana Pro, bạn cần chọn model id: gemini-3-pro-image-preview.
from google import genai
from google.genai import types
client = genai.Client(api_key="YOUR_API_KEY")
PRO_MODEL_ID = "gemini-3-pro-image-preview"
—
4) Sinh ảnh cơ bản
Bạn có thể sinh ảnh tiêu chuẩn và tùy chỉnh kết quả qua tham số response_modalities (chọn trả về cả text và ảnh, hoặc chỉ ảnh) và aspect_ratio.
prompt = "Create a photorealistic image of a siamese cat with a green left eye and a blue right one"
aspect_ratio = "16:9" # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9" hoặc "21:9"
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'], # hoặc chỉ ['Image']
image_config=types.ImageConfig(
aspect_ratio=aspect_ratio,
)
)
)
# Lưu ảnh
for part in response.parts:
if image:= part.as_image():
image.save("cat.png")

Bạn cũng có thể sử dụng chế độ chat, rất tiện cho việc chỉnh sửa nhiều vòng (tham khảo ví dụ 8 “Polyglot Banana”).
—
5) Quy trình “tư duy” (Thinking Process)
Nano Banana Pro không đơn thuần chỉ tạo ảnh, mà còn có khả năng suy luận và giải thích logic trước khi sinh ảnh. Đặc biệt, bạn có thể xem trực tiếp “quá trình tư duy” của mô hình!
Kích hoạt bằng cách đặt include_thoughts=True trong thinking_config.
prompt = "Create an unusual but realistic image that might go viral"
aspect_ratio = "16:9"
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'],
image_config=types.ImageConfig(
aspect_ratio=aspect_ratio,
),
thinking_config=types.ThinkingConfig(
include_thoughts=True
)
)
)
# Lưu ảnh và "ý tưởng"
for part in response.parts:
if part.thought:
print(f"Thought: {part.text}")
elif image:= part.as_image():
image.save("viral.png")
Bạn sẽ nhận được kết quả dạng:
Imagining Llama Commuters
Tôi tập trung vào những chú lạc đà. Mục tiêu là tái hiện chúng như những người đi làm hàng ngày trên xe buýt đông đúc ở La Paz, Bolivia. Kế hoạch là một chiếc xe bus cổ điển chật kín hành khách vui vẻ. Ảnh sẽ nhấn mạnh chi tiết như một chú lạc đà đang nhìn ra cửa sổ, chú khác thì tương tác với hành khách, mọi người đều đang chụp ảnh.
[IMAGE]
Visualizing the Concept
Tôi đang hoàn toàn tập trung vào kịch bản được yêu cầu. Trọng tâm là yếu tố "lạ nhưng thực tế". Khung cảnh đang dần hiện ra với các yếu tố chủ chốt.

Nhờ vậy, bạn hiểu rõ mô hình đã phân tích yêu cầu ra sao – giống như trò chuyện trực tiếp với họa sĩ!
—
6) Tích hợp tìm kiếm thực tế (Search Grounding)
Điểm nổi bật của Nano Banana Pro là khả năng truy xuất dữ liệu thời gian thực từ Google Search để tạo ảnh chính xác, cập nhật. Ví dụ, bạn có thể yêu cầu mô hình hóa dự báo thời tiết hiện tại:
prompt = "Visualize the current weather forecast for the next 5 days in Tokyo as a clean, modern weather chart. add a visual on what i should wear each day"
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'],
image_config=types.ImageConfig(
aspect_ratio="16:9",
),
tools=[{"google_search": {}}]
)
)
# Lưu ảnh
for part in response.parts:
if image:= part.as_image():
image.save("weather.png")
# Hiển thị nguồn dữ liệu
print(response.candidates[0].grounding_metadata.search_entry_point.rendered_content)

—
7) Sinh ảnh 4K chất lượng cao
Bạn cần ảnh in ấn sắc nét? Nano Banana Pro cho phép xuất ảnh 4K độ phân giải cao.
prompt = "A photo of an oak tree experiencing every season"
resolution = "4K" # Chọn: "1K", "2K", "4K" (viết hoa)
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'],
image_config=types.ImageConfig(
aspect_ratio="1:1",
image_size=resolution
)
)
)

Lưu ý: Ảnh 4K có chi phí cao hơn, nên cân nhắc khi sử dụng!
—
8) Polyglot Banana (Đa ngôn ngữ)
Nano Banana Pro có thể sinh và dịch văn bản trong ảnh với nhiều ngôn ngữ – gần như một “phiên dịch viên hình ảnh” thực thụ.
# Tạo infographic bằng tiếng Tây Ban Nha
message = "Make an infographic explaining Einstein's theory of General Relativity suitable for a 6th grader in Spanish"
response = chat.send_message(message,
config=types.GenerateContentConfig(
image_config=types.ImageConfig(aspect_ratio="16:9")
)
)
# Lưu ảnh
for part in response.parts:
if image:= part.as_image():
image.save("relativity.png")

# Dịch sang tiếng Nhật
message = "Translate this infographic in Japanese, keeping everything else the same"
response = chat.send_message(message)
# Lưu ảnh
for part in response.parts:
if image:= part.as_image():
image.save("relativity_JP.png")

—
9) Trộn ảnh nâng cao
Nếu bản Flash chỉ trộn tối đa 3 ảnh, thì Nano Banana Pro hỗ trợ trộn đến 14 ảnh – giúp bạn tạo ảnh ghép phức tạp hoặc giới thiệu nhiều sản phẩm chỉ trong một prompt.
# Trộn nhiều ảnh cùng lúc
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=[\
"An office group photo of these people, they are making funny faces.",\
PIL.Image.open('John.png'),\
PIL.Image.open('Jane.png'),\
# ... tối đa 14 ảnh\
],
)
# Lưu ảnh
for part in response.parts:
if image:= part.as_image():
image.save("group_picture.png")

Lưu ý: Nếu muốn giữ chi tiết cao cho nhân vật, nên trộn tối đa 5 ảnh.
—
10) Demo nổi bật chỉ bản Pro mới có
Một số ví dụ dưới đây chỉ Nano Banana Pro mới thực hiện được:
Pixel Art cá nhân hóa (Tích hợp Search Grounding)
Prompt: “Search the web then generate an image of isometric perspective, detailed pixel art that shows the career of Guillaume Vernade”
Nano Banana Pro sẽ tự động tra cứu thông tin về nhân vật rồi thể hiện lại dưới dạng pixel art.

Tích hợp văn bản phức tạp
Prompt: “Show me an infographic about how sonnets work, using a sonnet about bananas written in it, along with a lengthy literary analysis of the poem. Good vintage aesthetics”
Mô hình có thể sinh văn bản dài, bố cục phức tạp trong một ảnh duy nhất.

Mockup in ấn chất lượng cao
Prompt: “A photo of a program for the Broadway show about TCG players on a nice theater seat, it’s professional and well made, glossy, we can see the cover and a page showing a photo of the stage.”
Tạo mockup sản phẩm in ấn với ánh sáng và chất liệu cực kỳ thực tế.

—
11) Kinh nghiệm thực chiến & mẹo prompting cho Nano Banana và Nano Banana Pro
Để đạt hiệu quả tối ưu với Nano Banana, hãy chú ý:
- Mô tả càng chi tiết càng tốt: Càng nêu rõ về đối tượng, màu sắc, ánh sáng, bố cục… kết quả càng sát ý.
- Giải thích rõ mục đích sử dụng: Cho mô hình biết bạn cần ảnh để làm gì, cảm xúc mong muốn, sẽ giúp AI sáng tạo đúng hướng.
- Chỉnh sửa qua nhiều vòng: Đừng kỳ vọng kết quả hoàn hảo ngay từ đầu, hãy trao đổi và điều chỉnh nhiều lần.
- Chia nhỏ hướng dẫn: Với cảnh phức tạp, nên ra lệnh từng bước, rõ ràng, tuần tự.
- Dùng phủ định một cách tích cực: Tránh kiểu “không có xe”, hãy mô tả “con đường vắng, không có dấu hiệu giao thông”.
- Điều khiển góc nhìn: Sử dụng các thuật ngữ nhiếp ảnh như “góc rộng”, “macro”, “góc thấp” để điều chỉnh bố cục.
- Tận dụng search grounding: Nếu muốn mô hình dùng dữ liệu thực tế/thời gian thực, hãy nêu rõ trong prompt.
- Sử dụng Batch API để tiết kiệm: Gửi nhiều yêu cầu cùng lúc, chờ tối đa 24h nhưng giảm 50% chi phí và tăng quota.
Tham khảo thêm các gợi ý ChatGPT sáng tạo nội dung hay nhất của tôi.
—
Tổng kết
Nano Banana Pro (Gemini 3 Pro Image) mở ra nhiều cơ hội sáng tạo với AI hình ảnh. Khả năng xử lý logic, tìm kiếm dữ liệu thực tế và xuất ảnh 4K giúp bạn sáng tạo chuyên sâu hoặc đơn giản là trải nghiệm AI thú vị.









