Nano Banana Pro: Googles neue Bild-KI ersetzt Photoshop und noch mehr

Gemini Nano Banana Pro 1

Google DeepMind hat das neue Bildgenerierungsmodell Nano Banana Pro veröffentlicht. Die auf Gemini 3 Pro basierende KI-Software soll vor allem bei der Textdarstellung, der Visualisierung von Daten und der konsistenten Bearbeitung komplexer Szenen Verbesserungen bieten.

Laut Google nutzt Nano Banana Pro die Schlussfolgerungsfähigkeiten von Gemini 3, um faktenbasierte Inhalte zu visualisieren. Das System kann auf die Google-Suche zugreifen und Echtzeitdaten wie Wetterberichte oder Sportergebnisse direkt in Infografiken oder Diagramme umsetzen.

Gemini Nano Pro Infobild

Ein technischer Schwerpunkt liegt auf der korrekten Wiedergabe von Texten innerhalb von Bildern. Das Modell soll längere Absätze, Slogans und Kalligrafien in verschiedenen Sprachen fehlerfrei rendern können. Auch die Übersetzung und Lokalisierung von Texten innerhalb bestehender Bildkompositionen ist möglich.

Jetzt den WhatsApp-Kanal abonnieren!

Für professionelle Anwender bietet das Modell erweiterte Kontrollmöglichkeiten. Laut Google lassen sich bis zu 14 Referenzbilder kombinieren, wobei die visuellen Merkmale von bis zu fünf verschiedenen Personen konsistent bleiben sollen. Dies zielt auf die Erstellung zusammenhängender Storyboards oder Marketingkampagnen ab.

Gemini Nano Banana Pro 2

Die Bearbeitungswerkzeuge erlauben nachträgliche Anpassungen an generierten Bildern – in meinen Augen das größte Feature für alle Privatanwender. Nutzer können laut Angaben den Kamerawinkel, den Fokus (Tiefenschärfe), die Beleuchtung (z. B. Wechsel von Tag zu Nacht) und das Seitenverhältnis ändern. Die Ausgabe erfolgt in Auflösungen bis zu 2K und 4K.

Gemini Nano Banana Pro 2 3

Nano Banana Pro wird ab sofort in verschiedene Google-Dienste integriert:

  • Privatnutzer: In Gemini weltweit über die Funktion „Bilder erstellen“ verfügbar. Nutzer der kostenlosen Variante erhalten ein begrenztes Kontingent, danach greift das Standard-Modell. Abonnenten (Plus, Pro, Ultra) erhalten höhere Limits.
  • Unternehmen: Integration in Google Ads (in acht Sprachen, darunter Deutsch) sowie in Workspace-Apps wie Google Präsentationen und Vids.
  • Entwickler: Zugriff über die Gemini API, Google AI Studio und Vertex AI.
  • Kreativbranche: Für Google AI Ultra-Abonnenten steht das Modell im Film-Tool „Flow“ bereit.

Zur Erkennung generierter Inhalte setzt Google auf das unsichtbare Wasserzeichen SynthID. Nutzer können Bilder in Gemini hochladen und prüfen lassen, ob diese mit Google AI erstellt wurden. Zusätzlich erhalten Bilder von Nutzern der kostenlosen und Pro-Variante ein sichtbares Wasserzeichen (Gemini-Symbol). Lediglich bei Ultra-Abonnenten entfällt die sichtbare Markierung, um professionelle Anwendungen nicht zu stören.

Kommentar verfassen

Bleibt bitte nett zueinander!