Nano Banana Pro: Historische Abbildungen mit Gemini erstellen

Symbolbild: Nano Banana denkt nach und zeichnet ein Bild

Vor einigen Tagen wurde die neue Version von Google Gemini veröffentlicht und daher wollte ich die KI-Bildtechnologie von Google (Nano Banana) ausprobieren. Da einige Leute das neue Modell mit Koordinaten und einem bestimmten Datum herausgefordert haben, wollte ich das ebenfalls machen und habe mir zwei Szenarien ausgesucht und wollte auch gleichzeitig schauen, wie sich ChatGPT schlägt.

Krimi in den Alpen

Mein erster Prompt für Google Gemini 3 Pro lautete folgendermaßen:

Erstelle ein Bild von 46° 46′ 46″ N, 10° 50′ 26″ O im Jahr 3230 v. Chr.

Das folgende Bild hat Gemini dann erstellt. Es handelt sich hierbei um einen alten Kriminalfall und die Hauptrolle dabei hat ein sehr berühmter Südtiroler. 😉

Die Tötung von Ötzi, wie es sich Nano Banana von Google vorstellt.
Die Tötung von Ötzi, wie es sich Nano Banana von Google vorstellt.

Wie du spätestens anhand des Bildes erkennen kannst, handelt es sich hierbei um die Tötung von Ötzi vor 5250 Jahren. Google Gemini hat schnell und richtig erkannt, worum es geht. So hat das KI-Modell »nachgedacht«:

Focusing on Parameters

I’m now zeroing in on the request parameters: a precise location, a specific historical period (3230 BC), and the Ötztal Alps. My primary goal is a clear visualization of the event in this era, considering the landscape and potential human presence. The geographic coordinates need to be accurately represented for this specific event.

Pinpointing the Scene

I’m now fully immersed in the scene construction. The parameters are locked: the Ötztal Alps, 3230 BC. The goal is to capture Ötzi’s final moment in a realistic setting. I’m focusing on the environmental details, like the rugged terrain, the late autumn vegetation, and the harsh weather. The figure of Ötzi and his belongings are in the plan. […]

Gemini hat zügig erkannt, dass es sich hier um die Ötztaler Alpen handelt und ich, basierend auf der Jahresangabe, nach einem Bild von der Tötung von Ötzi erwarte. Und hier das Bild, welches ChatGPT 5.1 Thinking generiert hat:

Das Bild, welches ChatGPT generiert hat
Was ChatGPT generiert hat

Wie du erkennen kannst, hat ChatGPT zwar ein Bild erstellt, welches landschaftlich und auch in Bezug auf die Epoche recht gut passt. Es hat aber nicht erkannt, um welches Ereignis es mir geht. Das kannst du noch besser am Nachdenkprozess von ChatGPT erkennen:

Vorbereiten der Bildanforderung

Der Benutzer hat nach einem Bild eines historischen Szenarios gefragt, das vermutlich in den Alpen liegt, nahe der italienisch-schweizerischen Grenze, etwa am Stelvio Pass oder Südtirol. Die angegebene Jahreszahl liegt im Neolithikum oder Chalkolithikum, um 3230 v. C. Ich plane, ein realistisches Bild mit einer malerischen oder fotorealistischen Darstellung zu erstellen.

Bei dem ersten Test liegt Google Gemini 3 mit Nano Banana klar vorn. Schauen wir uns die Bilder aus dem zweiten Test an.

Die Finsternis von Golgatha

Der nächste Prompt, den ich für beide Modelle nutzte, sah so aus:

Erstelle ein Foto von 31,7785° N und 35,2296° O am 3. April 33 um 15:01.

Basierend darauf hat Google Gemini folgendes Bild erstellt:

Die Kreuzigung von Jesus, erstellt durch Google Gemini 3.
Die Kreuzigung von Jesus, erstellt mit Google Gemini 3.

Google Gemini hat schnell erkannt, um welches historische Ereignis es geht, und hat mit Nano Banana ein realistisch wirkendes Bild erstellt. Hier ein Auszug aus dem Denkvorgang:

Locating Golgotha’s Site

I’m now focusing on depicting Golgotha outside Jerusalem’s walls in 33 AD, using the provided coordinates. The location is set near the Damascus Gate. I plan to refine the scene’s details based on historical context.

Crafting the Golgotha Scene

I am working on capturing the somber atmosphere of Golgotha outside Jerusalem in 33 AD. I’m focusing on the historical accuracy of the Roman soldiers’ armor (Lorica Hamata) and the clothing of the Jewish onlookers. The scene should convey a sense of chaos and impending doom, with dark, stormy skies and signs of an earthquake. I aim to evoke the profound sorrow and tension of that moment in time. The cityscape of Jerusalem, with its walls, will be visible in the background. […]

Nun schauen wir uns an, was ChatGPT 5.1 mit dem gleichen Prompt generiert hat:

Kreuzigung von Jesus mit ChatGPT generiert.
Kreuzigung von Jesus mit ChatGPT generiert.

Einerseits hat ChatGPT hier erkannt, um welches Ereignis es sich handelt. Dabei hat ChatGPT keinen Denkvorgang generiert bzw. benötigt, obwohl ich 5.1 Thinking aktiviert hatte. Allerdings hat es mir, anstatt eines Fotos ein Gemälde erstellt.

Fazit: Google hat die Nase vorn

Auch wenn ich es ungern sage, aber momentan hat Google hier die Nase vorn. Ich habe noch weitere historische Ereignisse bemüht und auch Infografiken erstellen lassen, und es sah nicht wirklich gut für ChatGPT aus. Die zwei oberen Prompts könnte man noch als nette Spielerei für History-Nerds abtun, aber vor allem bei Infografiken, war der Abstand von Google Gemini gegenüber ChatGPT teilweise richtig heftig.

Beim Reasoning konnte ChatGPT manchmal noch mithalten, aber bei der Umsetzung bzw. bei der Bildgenerierung lag Google meistens vor. Das kann sich natürlich in wenigen Wochen ändern. Aber es zeigt leider, dass wir als Nutzer weiterhin mehrere Modelle testen müssen.

Wir arbeiten seit 20 Jahren mit WordPress und bieten diverse Dienst­leistungen rund um das System an. Kontaktiere uns für weitere Informationen oder für ein Angebot.

Verwandte Beiträge:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert