Die 'Geschichte' hinter unserem KI-generierten Aufmacher-Bild

Die "Geschichte" hinter unserem KI-generierten Aufmacher-Bild

2024-01-02 Der eine oder andere mag sich vielleicht über unser Aufmacher-Bild in unserem Artikel "Was hat sich 2023 bei spiegellosen Systemkameras getan?" gewundert haben. Hier ist die (überhaupt nicht aufregende) Entstehungsgeschichte dazu mit weiteren Bildern, die während der Erstellung mittels künstlicher Intelligenz entstanden sind. (Jan-Markus Rupprecht)

Die Meldung "Was hat sich 2023 bei spiegellosen Systemkameras getan?" hatten wir am Silvestertag 2023 zunächst nur mit Kamerafotos der darin angesprochenen 2023er-Systemkameras-Neuheiten veröffentlicht. Mindestens ein Bild davon müssen wir in unserem Redaktionssystem als Bild für die Startseite und den Newsletter auswählen. Da hatten wir anfangs einfach das erste Bild im Text genommen (eine Panasonic-Kamera) und das später auf eine Sony-Kamera geändert (denn Sony ist aktuell unser größter Werbekunde unter den Kameraherstellern, wenn schon sonst nicht, dann können wir wenigstens mit solchen Kleinigkeiten unsere Wertschätzung dafür zeigen).

Wir können für die Startseite auch mehrere Fotos anwählen, die dann nacheinander überblendet werden, ein ganz netter Effekt. Spätestens im Newsletter funktioniert die Technik aber nicht, da kann immer nur ein Bild drin sein. Alles irgendwie nicht optimal. Schön wäre es gewesen, eine Art Gruppenfoto, theoretisch mit allen 2023er-Neuheiten, zu haben, oder irgendein anderes Foto, das einfach eine Vielfalt an Systemkameras zeigt und vielleicht noch "nett" aussieht oder ein "Hingucker" ist. Ein eigenes Aufmacherfoto zu schießen war mangels Kameravielfalt gar nicht möglich, schließlich gehen die Testgeräte nach dem Test zurück an die Hersteller. Eine Fotomontage hätte mehr oder weniger viel Aufwand gemacht und irgendwie auch nicht richtig gut ausgesehen, erst recht nicht in der sehr kleinen Darstellung auf der Startseite oder im Newsletter.

Bild Volltreffer gleich beim ersten Versuch: So ähnlich hatte ich das Bild im Kopf gehabt, vielleicht nicht unbedingt mit der Skyline im Hintergrund, sonst aber für mich ein fantastisches Ergebnis. [Foto: MediaNord, mit KI generiert (Microsoft Copilot)]

Volltreffer gleich beim ersten Versuch: So ähnlich hatte ich das Bild im Kopf gehabt, vielleicht nicht unbedingt mit der Skyline im Hintergrund, sonst aber für mich ein fantastisches Ergebnis. [Foto: MediaNord, mit KI generiert (Microsoft Copilot)]

Also mal irgendwas anderes. Zur Abwechslung und Auflockerung unserer sonst immer sehr nüchternen "Bildsprache" gern mal "was mit Model". Da kam auf die Schnelle nur die künstliche Intelligenz infrage, die sowieso immer mal ausprobiert werden sollte. Ohne konkreten Anwendungsfall macht mir so etwas immer wenig Spaß, aber hier tat sich nun eine erste nützliche Anwendung auf. Gerade gingen die Meldungen herum, dass die App Microsoft Copilot ziemlich neu für Smartphones und Tablets mit Android, iOS und iPad-OS herausgekommen war. Die wollte ich sowieso einmal ausprobieren. Microsoft hat sich vor einiger Zeit an OpenAI beteiligt, der Firma mit dem Chatbot ChatGPT, der in der jüngeren Vergangenheit reichlich durch die Presse ging. Die Technik fließt jetzt in diverse Microsoft-Produkte ein und die reine Form davon ist die neue App Microsoft Copilot, die ebenfalls ein ChatBot ist und sich zudem kostenlos nutzen lässt.

"ChatBot" bedeutet, dass man sich mit der App mehr oder weniger umgangssprachlich unterhalten kann. Man stellt mündlich oder per Tastatur Fragen oder Anweisungen und erhält kurze Zeit darauf das Ergebnis. Lassen sich diese mit Texten beantworten, bekommt man eine mehr oder weniger lange Abhandlung, die sich oft erstmal ganz gut anhört, oft aber inhaltlich sehr dünn bis nichtssagend ist. Zwar sind die Quellen in der Antwort genannt und auch verlinkt, aber ohne die Quellen aufzurufen oder eigenen Sachverstand kann man nur schwer einschätzen, ob das, was da steht, Hand und Fuß hat. Mit einer Suchmaschinenrecherche in einer guten Suchmaschine und einem Klick auf (hoffentlich) vertrauenswürdige Suchergebnisse wird man Fachinformationen oft besser bekommen. Natürlich gibt es aber bereits auch viele nützliche Anwendungen für die Unterhaltung mit dem ChatBot.

Eine davon, die zudem viel Spaß macht, kann die Erstellung von Grafiken sein. Ob es sich dabei um eher grafische Ergebnisse, also z. B. Strichgrafiken oder Logos handelt oder um fotorealistische Darstellungen, spielt keine Rolle. Man muss einfach nur sagen beziehungsweise schreiben, was man haben möchte und dann arbeiten die KI-Rechner in den Microsoft-Rechenzentren und liefern kurz darauf das Ergebnis in Form von immer drei bis vier Ergebnissen zur Auswahl. Wenn man merkt, dass das Ergebnis noch nicht ganz das ist, was einem vorschwebt, kann man versuchen, mit weiteren präziseren Anfragen passendere Ergebnisse zu bekommen.

Bild Mein zweiter Versuch, die Anzahl der Kameras auf "vier Kameras" zu beschränken, funktionierte nicht gut, wie man hier sieht. Die Kameras an den Tragegurten sind sonst aber sehr genau das, was ich mir vorgestellt habe. Die Straße im Fluss allerdings nicht. [Foto: MediaNord, mit KI generiert (Microsoft Copilot)]

Mein zweiter Versuch, die Anzahl der Kameras auf "vier Kameras" zu beschränken, funktionierte nicht gut, wie man hier sieht. Die Kameras an den Tragegurten sind sonst aber sehr genau das, was ich mir vorgestellt habe. Die Straße im Fluss allerdings nicht. [Foto: MediaNord, mit KI generiert (Microsoft Copilot)]

Im konkreten Fall war interessanterweise gleich eines der ersten Ergebnisse mein Favorit. Versuche, das noch weiter zu optimieren, führten zu anderen, aber nicht besseren Ergebnissen. Sicherlich hätte ich da noch viel herumprobieren können, aber da tatsächlich eben eines der ersten Ergebnisse ziemlich dem entsprach, was ich mir vorgestellt hatte (und das Ganze zunächst eigentlich mehr ein Zeitvertreib auf dem Smartphone vorm Schlafengehen war) habe ich mich nur insgesamt etwa 20 Minuten mit der Aufgabe befasst. In den Bilderstrecken zeigen wir die Ergebnisse des ersten und zweiten Durchgangs. Die Anweisung an den Microsoft Copilot Chatbot lautete übrigens kurz und knapp: "Erstelle ein fotorealistisches Bild: eine Fotografin, europäischer Typ, hat mehrere Kameras um den Hals hängen."

Die über die App erstellten JPEG-Bilder haben eine Größe von 1.024 x 1.024 Pixel. Das reicht für Web-Anwendungen wie diese hier, aber natürlich nicht für wesentlich mehr. Wenn das Thema interessant für unsere Leser ist, was wir an der Anzahl der Seitenzugriffe auf diese Seite einschätzen können, kommen wir auf das Thema gern ausführlicher zurück. Wenn Sie Anmerkungen zu dem Thema haben oder vielleicht selbst schon eine Bild- beziehungsweise Foto-Aufgabe mit künstlicher Intelligenz gelöst haben, freuen wir uns über Ihre Zuschriften an an redaktion@medianord.de.

Meldung die auf diese Meldung verweist

Was hat sich 2023 bei spiegellosen Systemkameras getan?

Microsoft Copilot mit DALL-E 3 Bildgenerierungstool

Die "Geschichte" hinter unserem KI-generierten Aufmacher-Bild

Meldung die auf diese Meldung verweist

Artikel-Vorschläge der Redaktion

Den Fokus richtig setzen (Schulungsvideo)

Intelligente Fotoverwaltung Excire Foto 2025 mit vielen Verbesserungen

Erste Schritte mit Radiant Photo – Schneller Modus

Kaufberatung: Was bei Powerstations (und Solarzellen) zu beachten ist

Autor