Microsoft Copilot mit DALL-E 3 Bildgenerierungstool
Die "Geschichte" hinter unserem KI-generierten Aufmacher-Bild
2024-01-02 Der eine oder andere mag sich vielleicht über unser Aufmacher-Bild in unserem Artikel "Was hat sich 2023 bei spiegellosen Systemkameras getan?" gewundert haben. Hier ist die (überhaupt nicht aufregende) Entstehungsgeschichte dazu mit weiteren Bildern, die während der Erstellung mittels künstlicher Intelligenz entstanden sind. (Jan-Markus Rupprecht)
Die Meldung "Was hat sich 2023 bei spiegellosen Systemkameras getan?" hatten wir am Silvestertag 2023 zunächst nur mit Kamerafotos der darin angesprochenen 2023er-Systemkameras-Neuheiten veröffentlicht. Mindestens ein Bild davon müssen wir in unserem Redaktionssystem als Bild für die Startseite und den Newsletter auswählen. Da hatten wir anfangs einfach das erste Bild im Text genommen (eine Panasonic-Kamera) und das später auf eine Sony-Kamera geändert (denn Sony ist aktuell unser größter Werbekunde unter den Kameraherstellern, wenn schon sonst nicht, dann können wir wenigstens mit solchen Kleinigkeiten unsere Wertschätzung dafür zeigen).
Wir können für die Startseite auch mehrere Fotos anwählen, die dann nacheinander überblendet werden, ein ganz netter Effekt. Spätestens im Newsletter funktioniert die Technik aber nicht, da kann immer nur ein Bild drin sein. Alles irgendwie nicht optimal. Schön wäre es gewesen, eine Art Gruppenfoto, theoretisch mit allen 2023er-Neuheiten, zu haben, oder irgendein anderes Foto, das einfach eine Vielfalt an Systemkameras zeigt und vielleicht noch "nett" aussieht oder ein "Hingucker" ist. Ein eigenes Aufmacherfoto zu schießen war mangels Kameravielfalt gar nicht möglich, schließlich gehen die Testgeräte nach dem Test zurück an die Hersteller. Eine Fotomontage hätte mehr oder weniger viel Aufwand gemacht und irgendwie auch nicht richtig gut ausgesehen, erst recht nicht in der sehr kleinen Darstellung auf der Startseite oder im Newsletter.
Volltreffer gleich beim ersten Versuch: So ähnlich hatte ich das Bild im Kopf gehabt, vielleicht nicht unbedingt mit der Skyline im Hintergrund, sonst aber für mich ein fantastisches Ergebnis. [Foto: MediaNord, mit KI generiert (Microsoft Copilot)]
Ebenfalls aus dem ersten Ergebnis. Gefällt mir auch gut, vor allem, dass die Frau die silberne Kamera sehr realistisch greift. Der Rucksack ist aber etwas übertrieben breit und dort baumeln für meinen Geschmack zu viele Kameras. [Foto: MediaNord, mit KI generiert (Microsoft Copilot)]
Hier sieht man, dass "Kameras um den Hals tragen" von der KI auch etwas zu wörtlich genommen werden kann. [Foto: MediaNord, mit KI generiert (Microsoft Copilot)]
Hier ebenso. Die Kameras sind eher wie eine Halskette angeordnet. [Foto: MediaNord, mit KI generiert (Microsoft Copilot)]
Also mal irgendwas anderes. Zur Abwechslung und Auflockerung unserer sonst immer sehr nüchternen "Bildsprache" gern mal "was mit Model". Da kam auf die Schnelle nur die künstliche Intelligenz infrage, die sowieso immer mal ausprobiert werden sollte. Ohne konkreten Anwendungsfall macht mir so etwas immer wenig Spaß, aber hier tat sich nun eine erste nützliche Anwendung auf. Gerade gingen die Meldungen herum, dass die App Microsoft Copilot ziemlich neu für Smartphones und Tablets mit Android, iOS und iPad-OS herausgekommen war. Die wollte ich sowieso einmal ausprobieren. Microsoft hat sich vor einiger Zeit an OpenAI beteiligt, der Firma mit dem Chatbot ChatGPT, der in der jüngeren Vergangenheit reichlich durch die Presse ging. Die Technik fließt jetzt in diverse Microsoft-Produkte ein und die reine Form davon ist die neue App Microsoft Copilot, die ebenfalls ein ChatBot ist und sich zudem kostenlos nutzen lässt.
"ChatBot" bedeutet, dass man sich mit der App mehr oder weniger umgangssprachlich unterhalten kann. Man stellt mündlich oder per Tastatur Fragen oder Anweisungen und erhält kurze Zeit darauf das Ergebnis. Lassen sich diese mit Texten beantworten, bekommt man eine mehr oder weniger lange Abhandlung, die sich oft erstmal ganz gut anhört, oft aber inhaltlich sehr dünn bis nichtssagend ist. Zwar sind die Quellen in der Antwort genannt und auch verlinkt, aber ohne die Quellen aufzurufen oder eigenen Sachverstand kann man nur schwer einschätzen, ob das, was da steht, Hand und Fuß hat. Mit einer Suchmaschinenrecherche in einer guten Suchmaschine und einem Klick auf (hoffentlich) vertrauenswürdige Suchergebnisse wird man Fachinformationen oft besser bekommen. Natürlich gibt es aber bereits auch viele nützliche Anwendungen für die Unterhaltung mit dem ChatBot.
Eine davon, die zudem viel Spaß macht, kann die Erstellung von Grafiken sein. Ob es sich dabei um eher grafische Ergebnisse, also z. B. Strichgrafiken oder Logos handelt oder um fotorealistische Darstellungen, spielt keine Rolle. Man muss einfach nur sagen beziehungsweise schreiben, was man haben möchte und dann arbeiten die KI-Rechner in den Microsoft-Rechenzentren und liefern kurz darauf das Ergebnis in Form von immer drei bis vier Ergebnissen zur Auswahl. Wenn man merkt, dass das Ergebnis noch nicht ganz das ist, was einem vorschwebt, kann man versuchen, mit weiteren präziseren Anfragen passendere Ergebnisse zu bekommen.
Mein zweiter Versuch, die Anzahl der Kameras auf "vier Kameras" zu beschränken, funktionierte nicht gut, wie man hier sieht. Die Kameras an den Tragegurten sind sonst aber sehr genau das, was ich mir vorgestellt habe. Die Straße im Fluss allerdings nicht. [Foto: MediaNord, mit KI generiert (Microsoft Copilot)]
Auch hier eher fünf als die bestellten vier Kameras und sie werden allzu wörtlich "um den Hals getragen". [Foto: MediaNord, mit KI generiert (Microsoft Copilot)]
"Kameras um den Hals tragen" wieder sehr wörtlich. Sehr unrealistisch, aber die Kameras auf diesem Bild sind toll geworden. Und die Dame trägt einen ziemlich coolen Hut. ;-). [Foto: MediaNord, mit KI generiert (Microsoft Copilot)]
Hier einmal im "Lara Croft Stil" (nicht explizit bestellt). Das ist aus der "vier Kameras" Anweisung das einzige Bild mit vier Kameras. Das Bild wirkt insgesamt aber eher gemalt und weniger fotorealistisch als die anderen. [Foto: MediaNord, mit KI generiert (Microsoft Copilot)]
Im konkreten Fall war interessanterweise gleich eines der ersten Ergebnisse mein Favorit. Versuche, das noch weiter zu optimieren, führten zu anderen, aber nicht besseren Ergebnissen. Sicherlich hätte ich da noch viel herumprobieren können, aber da tatsächlich eben eines der ersten Ergebnisse ziemlich dem entsprach, was ich mir vorgestellt hatte (und das Ganze zunächst eigentlich mehr ein Zeitvertreib auf dem Smartphone vorm Schlafengehen war) habe ich mich nur insgesamt etwa 20 Minuten mit der Aufgabe befasst. In den Bilderstrecken zeigen wir die Ergebnisse des ersten und zweiten Durchgangs. Die Anweisung an den Microsoft Copilot Chatbot lautete übrigens kurz und knapp: "Erstelle ein fotorealistisches Bild: eine Fotografin, europäischer Typ, hat mehrere Kameras um den Hals hängen."
Die über die App erstellten JPEG-Bilder haben eine Größe von 1.024 x 1.024 Pixel. Das reicht für Web-Anwendungen wie diese hier, aber natürlich nicht für wesentlich mehr. Wenn das Thema interessant für unsere Leser ist, was wir an der Anzahl der Seitenzugriffe auf diese Seite einschätzen können, kommen wir auf das Thema gern ausführlicher zurück. Wenn Sie Anmerkungen zu dem Thema haben oder vielleicht selbst schon eine Bild- beziehungsweise Foto-Aufgabe mit künstlicher Intelligenz gelöst haben, freuen wir uns über Ihre Zuschriften an an redaktion@medianord.de.