top of page
Lösungen
Branchen
Insights
Warum arago?

MENÜ

  • AutorenbildDaniel Stöckel

Mein (hoffentlich bald der Vergangenheit angehörendes) Problem mit KI-generierten Bildern

Sie schießen wie Pilze aus dem Boden: KI-gestützte Bildgeneratoren. Innerhalb weniger Augenblicke erstellen sie auf Grundlage einfacher Textbeschreibungen Bilder und Grafiken.


KI-gestützte Bildgeneratoren versprechen uns unter anderem folgende drei Vorteile:

  1. Schnelligkeit: Sie erstellen Bilder und Grafiken in kürzester Zeit.

  2. Vielseitigkeit: Sie sind in der Lage, eine breite Palette von Bildtypen und Grafiken zu generieren, einschließlich Logos, Porträtfotos, Tierfotos, Hintergrundbilder, Ausmalbilder und 3D-Icons. Dadurch bieten sie eine hohe Flexibilität für verschiedene Anwendungsbereiche.

  3. Kreativität: Durch den Einsatz künstlicher Intelligenz können sie einzigartige und kreative Ergebnisse liefern. Sie können auf vorhandenen Daten und Mustern basieren, um neue und originelle Designs zu schaffen. Eigentlich alles prima. Sie haben sogar das Potential, mir bei einem der drei Dinge zu helfen, die ich äußerst gerne prokrastiniere:

1. Friseurbesuche

2. Das Verfassen von Newsletter-Artikeln

3. Fototermine


100 Portraitfotos in wenigen Minuten: Mit Try it on AI.

Vor wenigen Wochen sprach ich mit meinem Bruder, einem ausgebildeten Werbefotografen, über die Notwendigkeit, ein aktuelles Portraitbild für unsere arago-Homepage erstellen zu lassen – und meine Unlust, zum Fotografen zu gehen. Die Unlust ist umso größer, da es durchaus stichhaltige Gründe gibt, vor einem Termin beim Fotografen auch einen Friseur aufzusuchen.


Mein Bruder machte mich auf die Lösung »Try it on AI« aufmerksam. Der Anbieter verspricht, Porträtfotos in Studioqualität zu generieren, 100 Motive für einen Preis ab 17 Dollar. Vom heimischen Sofa aus, ohne Friseurtermin. Alles was »Try ist on AI« benötigt, sind 10-20 Aufnahmen von mir.


Ich hab’s natürlich ausprobiert.


Und was soll ich sagen: Sollte mir arago die Zeit zugestehen, ein Jurastudium zu absolvieren, habe ich ein passendes Kanzlei-Bild. Auch die Reise in die USA kann ich mir sparen. Für mich am gelungensten ist aber das Bild, das endlich das ganze (bisher noch nie abgerufene) Potential meines Oberkörpers zeigt.


Mein Fazit zu Try it on AI:


Auf vielen Bildern wirkt mein Gesicht seltsam verschoben. Das liegt hoffentlich an der eingeschränkten Qualität meiner Ausgangsbilder. Einige der 100 Bilder wirken hingegen so echt, dass vermutlich niemand hinterfragen würde, ob sie von einer AI generiert wurden.


Die Frage wird somit eher sein, ob irgendwann alle LinkedIn-Fotos dieselben Bildhintergründe aufweisen und wie wohl ich mich damit fühlen werde, Portraitfotos zu verwenden, die künstlich generiert wurden.


Letzteres – die Frage, wie wohl man sich mit künstlich generierten Fotos fühlt – stellt sich in anderen Bereichen vermutlich weniger.


Bilder, insbesondere in Schulungsunterlagen, dienen der Visualisierung von Informationen, steigern das Interesse dank ihrer hohen Aufmerksamkeitswirkung, fördern das Verständnis und erleichtern das Erinnern und Abrufen von Informationen.


Die Suche nach passenden Bildern ist aufwändig und auch frustrierend, wenn in klassischen Bilddatenbanken wie z.B. Adobe Stock nicht jenes Motiv zu finden ist, welches man sich wünscht.


Hier können Bildgeneratoren eine sinnvolle Ergänzung sein.


Der beste KI-Bildgenerator auf dem Markt: Midjourney.

Midjourney gilt als der derzeit beste KI-Bildgenerator auf dem Markt. Die Lösung ist erst seit Juli 2022 online. Ihr Nachteil: Sie wird über einen Server ausgespielt, der in den Chat-Dienst »Discord« eingebunden ist. Die Bedienung ist daher nicht besonders intuitiv.


Beeindruckend sind aber die Ergebnisse.

Mit diesem via Midjourney erstellten Bild mit dem Namen Théâtre d‘Opéra Spatial gewann Jason Allen den ersten Preis bei einer Kunstausstellung in Colorado. Es hagelte daraufhin heftige Kritik von lebenden Künstlern. Das Bild wurde von den Preisrichtern nicht als KI-Kunst erkannt. © Midjourney


Wenn Sie ein Bild von einem Kind mit einem schwarz-weiß gefleckten Pferd benötigen, das vor einem Tisch mit einer Torte steht, werden Sie bei den herkömmlichen Bilddatenbanken vermutlich lange suchen müssen. Midjourney erstellt Ihnen vier Bildvorschläge in wenigen Augenblicken. Sie haben anschließend die Möglichkeit, sich von Ihrem Favoriten vier weitere Vorschläge ausarbeiten zu lassen, bis Sie schließlich Ihr Wunschmotiv generiert haben.


Schritt 1:

Midjourney gibt vier verschiedene Bildvorschläge zum gewünschten Motiv aus.

© Midjourney

Schritt 2:

Das favorisierte Motiv kann weiter verfeinert werden.

© Midjourney

Midjourney kostet im Basisplan 10 Dollar pro Monat. Damit lassen sich 200 Bilder generieren (wobei jede Eingabe 4 Vorschläge liefert). Die Kosten je Bild betragen lediglich 0,05 Dollar.


DALL-E: Die Bild-KI von Open AI.

Open AI war und ist dank ChatGPT das bestimmende Thema der letzten Monate. Open AI hat mit DALL-E aber auch einen Bildgenerator entwickelt, der seit September 2022 in der Version DALL-E 2.0 verfügbar ist.


Im Gegensatz zu Midjourney erwirbt man bei DALL-E Credits. 115 Credits kosten 15 Dollar (0,13 Dollar je Bild).


Die Bedienung ist komfortabler als bei Midjourney, die Qualität der Ergebnisse aber weniger ansprechend. Auch bei DALL-E besteht die Möglichkeit, weitere Varianten eines Bildes generieren zu lassen.

Links das Originalbild, rechts vier weitere Varianten des Bildes. © DALL-E

Die Möglichkeiten, Bilder via KI generieren zu lassen sind vorhanden, die Ergebnisse überaus beeindruckend.


Derzeit sehe ich jedoch noch folgende zwei Probleme:


1. Der rechtliche Aspekt


Auf KI-generierte Bilder besteht vermutlich kein urheberrechtlicher Schutz, da gemäß § 2 Abs. 2 UrhG nur persönliche, geistige Schöpfungen geschützt sind. Darunter dürften KI-generierte Bilder nicht fallen. Midjourney beispielsweise weist darauf hin, dass die Bilder auch zu kommerziellen Zwecken genutzt werden dürfen, aber nicht Eigentum des Erstellers sind.


Das Problem: KI-Bildgeneratoren verwenden zumeist Bilder aus dem Internet als Trainingsdaten. Ähnelt das KI-generierte Bild zu sehr dem Original, kann eine Urheberrechtsverletzung vorliegen. Die Rechtsprechung wird sich in den kommenden Jahren mit dieser noch sehr neuen Thematik befassen dürfen.


2. Der Aufwand


Das Buch »Alice and Sparkle« von Ammaar Reshi wurde komplett via Midjourney illustriert. Auch hier gab es Kritik von Künstlern, dass ihr Stil bei der Generierung der Bilder ohne vorherige Genehmigung nachgeahmt wurde. Darüber hinaus darf man sich auch nicht der Illusion hingeben, dass die Erstellung passender Bildmotive keine zeitlichen Ressourcen bindet. Für klassische Bildmotive sind meines Erachtens traditionelle Bilddatenbanken nach wie vor die bessere Wahl. Mit 1-2 Suchbegriffen erhalte ich hunderte Bilder zur Auswahl, rechtlich geprüft und abgesichert.


Richtig interessant werden die KI-Bildgeneratoren jedoch dann, wenn sie z.B. eine Schulungsunterlage komplett einlesen, auswerten und passende Bildvorschläge nach dem von mir gewünschten Stil erstellen können. Ohne weitere Texteingabe meinerseits.


Bei dem aktuellen Entwicklungstempo dürfte dies nicht mehr allzu lange dauern. Und spätestens dann werden wir das Thema KI und Bildgenerierung nochmals ganz genau unter die Lupe nehmen.

Neben DALL-E, Midjourney und Try it on AI gibt es unzählige weitere Bildgeneratoren. Einen sehr guten Überblick über die 14 besten KI-Bildgeneratoren in 2023 bietet der Blogartikel von Finn Hillebrandt unter https://www.blogmojo.de/ki-bildgeneratoren/. Er geht detailliert auf die Vor- und Nachteile der einzelnen Lösungen ein und vergleicht die Ausgabequalität der Bilder anhand von drei Beispielen.



36 Ansichten0 Kommentare

Aktuelle Beiträge

Alle ansehen
bottom of page