Die Möglichkeiten der Künstlichen Intelligenz (KI) schreiten voran: Die Technologie kann mittlerweile sogar Bilder malen. Jüngst gewann ein mittels KI erzeugtes Bild sogar einen Wettbewerb – nicht unbedingt zur Freude menschlicher Künstler.
Ein mittels KI generiertes Bild hat einen Kunstwettbewerb in Colorado gewonnen. Jason Allen, der Chef einer Brettspielfirma, hatte das Werk „Théâtre D’opéra Spatial“ mit der Bild-KI „Midjourney“ entworfen und auf eine Leinwand gebracht.
Viele Künstler sorgen sich angesichts dieser Entwicklungen um die Zukunft ihres Berufsstands. In den sozialen Netzwerken wurde die Prämierung des Bildes (die allerdings auf die Kategorie „Digitale Kunst“ entfiel“) deshalb hitzig diskutiert.
DALL-E 2 von Open AI
„Midjourney“ ist nicht der einzige KI-gestützte Bildgenerator. Das Prinzip der Tools ist einfach: Anwender beschreiben eine Szenerie in Worten und die KI erzeugt ein ihrer „Meinung“ nach passendes Bild. Die Bilderzeugung kann Wochen in Anspruch nehmen – erste rudimentäre Ergebnisse gibt es jedoch bereits nach Sekunden.
Zwei sehr bekannte Text-zu-Bild-Generatoren sind DALL-E 2 des Labors OpenAI und Googles Imagen AI. Diese Generatoren der neueren Generation sind nicht auf einzelne Themengebiete beschränkt wie frühere Anwendungen, die etwa Landschaftsbilder erzeugen konnten.
OpenAI befasst sich mit der Erforschung verschiedener Felder der KI und will perspektivisch Anwendungen auf OpenSource Basis so entwickeln und vermarkten, dass der Gesellschaft dadurch kein Schaden entsteht. Zu den Unterstützern gehören u.a. Elon Musk, Peter Thiel und Amazon Web Services.
Wer im Netz nach durch KI erzeugten Bildern sucht, findet eine sehr große Bandbreite. Es gibt Stillleben, Portraits und komplexe Szenerien (z.B. Gladiatorenkämpfe in einer Arena) ebenso wie reine Fantasiethemen (z.B. einen fahrradfahrenden Panda).
Rechtlicher Rahmen gefordert
Viele Experten fordern einen rechtlichen Rahmen für KI Bilder. Stefan Woltran von der TU Wien etwa hält Prüf- und Zulassungsprozesse für KI Bildsoftware und eine Kennzeichnungspflicht für KI Bilder für nötig.
Viele potenzielle rechtliche Probleme werden bereits bei der Entwicklung umgangen. So werden etwa Gesichtszüge prominenter Personen nur stark verzerrt dargestellt. Die Generatoren ermöglichen zudem nicht die Erzeugung von Gewaltdarstellungen, Pornographie etc.
Mit KI Bilder malen: Ein Selbstversuch
Wer sich im wahrsten Sinne des Wortes selbst ein Bild von den Möglichkeiten der KI machen möchte, kann dies online tun – mit DALL-E-mini. Dies ist eine abgespeckte Version von Dall-E 2, die zwar weitaus weniger leistungsstark, dafür aber ganz einfach über den Browser zugänglich ist.
Der Autor dieser Zeilen hat einen kleinen Feldversuch unternommen – mit durchwachsenen Ergebnissen. Die Vorgehensweise ist sehr einfach: Anwender geben in eine Suchmaske Begriffe ein. Innerhalb von zwei Minuten erstellt die KI daraus ein Bild.
Im ersten Anlauf wurden „Forest, Delphin, Cocktail“ als Schlagwörter angegeben. Daraufhin erschienen verschiedene Bilder von Cocktails ohne erkennbaren Bezug zu Wald und Delphinen. Ein zweiter Versuch mit „Forest, Beer“ lieferte schon präzisere Ergebnisse. Zu sehen waren diverse frischgezapfte Biere (augenscheinlich sowohl Helles als auch Pils, aber kein Weißbier) mitten im Wald.
Noch ein Versuch mit „Car, Moon, Thunder“: Hier generierte die KI mehrere Bilder mit Blick auf den Vollmond. Auf einigen davon tauchte ein Auto auf, den Donner konnte das Programm nicht verarbeiten.
Ein weiterer Versuch mit zwei Schlagworten (Unicorn, Train): Hier kombinierte die KI Bilder von Spielzeugzügen mit Abbildungen von Spielzeugeinhörnern. Mit dem sehr simplen Bildbefehl „Unicorn over sea“ werden Bilder von ganz ähnlichen Einhörnern über comicartigen Wellen erzeugt.
Das Kurzfazit: Die frei zugängliche Variante ist deutlich weniger leistungsstark und erzeugt zumindest den wenigen Stichproben zufolge auch nicht so eindrucksvolle Bilder wie die „große“ KI. Mitunter erscheint der Übergang von Photoshop fließend.
Mit den Profi-Anwendungen verhält es sich anders – dies belegen die Resultate. Die Entwicklung ist zudem noch längst nicht am Ende und könnte auf Sicht auch bestimmte kreative Berufe empfindlich treffen – etwa Entwickler von Stock-Fotos.