Leider können deine künstlich erstellten Pokémon nur in deiner Phantasie gegen andere Pokémon kämpfen. Nächstes Mal vielleicht.
Ihr kennt alle Text-to-Speech, aber kennt ihr schon Text-to-Pokémon? Dieses kleine KI-Widget verwandelt beliebige Namen oder Beschreibungen in – ihr ahnt es sicherlich schon – Pokémon. Die Ergebnisse sind nicht perfekt, aber unterhaltsam sind sie allemal.
Ihr müsst nicht bei beliebigen Namen aufhören. Ihr könnt auch Politiker oder berühmte Persönlichkeiten wählen und euch deren Pokémon-Persona ansehen. Das Tool braucht ein wenig Zeit, um die Bilder zu generieren, aber das Ergebnis ist es absolut wert.
Um das meiste aus dem Tool rauszuholen, solltet ihr bei „num_output“ aus dem Menü die Nummer „4“ wählen, damit ihr gleich vier verschiedene Bilder bekommt und nicht nur eines.
Die sechs Bilder auf dem Foto ganz oben sind übrigens: Mädchen mit Perlenohrring, süße Obama-Kreatur, Donald Trump, Boris Johnson, Totoro und Hello Kitty.
Text-to-Pokémon basiert auf Stable Diffusion
Um das Tool zu entwickeln, hat Machine-Learning-Forscher Justin Pinkney mehrere visuelle KI-Tools und andere Ressourcen verwendet. Die Basis ist allerdings ein viel leistungsstärkerer KI-Generator namens Stable Diffusion.
Im Gegensatz zu DALL-E oder DeepMind ist Stable Diffusion Open Source und damit für andere zugänglich. Pinkney musste also „nur“ das System mit der Pokémon-Datenbank verfeinern und schon war sein Tool geboren.
Pinkney geht in einem Twitter-Thread etwas genauer auf die Herausforderungen ein, die bei der Erstellung seines Tools zu bewältigen waren. „Stable Diffusion ist ein großartiges Tool, aber es ist ziemlich schwierig, ein bestimmtes Design beim Output zu erreichen. Es erfordert normalerweise ernsthaftes ‚Engineering‘. Die Feinabstimmung des Modells selbst ist ein einfacher Ansatz, um sich auf das zu konzentrieren, was ihr erreichen wollt – wenn Sie über einige Daten verfügen.“
Online scheinen sich viele Nutzer*innen einen Spaß daraus zu machen, bekannte fiktionale Persönlichkeiten in Pokémon zu verwandeln. Sonic, Son-Goku und Yoda sind nur ein paar der Beispiele, die ihr online finden könnt.
Open Source KI mit Vor- und Nachteilen
Text-to-Pokémon zeigt perfekt die Vorteile einer Open-Source-KI wie Stable Diffusion. Smarte Menschen entwickeln lustige Tools und lernen etwas dabei. Für andere KI-Forscher gibt es mehr Daten und sie können nun die Ergebnisse von Pinkney nehmen und darauf aufbauen.
Auf der anderen Seite kann die KI aber auch verwendet werden, um gewalttätige oder sexuelle Bilder zu generieren. Das Thema Deep Fake und Falschinformationen dürfen wir dabei auch nicht vergessen. Wenn ihr mehr darüber wissen wollt, solltet ihr euch den Beitrag bei den Kollegen von The Verge durchlesen. In dem geht das Team hinter Stable Diffusion im Detail darauf ein, welche Kompromisse sie bei der Veröffentlichung ihres Tools machen mussten.
Lasst uns gerne mal in den Kommentaren wissen, was ihr von der KI haltet und postet uns in den sozialen Netzwerken gerne eure Kreationen. Wir sind gespannt.
Quelle & Bilder: Text-to-Pokémon (replicate.com)