Was zur..? Google DeepMind: KI kann Videos aus einem Foto erstellen

Was zur..? Google DeepMind: KI kann Videos aus einem Foto erstellen

Künstliche Intelligenzen werden ihrem Namen immer gerechter. Gerade Google haut derzeit mit Superlativen nur so um sich. Eine neue KI des Unternehmens kann nun aus einem Bild ein Video erstellen.

Forscher finden immer neue Wege, um künstliche Intelligenzen zu verbessern. Nach beeindruckenden Bildgeneratoren wie Dall-E 2 oder Google-Sprachmodellen, die sich selbst als bewusst bezeichnen, kommt mit Transframer nun ein weiteres „Tool“ zustande. Zwar wirkt es auf den ersten Blick praktisch, aber irgendwo sind die Implikationen davon meist gruselig. 🙀🤖

Mittels neuronalem Netzwerk werden aus Fotos jeweils 30-sekündige Videos gemacht. Diese sind zwar noch stark verpixelt – und sehen aus wie YouTube im 144p-Modus – aber werden stetig besser.

Das Ganze basiert auf dem KI-Netzwerk DeepMind und macht sich das Prinzip des KI-basierten Sprachmodells „Transformer“ zu eigen. Letzteres wurde 2017 vorgestellt und konnte Texte anhand von Wortvergleichen weiterschreiben.

Transframer analysiert nun Fotos und kann durch eine fortgeschrittene Bilderkennung zusätzliche Bildbestandteile generieren. Hierbei wird auch das „Framing“ (also der Bildausschnitt) des jeweiligen Fotos identifiziert – und auf dieser Grundlage die weitere Umgebung hinzugefügt. Ein Fluss wird also weiter „gemalt“ oder ein Gebäude zu Ende „gebaut“.

Google Transframer: Nicht komplett neu, aber immer besser

GPU-Gigant Nvidia hat übrigens Ähnliches schon einmal in Form von Instant NeRF herausgebracht.


DATENSCHUTZHINWEIS: Dieses Video ist im erweiterten Datenschutzmodus von YouTube eingebunden. Durch den Klick auf das Wiedergabesymbol willige ich darin ein, dass eine Verbindung zu Google hergestellt wird und personenbezogene Daten an Google übertragen werden, die dieser Anbieter zur Analyse des Nutzerverhaltens oder zu Marketing-Zwecken nutzt. Weitere Infos hier.

Instant NeRF erstellt ebenfalls aus Fotos 3D-Szenen. Dafür werden allerdings mehrere Bilder benötigt. DeepMind bzw. Transframer arbeitet nur mit einem einzigen Foto als Basis.

Wir sehen also: Die Technik wird immer besser. Eines Tages könnte man sicherlich realistische Videos von Objekten, Umgebungen oder historischen Vorkommnissen erstellen. Und das nur anhand eines Fotos oder einer sprachlichen Vorgabe.

Warum das nun gruselig ist? Naja, wenn die realistisch-erscheinende „Video-Realität“ nicht mehr von der Wirklichkeit getrennt werden kann, haben wir womöglich ein Problem. Hoffen wir aber, dass es dann ebenfalls KIs gibt, die das Werk anderer KIs erkennen können – und schon haben wir den Plot für den nächsten Sci-Fi-Horror-Film.

Bevor wir euch aber in die dystopische Paranoia entlassen, wollen wir gerne von euch wissen, was ihr von DeepMind und Co. haltet? Lasst es uns im Kommentarbereich wissen.

Zum Shop: Smart Home (das euch – erstmal – nicht an den Kragen will)

via: TechSpot, Google DeepMind auf Twitter.com, Arxiv.org

Veröffentlicht von Clemens

Großer Film- und Serien-Fan, der von Antonioni bis Tarkowski (fast) alles gesehen hat, was Kino und Fernsehen hergeben. Durch Super Nintendo und PS1 fand er Mitte der 90er seine Leidenschaft für PC- und Konsolenspiele. Zockt mittlerweile vornehmlich am selbstgebauten Gaming-PC und gelegentlich auch auf der PlayStation.

Das könnte dich auch interessieren