Deep Fakes in Echtzeit
Deep Fakes sind auf Basis künstlicher Intelligenz erstellte Fälschungen von Bildern oder Videos, in der Regel werden Gesichter ausgetauscht. Somit entsteht die Illusion, eine andere Person in einem Video zu sehen. Als Forschungsprojekt hat sich das TNG Innovation Hacking Team das Ziel gesetzt, besser zu verstehen, was bei Deep Fakes technisch möglich ist. Darüber hinaus wollten wir herausfinden, wo deren Grenzen liegen - insbesondere inwieweit und mit welcher Bildqualität es möglich ist, solche Deep Fakes in Echtzeit zu erzeugen.
Als Ergebnis unserer Forschung können wir tatsächlich in einem von einer Kamera aufgenommenen Video-Stream in Echtzeit das Gesicht der gefilmten Person durch das Gesicht einer anderen Person ersetzen und dabei die Mimik und Bewegungen der ursprünglichen Person übernehmen.
Wir verwenden dazu verschiedene Techniken aus dem Bereich der Computer Vision und der neuronalen Netze, um Gesichter in der Videoeingabe zu erkennen, zu übersetzen und zurück in die Videoausgabe zu integrieren. Zum Einsatz kamen in dem Projekt in Keras trainierte Autoencoder-Netze. Trainiert wurden diese mittels sogenannter GANs (Generative Adversarial Networks), die auch gleichzeitig die Erkennung von Fälschungen ermöglichen. Zusätzlich verwenden wir verschiedene andere neuronale Netze zur Gesichtserkennung und Gesichtssegmentierung.