• Frage: Wie kann man KI-generierte Reels erkennen?

    Frage gestellt drew27jet am 12 Jun 2024.
    • Foto: Christian Becker-Asano

      Christian Becker-Asano Beantwortet am 12 Jun 2024:


      KI-generierte Reels (oder alle anderen Videos, die durch moderne, generative KI erzeugt werden) haben das „Wettervorhersage“-Problem.

      Versuche einmal selbst, ausgehend von einem vorgegebenen, ersten Frame (Standbild eines Videos) und einem kurzen, beschreibenden Text das nächste Bild vorherzusagen bzw. es zu zeichnen. Das wird Dir vielleicht noch gelingen (mit viel Zeit, die Du dafür aufbringst), da sich von einem Frame zum nächsten nicht viel am Bild verändern kann (innerhalb von 40 Millisekunden des Films).
      Wenn Du aber dieses neue Bild als Grundlage für das nächste BIld nimmst, weicht das zweite Bild von Dir schon viel mehr vom Ursprungsbild ab und so weiter. Trotzdem wirst Du wahrscheinlich Dein Hintergrundwissen über die Bewegung von Objekten in der Welt nutzen, um zum Beispiel einen Apfel von Bild zu Bild weiter vom Baum nach unten zu bewegen, schließlich ist das zu erwarten aufgrund physikalischer Gesetze.

      Eine generative KI basiert nun auf Wahrscheinlichkeiten, die aus einer riesigen Menge an Videodaten errechnet und (etwas abstrahiert) abgespeichert wurden. Diese Wahrscheinlichkeiten beschreiben ein Video nicht nur von einem Bild zum nächsten, sondern zum Teil auch über mehrere Bilder hinweg. Allerdings (!) passiert dies auf Ebene der Pixel des Bildes und es gibt (bisher) nur Ansätze dafür, auch Physikwissen mit in diese Algorithmen zu integrieren.

      Nun zu Deiner Frage:
      Wie Du Dir nun vielleicht denken kannst, hast Du als Mensch mit einem Körper in der realen Welt (mit Augen, Ohren, Nase, und Tastsinn) viel abstrakteres Wissen über die Dinge und Abläufe der Umgebung. Du würdest kein Bild malen, auf dem Mensch plötzlich einen sechsten Finger hat, oder auf dem eine Lampe im Hintergrund plötzlich verschwindet.
      Der Computer hat aber keine Ahnung von der Kontinuität von Objekten und (in gewissem Sinne) konzentriert sich nur auf das Wesentliche, also den Vordergrund.
      Wenn Du aber auf Details im Hintergrund besonders gegen Ende eines Reels achtest, dann kannst Du oft erkennen, wenn es sich um ein Fake handelt.

    • Foto: Knut Linke

      Knut Linke Beantwortet am 12 Jun 2024:


      Das ist eine sehr gute Frage drew27jet.

      Zum einen hilft der gesunde Menschenverstand um Deepfakes oder KI-Reels zu erkennen.
      Man kann sich generell in der heutigen Zeit häufig diese Fragen stellen:
      – Ist das sinnvoll was ich dort sehen?
      – Kann das real sein, wenn es für mich sehr überraschend aussieht?

      Aber natürlich sind KI-Videos (aktuell) auch nicht perfekt.
      Wenn z. B. nur Bilder analysiert und animiert werden, fehlt es häufig an der Tiefe des Bildes.
      Ansonsten erkennt man AI Videos daran, dass z. B. Finger oder Zähne nicht richtig dargestellt werden (mehr Finger als natürlich oder die Zähne haben eine komische Form).

      Unter https://www.youtube.com/watch?v=BTfLq-XkO0w siehst du ein paar Videos, die per KI generiert wurden. Du siehst dort, wenn du genau hinschaust, dass z. B. die Fahrräder nicht richtig geradeausfahren, beim Essen kleine Teile des Essens verschwinden oder z. B. Beine beim laufen nicht 100% deutlich zu erkennen sind. Das sind z. T. Feinheiten, aber wenn man sich an diese Details gewöhnt, dann erkennt man KI-Videos recht schnell.

    • Foto: Clarissa Elisabeth Hohenwalde

      Clarissa Elisabeth Hohenwalde Beantwortet am 17 Jun 2024:


      Hallo drew27jet, meine Kollegen haben bereits sehr gute Antworten gegeben. Ich möchte nur noch ein paar kleine Punkte hinzufügen:

      Wir wissen aus der Forschung, dass Menschen ihre Fähigkeit, KI-generierte Inhalte zu erkennen, häufig überschätzen. Auch technisch kann man KI-Videos nicht mit Sicherheit erkennen. Trotzdem machen aktuelle KI-Videomodelle manchmal Fehler, die auf ein KI-generiertes Reel hinweisen können:
      – Objekte verschwinden plötzlich.
      – Schrift ist nicht leserlich oder es ergibt sich kein sinnvolles Wort (z.B. HAÖte statt Hotel).
      – Handlungen sind physikalisch nicht möglich (z.B. stimmt die Schwerkraft nicht).
      – Menschen haben nicht fünf Finger.
      – Unnatürlich klingende Stimme.

      Selbst wenn ein Reel keinen dieser offensichtlichen Fehler enthält, heißt das nicht automatisch, dass es echt ist. Ich denke, dass es deshalb besonders wichtig ist, sich mit der Quelle einer Nachricht auseinanderzusetzen. Genauso, wie man das auch tut, um Fake News zu erkennen. Schau dir für das Thema Fake News gerne mal die folgende Seite an:
      https://www.lmz-bw.de/medienbildung/themen-von-f-bis-z/hatespeech-und-fake-news/fake-news/wie-kann-man-fake-news-erkennen

      Hier kannst du in einem Spiel checken, wie gut du Fake News erkennst: https://swrfakefinder.de/

Kommentare