Das unsichtbare SynthID-Wasserzeichen von Google erkennt jetzt KI-generierte Texte und Videos, ist jedoch weniger erkennbar, wenn der Text vollständig neu geschrieben oder übersetzt wurde

-

Google erweitert seine Technologie zur Inhaltserkennung und Wasserzeichenmarkierung auf zwei neue Medien. Die neue Version des SynthID-Wasserzeichendrucksystems kann jetzt Videos und Texte markieren, die von Googles Gemini-KI-Programmen digital in der Gemini-App oder im Web generiert wurden. Bisher erlaubte das SynthID-Tool nur das Wasserzeichen von Bildern und Tönen, die von Googles KI generiert wurden. Die Software wird dazu beitragen, Bedenken hinsichtlich des Einflusses von KI-generierten Inhalten bei Wahlen auszuräumen. OpenAI hat kürzlich auch ein Tool auf den Markt gebracht, mit dem Bilder erkannt werden können, die mit seiner DALL-E 3-Software erstellt wurden.

Da KI-generierte Inhalte das Internet zu überfluten beginnen, ist die Notwendigkeit, diese zu erkennen und zu unterscheiden, gestiegen. Eine der wichtigsten Lösungen, die Unternehmen erforschen, ist das Anbringen von Wasserzeichen. Das Wasserzeichen von KI-generierten Inhalten wird mit zunehmender Beliebtheit der Technologie immer wichtiger, insbesondere wenn KI für böswillige Zwecke eingesetzt wird. KI wird bereits eingesetzt, um politische Fehlinformationen zu generieren und zu verbreiten, so zu tun, als hätte jemand etwas gesagt, was er nicht gesagt hat, und um ohne deren Zustimmung sexuelle Inhalte von Prominenten zu erstellen.

Allerdings waren Wasserzeichen-Tools für Bilder viel einfacher zu entwickeln als für Text. Am Dienstag betrat Demis Hassabis, CEO von Google DeepMind, zum ersten Mal die Bühne der Google I/O-Entwicklerkonferenz, um nicht nur über die neuen KI-Tools des Teams wie den Veo-Videogenerator, sondern auch über das neue SynthID-Wasserzeichendrucksystem zu sprechen. Dieses System kann nun sowohl digital generierte Videos als auch KI-generierten Text markieren. Hassabis lieferte nur wenige Informationen über das Tool, in einem Blogbeitrag des Unternehmens heißt es jedoch:

Gesendet von Google DeepMind

Heute erweitern wir die Fähigkeiten von SynthID, um KI-generierten Text in der Gemini-App und im Web-Erlebnis sowie Videos in Veo, unserem leistungsstärksten generativen Videomodell, mit Wasserzeichen zu versehen.

SynthID for Text ist so konzipiert, dass es die meisten verfügbaren KI-Textgenerierungsmodelle ergänzt und in großem Maßstab eingesetzt werden kann, während SynthID for Video unsere Bild- und Audio-Tagging-Methode nutzt, um alle Bilder in die generierten Videos einzubinden. Mit dieser innovativen Methode können Sie ein nicht wahrnehmbares Wasserzeichen einbetten, ohne die Qualität, Genauigkeit, Kreativität oder Geschwindigkeit des Text- oder Videoerstellungsprozesses zu beeinträchtigen.

Für Bilder gibt Google an, das SynthID-Wasserzeichen so konzipiert zu haben, dass es auch dann erkennbar bleibt, wenn sie durch Hinzufügen von Filtern, Ändern von Farben oder Anpassen der Helligkeit geändert wurden. Und im Gegensatz zu sichtbaren Wasserzeichen kann SynthID nicht durch Zuschneiden entfernt werden. Was Textinhalte betrifft, erklärt Google DeepMind kurz, dass die Funktionsweise von SynthID darauf basiert, wie große Sprachmodelle (LLM) Inhalte generieren. LLMs sagen die nächste Phrase, das nächste Wort oder das nächste Zeichen basierend auf dem voraus, was am wahrscheinlichsten in der Sequenz vorkommt.

LLMs generieren Textsequenzen basierend auf einer Frage wie „Erklären Sie mir die Quantenmechanik, als wäre ich fünf Jahre alt“ oder „Was ist Ihre Lieblingsfrucht?“. Phrasen, Wörter und Zeichen werden „Tokens“ genannt und jedem Token wird eine Wahrscheinlichkeitsbewertung zugewiesen. Google DeepMind erklärt:

Zitat Gesendet von Google DeepMind

Token sind die Bausteine, die ein generatives Modell zur Verarbeitung von Informationen verwendet. Dabei kann es sich um ein einzelnes Zeichen, ein Wort oder einen Satzteil handeln. Jedem möglichen Token wird eine Punktzahl zugewiesen, die die prozentuale Chance darstellt, dass es der richtige ist. Es ist wahrscheinlicher, dass Token mit einer höheren Punktzahl verwendet werden. LLMs wiederholen diese Schritte, um eine kohärente Antwort zu erstellen.

SynthID wurde entwickelt, um nicht wahrnehmbare Wasserzeichen direkt in den Textgenerierungsprozess einzubetten. Zu diesem Zweck werden zusätzliche Informationen in die Verteilung der Token zum Zeitpunkt der Generierung eingebracht, indem die Wahrscheinlichkeit der Token-Generierung moduliert wird. Und das alles ohne Kompromisse bei der Qualität, Genauigkeit, Kreativität oder Geschwindigkeit der Textgenerierung.

Pushmeet Kohli, Vizepräsident für Forschung bei Google DeepMind, präzisiert: „Hier geht es konkret darum, die durch KI generierten Inhalte so zu modifizieren, dass sie auch in Zukunft auffindbar bleiben.“ Obwohl Google behauptet, dass „SynthID für Text mit den meisten textgenerierenden KI-Modellen kompatibel ist“, bleibt abzuwarten, ob seine Konkurrenten, darunter OpenAI, Microsoft und Meta, es übernehmen oder eigene Ansätze entwickeln werden. Im Februar gab Meta bekannt, dass das Unternehmen damit beginnen wird, Bilder zu kennzeichnen, die von KI-Modellen von Konkurrenten wie OpenAI, Google, Midjourney, Adobe und vielen anderen generiert wurden.

Meta forderte außerdem die Einführung von Standards zur Kennzeichnung von KI-generiertem Material. Nick Clegg, Präsident für globale Angelegenheiten bei Meta, sagte, der Social-Media-Riese arbeite mit verschiedenen Organisationen zusammen, darunter der AI Partnership (einer gemeinnützigen Organisation, die sich aus Akademikern, Fachleuten der Zivilgesellschaft und Medienorganisationen zusammensetzt). sicherzustellen, dass KI positive Ergebnisse für Menschen und Gesellschaft hat), um Standards zu entwickeln, die zur Identifizierung von KI-Bildern im gesamten Web verwendet werden können. Auch OpenAI arbeitet an ähnlichen Tools.

OpenAI hat Anfang dieses Monats ein Tool auf den Markt gebracht, das Bilder erkennen kann, die von seinem bildgenerierenden KI-Modell DALL-E 3 generiert wurden, um Bedenken hinsichtlich des Einflusses von KI-generierten Inhalten auf Wahlen auszuräumen. Das Unternehmen gab an, dass das Tool die von DALL-E 3 erstellten Bilder in internen Tests in etwa 98 Prozent der Fälle korrekt erkannte und häufige Bearbeitungen wie Komprimierung, Zuschneiden und Formatänderungen mit minimalen Auswirkungen bewältigen konnte. OpenAI plant, ein manipulationssicheres Wasserzeichen hinzuzufügen, um KI-generierte Fotos oder Audios zu kennzeichnen.

Wasserzeichen sind immer noch begrenzt und können durch die Kombination verschiedener Techniken entfernt werden. Google DeepMind sagt, dass KI-generierter Text mit seinem Wasserzeichen auch bei „leichter Paraphrasierung“ erkannt werden kann, das Wasserzeichen jedoch weniger erkennbar ist, wenn der Inhalt vollständig neu geschrieben oder übersetzt wurde. SynthID für Text ist auch für Sachdokumente weniger effektiv, wenn es nur wenige mögliche Antworten auf eine bestimmte Frage gibt. Das Unternehmen plant, die Wasserzeichentechnik irgendwann in diesem Sommer als Open Source bereitzustellen, damit andere sie in ihre Dienste integrieren können.

SynthID ist kein Allheilmittel zur Identifizierung von KI-erstellten Inhalten, aber es ist ein wichtiger Bestandteil der Entwicklung zuverlässigerer KI-Identifizierungstools und kann Millionen von Menschen dabei helfen, fundierte Entscheidungen darüber zu treffen, wie sie mit von KI generierten Inhalten interagieren. „Irgendwann in diesem Sommer planen wir, SynthID für Textwasserzeichen als Open-Source-Lösung bereitzustellen, damit Entwickler diese Technologie nutzen und in ihre Modelle integrieren können“, sagt Google DeepMind.

Quelle: Google DeepMind

Und du ?

Was ist Ihre Meinung zu diesem Thema?

Was halten Sie von der neuen Version des SynthID-Wasserzeichen-Tools?

Wird es gegen KI-Missbrauch wirksam sein? Was denken Sie über die Einschränkungen von SynthID?

Siehe auch

Google bettet unhörbare Wasserzeichen namens SynthID in seine KI-generierte Musik ein, Fälschungsschutz soll die Privatsphäre der Nutzer nicht gefährden

Meta wird mit der Kennzeichnung von Bildern beginnen, die von KI-Modellen von Unternehmen wie OpenAI und Google generiert wurden, und fordert die Einführung von Standards zur Kennzeichnung von KI-generiertem Material

OpenAI wird den von DALL-E 3 generierten Bildern bald Wasserzeichen hinzufügen. Laut OpenAI ist die Einführung von C2PA-Standards unerlässlich, um die Zuverlässigkeit digitaler Informationen zu erhöhen

-

PREV Schnäppchen – Der „5-Sterne“-Fernseher LG 65G3 für 1.966,00 € (-11 %)
NEXT Netflix trifft eine weitere Entscheidung, die seine Abonnenten bestraft