DayFR Deutsch

ein Launchpad für traditionelle und generative KI

-

Mit dieser Methode können Sie Trainingsdatensätze nach Wunsch erstellen. Dies stellt einen erheblichen Vorteil in Bereichen dar, in denen Lerndaten knapp sind.

Die generative KI hat eine neue Kategorie von Trainingsdatensätzen hervorgebracht: synthetische Daten. Foundation-Modelle ermöglichen es, von einer kleinen Anzahl von Beispielen auszugehen, um deren Volumen künstlich zu vergrößern, um andere Modelle zu beliefern, die ohne dieses Geschick nicht das Licht der Welt erblicken könnten. „Dieser Gedanke wurde 2023 vom KI-Labor der Stanford University hervorgehoben“, erinnert sich Stéphane Roder, CEO des französischen Beratungsunternehmens AI Builders.

Synthetische KI kann zunächst beim maschinellen Lernen eingesetzt werden. Nach Vapniks Prinzip gilt: Je komplexer ein traditionelles KI-Modell ist, desto mehr Trainingsdaten werden benötigt. Ohne ausreichende Informationen wird er nicht in der Lage sein, zu verallgemeinern, und seine Antworten werden sich als entwürdigend erweisen. „Aber sehr oft werden wir mit dem Problem konfrontiert. Und das aus mehreren Gründen. In vielen Fällen verfügen wir nur über ein sehr begrenztes Datenvolumen. Möglicherweise sind sie auch von schlechter Qualität oder zu alt. Manchmal haben wir keine Berechtigung, sie zu verwenden, da diese Informationen nicht anonymisiert sind“, sagt Didier Gaultier, Leiter KI bei Orange Business Digital Services.

Ein Hebel für Deep Learning

Besonders interessant ist der synthetische KI-Ansatz für das Training von Deep-Learning-Modellen. Komplexe neuronale Netze, die auch generativen KI-Technologien ähneln, auch wenn sich Datenwissenschaftler einig sind, dass diese Technologie weiterhin dem Bereich der traditionellen KI zugeordnet bleibt. „Im Bereich der Bilderkennung beispielsweise wird es notwendig sein, Tausende von Bildern zu verwenden, um diese Art von Modellen zu trainieren. Und natürlich wird es ziemlich selten sein, solche Inhalte zur Hand zu haben“, gibt Didier Gaultier zu.

Im Rahmen eines Projekts für eine NGO, deren Aufgabe die Wiederaufforstung von Korallenmassiven ist, implementierte Orange ein künstliches neuronales Netzwerk, das darauf abzielt, bestimmte Fischarten mithilfe einer Unterwasserkamera zu erkennen. Ziel: Überprüfung, ob innerhalb der Zielarten tatsächlich Wildtiere wachsen. „Der ersten implementierten KI gelang es, die Fische zu zählen, sie aber nicht zu erkennen, da das zugrunde liegende Deep-Learning-Modell nicht ausreichend trainiert war“, erklärt Didier Gaultier.

„Wir können von ein paar Autos unterschiedlicher Marken mit ihren Spezifikationen ausgehen und dann einen Datensatz mit mehreren tausend Bildern generieren“

Wie ist Orange Business vorgegangen? Das ESN nutzte einen Bildgenerator, der auf Fotos der wichtigsten Zielgebiete basierte. Ein Generator, der diese Fotos vervielfachte, indem er die Fische in allen möglichen Positionen und Morphologien zeigte. „Wir haben Zehntausende Bilder erhalten, die es uns ermöglichten, das neuronale Netzwerk neu zu trainieren. Am Ende konnte die KI alle gesuchten Fischkategorien erkennen“, unterstreicht Didier Gaultier.

Einer der Hauptvorteile der synthetischen KI ist die Vermeidung der manuellen Beschriftung von Bildern. Im Fall der Autoerkennung könnten wir beispielsweise mit der gleichen Logik von einigen Autos unterschiedlicher Marken und ihren Spezifikationen ausgehen und dann einen Datensatz mit mehreren tausend Bildern generieren, der auf Basis der Ausgangsinformationen korrekt getaggt wird. Um dieses Ergebnis zu erzielen, variieren wir die Aufnahmewinkel, aber auch die Wetterbedingungen. Stéphane Roder wägt ab: „Die Qualität manuell gelabelter Daten ist allerdings nicht zu erreichen.“

Synthetische KI kann auch auf tabellarische Daten angewendet werden. Diese Methode erfordert jedoch viel mehr Wachsamkeit. „Der Rückgriff auf eine mathematische Regel führt tatsächlich wahrscheinlich zu Verzerrungen oder Korrelationen, die in den Originaldaten nicht vorhanden waren. Daher müssen ausgewiesene Datenwissenschaftler oder sogar Statistiker hinzugezogen werden, um die korrekte Umsetzung des Prozesses zu überprüfen“, warnt Didier Gaultier.

Vom Bild zum Ton

Synthetische KI findet auch im Bereich Video und Ton Anwendung. So können Stimmdaten beispielsweise in Text umformuliert werden, der an das geschriebene Format angepasst ist. Und umgekehrt. Konvertierungen, die ohne die Intervention eines großen multimodalen Modells nicht möglich sind. Dieser Anwendungsfall ist besonders interessant für die Erstellung von Textdatensätzen aus Contact-Center-Aufzeichnungen und umgekehrt, um beispielsweise einen Audio-Chatbot mithilfe von Textdaten aus einer Kundendatenbank zu trainieren.

„Es ist mehr als wahrscheinlich, dass OpenAI Daten von YouTube verwendet hat, um GPT4-o zu trainieren, sowohl in seiner Audioversion als auch in seiner Textversion. Für Letzteres wurde zuvor die Audiospur des Video-Social-Networks in Text umgewandelt, was eine Erweiterung der Lerndaten ermöglichte“, erläutert Didier Gaultier. Und der Berater kommt zu dem Schluss: „Mit synthetischer KI werden Unternehmen erkennen, dass sie über Goldminen an Daten verfügen, die in ihrem ursprünglichen Format nicht verwertbar sind, die aber dank generativer KI im Herzen der Anwendungen genutzt werden können.“

Related News :