Stellen Sie sich einen kleinen Assistenten vor, der immer an Ihrer Seite ist. Eine Art Jiminy Cricket der Zukunft, der Ihre Fragen beantwortet, Ratschläge gibt und vor allem an Ihrer Stelle handelt. Es greift auf Ihren Kalender, Ihre Gespräche, Ihre Lieblingsanwendungen zu … Eine unbeantwortete E-Mail? Er schreibt und versendet. Wurden die Zähne Ihres Jüngsten seit einem Jahr nicht mehr kontrolliert? Er macht einen Termin. Hat Ihr Paar Schuhe über eine App einen Käufer gefunden? Er bestätigt die Sache. Praktisch, wenn auch etwas beunruhigend.
Stärker als Chatbots wie ChatGPT und seine 200 Millionen aktiven Benutzer pro Monat, hier sind die „Agenten“. Ihr Versprechen: Inhalte nicht einfach aus einer einfachen Anleitung heraus zu produzieren, sondern autonom zu handeln. „Wir kehren von der Illusion zurück, dass große Sprachmodelle, diese KIs, die auf enorme Textmengen trainiert wurden, um menschenähnliche Antworten zu erzeugen, über Wissen über die Welt verfügen“, cbestätigt Pierre-Carl Langlais, Forscher und Mitbegründer des Startups Pleias, das Open-Source-Sprachmodelle entwickelt, also frei zugänglich. Dank der „Agenten“ werden wir in eine neue Ära geführt. Das einer proaktiven KI, die in der Lage ist, selbst zu denken und zu organisieren.
Mit seinen „Agenten“ behauptet Salesforce, das Unternehmen zu sein, das KI profitabel machen wird
Neue Interaktionen
Von Google über OpenAI bis hin zu Meta beschäftigen sich alle Akteure der Branche mit dieser neuen Generation künstlicher Intelligenz. Aber im Moment versuchen alle herauszufinden, wie dieser Jiminy Cricket aussieht. Insbesondere OpenAI und Meta wollen Multitasking- und allgemeine Systeme schaffen. Für andere, wie die französischen Unternehmen LightOn und H oder den amerikanischen Softwareriesen Salesforce, ist es besser „Agenten“ hyperspezialisiert auf bestimmte Aufgaben. Weniger allmächtig, aber einfacher umzusetzen.
Die Schwierigkeit besteht auch darin, herauszufinden, wie wir sie angehen. In den letzten Wochen ist es ein Audioformat, das herausragt. Das Tool stammt von Google und heißt NoteBookLM. Die neue Funktion „Audio Overview“, die Dokumente mit wenigen Klicks synthetisiert und in einen zehnminütigen Podcast umwandelt, hat die KI-Community in Erstaunen versetzt. Die beiden virtuellen Moderatoren sprechen immer mit einem warmen und enthusiastischen Ton über alles: einen 250-seitigen Bericht über die Umwelt, einen sehr ausführlichen wissenschaftlichen Artikel, ein zweistündiges YouTube-Video … Aber auch über alles andere, das trivialer ist Dokument wie ein LinkedIn-Profil, SMS-Austausch oder sogar ein Kontoauszug [sic]. Die Experimente einiger Internetnutzer gingen viral und wurden millionenfach geteilt.
Mit seinen „Agenten“ behauptet Salesforce, das Unternehmen zu sein, das KI profitabel machen wird
Wenn NoteBookLM kein Agent ist, zeugt sein Erfolg vom wachsenden Interesse an neuen Interaktionen mit der Maschine, die über Text und Schreiben hinausgehen. Dies war auch das Ziel des kleinen Google Lab-Teams. Raiza Martin, die Produktmanagerin dieses experimentellen Projekts, das Google nun vermarkten möchte, bestätigt dies Die Tribüne. „Unser Ziel war es, Benutzern bei der Interaktion mit Quellen zu helfen. Audio war ein guter Vektor, aber eine von einer synthetischen Stimme vorgelesene Zusammenfassung reicht nicht aus. Wir wollten etwas Schönes, Nützliches und Neues schaffen.“
Technologieunternehmen sind auch daran interessiert, wie sie der generativen KI Argumentations- und Planungsfähigkeiten hinzufügen können. Grundlegende Fähigkeiten, um diese berühmten „Agenten“ erschaffen zu können. Im September stellte OpenAI seine neue Familie von KI-Modellen vor, die „o1“ heißt, weil sie „die Zähler auf Null zurücksetzt“. Sie ist in der Lage, besser zu argumentieren als die heutige KI, indem sie „Gedankenketten“ organisiert, bevor sie reagiert, das heißt, indem sie ihre Reaktion auf das gestellte Problem in Phasen unterteilt.
o1 ist ein erster Schritt in Richtung der von der Industrie versprochenen KI-Autonomie. Mark Zuckerberg, der Gründer und Direktor von Meta, spricht von einer Zukunft, in der jeder Content-Ersteller auf Instagram seinen eigenen „Agenten“ haben könnte, der die Interaktionen mit seiner Community für ihn verwalten könnte. Anthropic, der von zwei ehemaligen OpenAI-Mitarbeitern gegründete amerikanische Außenseiter, beeindruckte kürzlich mit der Demonstration einer KI, die in der Lage ist, einen Computer autonom zu nutzen. Für die breite Öffentlichkeit sieht das Video wie nichts weiter als unregelmäßige Mausklicks aus. Für Spezialisten ist diese Funktionalität namens „Computernutzung“ jedoch ein wesentlicher Schritt. „Dieser iterative Prozess von Versuch und Irrtum, der durch die Interaktion mit dem Computer ermöglicht wird, ermöglicht es der KI, aus ihren eigenen Erfahrungen zu lernen.“ bemerkt Edouard Grave, Forscher und Mitbegründer des französischen Labors Kyutai.
Wenn die Branche nach neuen Impulsen sucht, liegt das unter anderem daran, dass „derzeit ein Wind der Ernüchterung weht“, gibt Sylvain Duranton zu, Direktor von BCG X, der Tech-Einheit des Beratungsunternehmens. Vor allem bei Unternehmen, die stark an die Superkräfte großer Sprachmodelle zur Leistungssteigerung glaubten und letztendlich enttäuscht wurden. Laut verschiedenen Studien des Beratungsunternehmens sehen zwei Drittel der Unternehmen keine Ergebnisse, nachdem sie in generative künstliche Intelligenz investiert haben.
Generative KI in der Wirtschaft, Gebrauchsanweisung
„Die Unternehmen waren nicht bereit, sie haben den Vorbereitungsaufwand unterschätzt“, sagt Sylvain Duranton. Um die Technologie wirklich auszunutzen, müssen Sie Ihre Arbeitsweise ändern, das ist keine Zauberei. Wir müssen bestimmte Prozesse komplett überprüfen und Unternehmensdaten bereinigen.“urteilt er. Den wenigen Unternehmen, die diese Anstrengungen unternommen haben, gelingt es, davon zu profitieren, unter anderem in den Bereichen Vertrieb, Marketing und Supply Chain Management. [voir plus bas, Ndlr]. Einige würden laut BCG X sogar „Dutzende Millionen Euro an Marge“ verdienen.
Ein zukünftiger virtueller Kollege
Emilie Sidiqian, General Managerin von Salesforce France (Lesen Sie das Interview auf Seite V) bestätigt auch diese Phase der Ernüchterung in der Fachwelt. Aktuelle Chatbots seien für sie „enttäuschend“, weil diese meist nur E-Mails schreiben und über Meetings berichten. Im Gegenteil, die „Agenten“ versprechen, ein quasi-virtueller Kollege zu werden, der auf einen Kunden eingehen, ihn anleiten, Ziele setzen und diese umsetzen kann. Aber Sylvain Duranton warnt: Der Einsatz von „Agenten“ wird nicht ohne Zusammenstöße erfolgen. „Nur weil sich die Technologie verbessert, heißt das nicht, dass Unternehmen besser vorbereitet sind.“ er warnt.
Für einige Beobachter sind die Grenzen nicht nur organisatorischer, sondern auch technologischer und ökologischer Natur. „Es wird immer komplizierter, Sprachmodelle weiterzuentwickeln, ohne die Grenzen unseres Energieverbrauchs zu überschreiten.“ Punkte Edouard Grave. Der Forscher erwähnt auch eine weitere gläserne Decke: die der zugänglichen Daten. Dass ChatGPT und seine Freunde bei bestimmten Aufgaben so gut abschneiden, liegt daran, dass sie alle Textdaten aus dem Web aufnehmen konnten. Dies reicht jedoch nicht aus, um weiter zu gehen, insbesondere in Richtung eines feineren und fachkundigeren Wissens. „Der Erhalt qualitativ hochwertiger Daten ist ein langer und teurer Prozess, da er menschliche Anmerkungen erfordert. bemerkt Edouard Grave. Um beispielsweise einen KI-Experten für Mathematik zu erstellen, „Wissenschaftler müssten aufgefordert werden, eine große Anzahl von Problemen und Lösungen zu erstellen, um sie den Modellen zu unterwerfen“, er präzisiert.
Darüber hinaus fehlt Sprachmodellen der Kontakt zur Außenwelt, um wirklich autonom zu werden. „Ihre Grenzen sind ihre Fehler, ihre Absurditäten, kurz gesagt ihre mangelnde Übereinstimmung mit der physischen Welt.“ schätzt Pierre-Yves Oudeyer, Forschungsdirektor bei Inria. Seiner Meinung nach liegt einer der Schlüssel darin, sie in einer externen Umgebung zu verankern. Indem man sie wie Anthropic mit einem Computer verbindet, aber auch über einen Roboter mit der physischen Welt verbindet. In seinem Labor versuchen der Forscher und seine Kollegen sogar, Maschinen eine Art Neugier zu vermitteln. „Die Idee ist, dass die KI sich interessante Ziele setzt“eine intrinsische Motivation, die sie dazu bringen würde, sich für ihre Umgebung zu interessieren.
Dafür interessiert sich sein Team für die Funktionsweise des menschlichen Gehirns. „Untersuchungen zeigen, dass wir am besten lernen, wenn ein Thema anfangs komplex ist, sich aber mit der Zeit weiterentwickelt. Wenn das Thema zu einfach oder zu schwierig ist, verlieren wir das Interesse. » Dieser auf Maschinen angewendete Mechanismus könnte es ihnen ermöglichen, autonomer zu werden.
„Der Einsatz von KI ist eine Frage von Leben und Tod für ein Unternehmen“ (Emilie Sidiqian, Frankreich-Direktorin von Salesforce)
„Agenten“, die in der Lage sind, zu argumentieren, kündigen das ungewissere Aufkommen von Superintelligenzen oder sogar „künstlicher allgemeiner Intelligenz“ an. Diese Konzepte sind in der wissenschaftlichen Welt alles andere als einhellig, werden aber von Unternehmen bevorzugt. Sie bezeichnen KIs, die den Menschen in all ihren Fähigkeiten übertreffen. Um dies zu erreichen, müssen nach Ansicht von Edouard Grave viele technologische Hürden überwunden werden. Der Forscher bezweifelt wie andere, dass generative KI ausreicht, um Superintelligenz zu schaffen. „Aber es ist unmöglich, etwas mit Sicherheit vorherzusagen, er warnt. Wenn ich vor zwei Jahren vor den Fortschritten der Sprachmodelle und dem damit verbundenen Wettlauf um Rechenleistung gewarnt worden wäre, hätte ich es kaum glauben können.
Dieser Gral stößt auch an eine Grenze, vor der die künstliche Intelligenz bereits steht: planetarische Grenzen. (siehe Seite VI). Die Frage ist auch, ob dies wirklich das soziale Projekt ist, das wir wollen. Inwieweit sind wir bereit, unsere Arbeit, sogar unser tägliches Leben, an diese Agenten zu delegieren?