„Erstaunlich“, „magisch“ … In den sozialen Netzwerken gibt es viele Superlative, um NotebookLM zu beschreiben, ein Tool, das vor einem Jahr in den Google Labs-Labors geboren wurde und seit seinem jüngsten Update online für Aufsehen sorgt. Ein KI-Tool ermöglicht es erstmals, verschiedene Dokumente mit wenigen Klicks zu synthetisieren und vor allem in einen derzeit nur auf Englisch verfügbaren, etwa zehnminütigen Podcast mit einem Gespräch zwischen zwei virtuellen Moderatoren umzuwandeln .
Ergebnis: Internetnutzer haben Spaß daran, es für alle Arten von Inhalten zu nutzen, darunter technische Dokumente, ihr LinkedIn-Profil, einen Kontoauszug, einen Nachrichtenaustausch … Allerdings ist das Tool nicht fehlerfrei, aber wie bei ChatGPT in seinen Anfängen , es ist die atemberaubende Wirkung, die für den Moment im Vordergrund steht. Einige behaupten, dass „ Tiefe Tauchgänge “, so der Name dieser Gespräche, sind zu ihren Lieblings-Podcasts geworden. Ein willkommener viraler Effekt für Google, dem bislang ein großer Erfolg in der generativen KI fehlte.
Google hat (endlich) seinen ChatGPT-Moment mit seinem NoteBookLM-Podcast-Generator
Denken Sie daran: Als der OpenAI-Chatbot Ende 2022 gestartet wurde, löste Google den „Code Rot“ aus, das Äquivalent seines Feueralarms. Trotz seines Zuverlässigkeitsproblems im Zusammenhang mit den „Halluzinationen“ der generativen KI wurde ChatGPT von Anfang an als eine neue Möglichkeit zur Online-Suche nach Informationen angesehen. Genug, um Google ins Schwitzen zu bringen, das seit mehr als zwanzig Jahren das Monopol auf diesem Markt innehat.
Einer der technologischen Bausteine hinter ChatGPT wurde 2017 in den Labors des Webgiganten geboren. Doch es war ein anderes Unternehmen, OpenAI, das es schaffte, es zu einem weit verbreiteten Produkt zu machen. Sicherlich hat Google versucht, mit seinem Herausforderer gleichzuziehen, indem es sein eigenes großes Sprachmodell (LLM), Gemini, entwickelte und es in seine Suchmaschine integrierte. In rund hundert Ländern zwingt diese KI den Nutzern KI-generierte Zusammenfassungen ihrer Abfragen auf. Doch weit davon entfernt, Begeisterung hervorzurufen, erntet AI Overviews vor allem Spott wegen seiner Fehler und Absurditäten. Und letztendlich war es das experimentellere NotebookLM, das Lob erregte, obwohl es weit von den Nutzungsaufzeichnungen von ChatGPT in seinen Anfängen entfernt ist. Raiza Martin, Produktmanagerin des rund zehnköpfigen Teams hinter dem Tool, erklärt Die Tribüne die Entstehung und Zukunft dieses Projekts.
KI-Wettlauf: Google arbeitet hart daran, mit OpenAI und Microsoft gleichzuziehen
LA TRIBUNE – Was ist der Ursprung von NotebookLM?
Raiza MARTIN – Es begann mit einer allgemeinen Anfrage von Josh Woodward, dem Leiter von Google Labs. Er sagte mir: „Stellen Sie sich ein Produkt vor, das auf KI basiert und auf dem wir ein echtes Wirtschaftsmodell aufbauen könnten. » Damals arbeitete ich mit einem Ingenieur, Adam Bignell, zusammen, der eine Technologie namens „Talk to Small Corpus“ entwickelte. [littéralement, « parler à des petits corpus de texte », Ndlr]. Heute wissen wir, dass KIs, insbesondere große Sprachmodelle (LLM), sehr effizient bei der Verarbeitung von Datensätzen sind, insbesondere von Textdaten.
Die Idee war daher, KI für die Interaktion mit Texten zu nutzen. Genauer gesagt bot der Ausgangspunkt einer bestimmten Quelle einen völlig anderen Kontext als ein einfaches Gespräch mit einem Model. Das ist die große Innovation von NotebookLM: Ausgehend von den vom Benutzer bereitgestellten Inhalten (ein Dokument, ein Stapel Folien usw.) und deren Diskussion mit der KI.
OpenAI hat gerade Search GPT gestartet, eine Suchmaschine, deren Ziel es ist, Google zu entthronen. Warum konzentrieren Sie Ihre Bemühungen nicht auf das Kerngeschäft von Google, die Online-Suche, um dieser neuen Konkurrenz standzuhalten, anstatt ein Produkt zu entwickeln, das so anders ist?
Raiza MARTIN – Wir haben über die „Routine“ einer Person nachgedacht, die mit einem Computer arbeitet. Manchmal suchen wir nach Quellen, was klassische Recherche ist. Doch oft kommt die Herausforderung erst im Nachhinein: „Ich habe meine Quellen gefunden. Was tun jetzt damit? » NotebookLM befindet sich genau in dieser Zone. Google zeichnet sich durch die Suche aus. Wir haben uns daher entschieden, an dem zu arbeiten, was als nächstes passiert: Lesen, Denken, Ideen extrahieren, einen Standpunkt strukturieren … Mit der Einführung von LLMs haben sich diese traditionellen Prozesse enorm weiterentwickelt. Das eröffnet neue Möglichkeiten.
OpenAI stellt seine Suchmaschine vor, ein Tool, das mit Google konkurrieren soll
Der Erfolg von NotebookLM hängt hauptsächlich mit der Audioübersicht zusammen, einer Funktion, die es Ihnen ermöglicht, einen virtuellen Podcast zu erstellen, in dem zwei Moderatoren ein Thema zusammenfassen und diskutieren. Warum dieses Format?
Vor der Audioaufnahme haben wir Funktionen wie das Schreiben von Dokumenten, das Erstellen von Folien oder das Schreiben von E-Mails erkundet. Doch all dies blieb Text und veränderte die Art der Interaktion mit der KI nicht grundlegend. Allerdings lernen und konsumieren Menschen Informationen auf sehr unterschiedliche Weise. Eine der ersten Funktionen von NotebookLM, die Erstellung von Zusammenfassungen, war von Anfang an äußerst erfolgreich. Heutzutage möchte jeder eine Zusammenfassung von etwas.
Also haben wir natürlich an das Audioformat gedacht. Und wir wollten mit Text-to-Speech über das bloße Lesen von Texten hinausgehen, was oft etwas langweilig ist. Unser Ziel war es, diese Funktionalität nützlich, angenehm und innovativ zu machen.
Einige Beobachter sagen, dass dies für Google eine Art „ChatGPT“-Moment ist. Haben Sie mit diesem Erfolg gerechnet?
Ich hätte nicht gedacht, dass es so groß werden würde. Das Faszinierende ist, dass Benutzer NotebookLM sofort mit allen Arten von Inhalten ausprobieren möchten. Für mich ist das ein klares Zeichen seines Potenzials.
Hat NotebookLM das Potenzial, wirklich ein Mainstream-Tool zu werden? Ist es nicht eher Leuten vorbehalten, die es gewohnt sind, mit Dokumenten zu arbeiten, etwa Forschern oder Journalisten?
Wir teilen die Anzahl der aktiven Benutzer nicht mit, aber die Nutzung des Tools hat sich innerhalb eines Monats mehr als verzehnfacht. Am Anfang waren unsere Nutzer vor allem Schüler und Lehrer, die oft die ersten waren, die neue Technologien einführten. Einige tauschen Vorschläge aus, es mit NotebookLM zu versuchen, um ihnen bei ihren Überarbeitungen zu helfen. Aber sie sind nicht mehr die Einzigen.
Heutzutage sind mehr als die Hälfte unserer Benutzer Profis und werden von Vertriebsmitarbeitern, aber auch von Personen, die im Finanzwesen arbeiten, stark angenommen. NotebookLM bleibt für jeden relevant, der am Computer arbeitet.
Planen Sie, NotebookLM in die Startseite der Google-Suche zu integrieren oder es zu monetarisieren?
NotebookLM ist derzeit ein unabhängiger Dienst. Wir haben kürzlich „NotebookLM Business“ eingeführt, das von über 80.000 Unternehmen aktiv genutzt wird. Da es sich um ein Pilotprojekt mit Early Access handelt, zahlen sie noch nicht.
Bedeutet der Erfolg von NotebookLM – der mehr mit dem Format als mit der Leistung des Modells selbst zu tun hat –, dass die KI-Leistung nicht mehr im Vordergrund steht? Und dass wir uns auf die Verwendung konzentrieren sollten?
Diese beiden Aspekte schreiten parallel voran. Modellfähigkeiten sind von entscheidender Bedeutung, aber auch die Umsetzung in nützliche Produkte für Benutzer. Das eine kann ohne das andere nicht existieren.
Von Marine Protais gesammelte Kommentare