(San Francisco) OpenAI, der Erfinder von ChatGPT, hat am Donnerstag Operator auf den Markt gebracht, einen KI-Agenten (künstliche Intelligenz), der Online-Aufgaben für den Benutzer ausführen kann, wie zum Beispiel einen Urlaub planen, ein Restaurant reservieren oder Besorgungen erledigen, ein wichtiger Schritt in der Wettlauf um immer effizientere KI-Assistenten.
Gestern um 20:32 Uhr gepostet
Der Betreiber „verwendet seinen eigenen Browser“, er könne „eine Webseite betrachten, durch sie scrollen, auf Schaltflächen klicken“ und „Textfelder ausfüllen, wie es Menschen täglich tun“, erklärte das kalifornische Unternehmen in einer Pressemitteilung.
Die neue Funktion steht derzeit nur professionellen ChatGPT-Abonnenten zur Verfügung, um sie dank Feedback zu verbessern.
„Operator ist einer unserer ersten Agenten, also eine KI, die in der Lage ist, Aufgaben autonom für Sie auszuführen: Sie geben ihr eine Aufgabe und sie führt sie aus“, fasst OpenAI zusammen.
Die Explosion der generativen KI mit dem Erfolg von ChatGPT seit Ende 2022 hat einen hektischen Wettlauf um KI-Assistenten zwischen Technologiegiganten ausgelöst, die schnell Tools einsetzen, die in der Lage sind, Nachrichten zu schreiben, Fragen zu beantworten, Bilder zu generieren usw.
Der Heilige Gral des Silicon Valley sind KI-Agenten, wenn die Maschine zu einer Art allwissender Sekretärin wird, die jederzeit verfügbar ist und zahlreiche Aufgaben ausführen kann, vom Versenden von Nachrichten bis zum Einkaufen im Internet.
-In diesem Bereich ist OpenAI nicht der Schnellste, zumindest was die Bereitstellung angeht.
Operator ähnelt „Computer Use“, einer im Oktober von Anthropic eingeführten Funktion Start-up Rivale.
Computer Use ermöglicht Claude, der generativen KI-Schnittstelle von Anthropic, Computer wie einen Menschen zu nutzen, von der Auswahl von Schaltflächen über die Eingabe von Text bis hin zur Handhabung verschiedener Software.
Auch Google, das im Dezember Gemini 2.0, seine neue Familie generativer KI-Modelle, vorstellte, treibt komplexere Interaktionen mit der Technologie voran, sodass KI-Agenten autonom im Internet navigieren, zusätzliche Informationen online oder in einem Dokument suchen usw.
Alle Unternehmen geben an, dass KI-Assistenten unter der Aufsicht von Menschen agieren: Sie können zwar Produkte zum Kauf auf einer E-Commerce-Website auswählen, aber (noch) nicht auf den Bezahlknopf klicken.
Die Veröffentlichung von OpenAI enthält ein Video, das zeigt, wie Operator funktioniert. Ein Ingenieur bittet ihn, bei einem Online-Bestelldienst ein Rezept zu finden und die notwendigen Zutaten in seinen Warenkorb zu legen: Der KI-Agent geht zur Kochseite, stellt dem Benutzer zusätzliche Fragen und bittet ihn, sich bei Bedarf zu verbinden.