OpenAI stellt den „Operator“-Agenten vor, der Webaufgaben erledigt

OpenAI stellt den „Operator“-Agenten vor, der Webaufgaben erledigt
OpenAI stellt den „Operator“-Agenten vor, der Webaufgaben erledigt
-

OpenAI hat am Donnerstag ein Programm für künstliche Intelligenz namens „Operator“ eingeführt, das sich um Online-Aufgaben wie das Bestellen von Artikeln oder das Ausfüllen von Formularen kümmern kann.

Laut OpenAI kann der Bediener Webseiten nachschlagen und mit ihnen interagieren, indem er tippt, klickt oder scrollt, so wie es eine Person tun würde.

„Der Bediener kann gebeten werden, eine Vielzahl sich wiederholender Browseraufgaben zu erledigen, wie das Ausfüllen von Formularen, das Bestellen von Lebensmitteln und sogar das Erstellen von Memes“, sagte OpenAI in einem Online-Beitrag.

„Die Möglichkeit, dieselben Schnittstellen und Tools zu verwenden, mit denen Menschen täglich interagieren, erweitert den Nutzen von KI und hilft Menschen, bei alltäglichen Aufgaben Zeit zu sparen, während sich gleichzeitig neue Engagementmöglichkeiten für Unternehmen eröffnen.“

Ein KI-„Agent“, der neueste Trend im Silicon Valley, ist ein digitaler Helfer, der die Umgebung wahrnehmen, Entscheidungen treffen und Maßnahmen ergreifen soll, um bestimmte Ziele zu erreichen.

Google kündigte im Dezember Agentenfähigkeiten mit der Einführung von Gemini 2.0 an, seinem bislang fortschrittlichsten Modell für künstliche Intelligenz.

Der KI-Rivale Anthropic hat zwei Monate zuvor in einer experimentellen öffentlichen Betaphase seinem KI-Modell Claude Frontier eine Funktion zur „Computernutzung“ hinzugefügt.

„Entwickler können Claude anweisen, Computer so zu nutzen, wie Menschen es tun – indem sie auf einen Bildschirm schauen, einen Cursor bewegen, auf Schaltflächen klicken und Text eingeben“, sagte Anthropic damals in einem Beitrag und warnte davor, dass es sich um eine laufende Arbeit handele.

-

OpenAI beschrieb Operator als einen seiner ersten KI-Agenten, der in der Lage ist, selbstständig Arbeit für Menschen zu erledigen und darauf ausgelegt ist, die ihm übertragenen Aufgaben zu erledigen.

Der Betreiber steht nur US-Benutzern zur Verfügung, die für Pro-Abonnements des OpenAI-Dienstes bezahlen, „um eine sichere und iterative Einführung zu gewährleisten“, sagte OpenAI.

„Wenn es auf Herausforderungen stößt oder Fehler macht, kann der Betreiber seine Denkfähigkeiten nutzen, um sich selbst zu korrigieren“, sagte OpenAI.

„Wenn es stecken bleibt und Hilfe benötigt, gibt es die Kontrolle einfach an den Benutzer zurück.“

Laut OpenAI ist der Bediener darin geschult, den Benutzer aufzufordern, Aufgaben zu übernehmen, die eine Anmeldung oder Zahlungsdetails erfordern oder „CAPTCHA“-Sicherheitsherausforderungen lösen, die der Unterscheidung zwischen und Software im Internet dienen sollen.

„Benutzer können Operator mehrere Aufgaben gleichzeitig ausführen lassen, indem sie neue Konversationen erstellen, beispielsweise eine personalisierte Emaille-Tasse auf Etsy bestellen und gleichzeitig einen Campingplatz auf Hipcamp buchen“, sagte OpenAI.

gc/bs

---

PREV Paris zittert vor dem Empfang von City
NEXT The movie John Wayne knew was doomed from the start