OpenAI präsentiert seinen AI Operator Agent, sicherlich eine der größten Ankündigungen des Jahres

-

OpenAI veröffentlicht weiterhin neue Produkte. Und Operator wurde mit Spannung erwartet.

OpenAI hat gerade Operator vorgestellt, seinen ersten KI-Agenten, der konkrete Aufgaben auf einem Computer ausführen kann.

Um weiter zu gehen
„Operator“ oder wie ChatGPT sich darauf vorbereitet, bald die Kontrolle über Ihren Computer zu übernehmen

Dies ist ein Schritt in der Entwicklung der künstlichen Intelligenz. Zur Erklärung: Bisher bot OpenAI mit ChatGPT einen eher passiven Konversationschat an, da dieser keine spezifischen Aufgaben ausführen konnte.

Mit Operator verwandeln wir uns von einfachen Gesprächsassistenten in echte autonome Agenten. Basierend auf dem GPT-4o-Modell kann der Bediener wie ein menschlicher Benutzer im Internet surfen, Formulare ausfüllen und mit verschiedenen Schnittstellen interagieren.

Die Besonderheit von Operator besteht darin, dass es dank seines Modells komplexe Aufgaben in einfache Aktionen zerlegen kann Computer-Using Agent (CUA). Im Gegensatz zu herkömmlichen Lösungen, die spezifische APIs erfordern, analysiert Operator direkt Pixel auf dem Bildschirm, um jede GUI zu verstehen und mit ihr zu interagieren. Wir sehen also, wie sich die Maus bewegt und Aktionen in ihrem Webbrowser ausführt.

Einige Beispiele? Sie können PDF-Dateien kombinieren, Bilder komprimieren, Screenshots machen, eine E-Mail senden … Sie können alles kombinieren, um komplexe Aufgaben auszuführen.

-

Dies ist nicht der erste KI-Agent. Aber Operator übertrifft seine Konkurrenten wie Computer Use von Anthropic oder Mariner von Google DeepMind bereits in mehreren Benchmarks, bleibt es aber auf die Browsernutzung beschränkt et erfordert ein Premium-Abonnement für 200 $ pro Monat.

Die Auswirkungen auf die Sicherheit wurden von OpenAI untersucht, wie das amerikanische Unternehmen in seinem Blog erklärt. Das Unternehmen hat Schutzmaßnahmen implementiert, um böswillige Nutzung zu verhindern, einschließlich der Schulung des Modells, um eine Bestätigung anzufordern, bevor Aktionen mit externen Konsequenzen durchgeführt werden.

KI-Agenten werden unsere PCs und Smartphones verändern

Die Einführung solcher KI-Agenten ist ein sehr wichtiger Schritt. Tägliche Aufgaben wie Restaurantreservierungen oder Einkaufsverwaltung können nun an eine KI delegiert werden, um Zeit für Aktivitäten mit höherer Wertschöpfung zu gewinnen.

Das Beispiel von Yash Kumar, einem Forscher bei OpenAI, veranschaulicht dieses Potenzial perfekt: Er nutzt Operator, um seine Restaurantreservierungen automatisch zu verwalten, eine einfache, aber zeitaufwändige Aufgabe, die jetzt vollständig automatisiert werden kann.

Es ist jedoch wichtig zu beachten, dass diese Technologie noch in den Kinderschuhen steckt. Wie Sam Altman selbst betont, müssen wir die Erwartungen mäßigen und dürfen dem Medienrummel nicht nachgeben. Fehler bleiben möglich und das Tool muss noch verbessert werden.

Diese Woche kündigte Samsung sein Galaxy S25 an, das auch einen auf Google Gemini basierenden KI-Agenten integriert. Sie können Ihr Smartphone auch Aktionen in Apps ausführen lassen, ohne etwas zu berühren.


---

PREV Auswirkungen der Lerntechnologie: Schweden entdeckt das Buch wieder
NEXT Mexiko bereitet sich darauf vor, die ersten Trump -Deportierten zu erhalten