OpenAI O3 bricht alle Rekorde! Ein Schritt vorwärts in Richtung AGI?

RHC-Redaktion: 26. Dezember 2024 08:53

Am 20. Dezember erreichte das neue künstliche Intelligenzsystem von OpenAI, o3, einen wichtigen Meilenstein. Das Modell erhielt eine Punktzahl 85 % im Denktest der ARC-AGI, was dem durchschnittlichen menschlichen Wert entspricht. Darüber hinaus Er war bei komplexen mathematischen Problemen hervorragend.

Der ARC-AGI-Test und die Sampling-Logik

Bisher lag das beste Ergebnis unter ähnlichen Entwicklungen nicht über 55 %. Viele Forscher glauben das o3 hat einen wichtigen Schritt in Richtung künstlicher allgemeiner Intelligenz (AGI) gemacht, obwohl Skeptiker immer noch an der Bedeutung dieses Ergebnisses zweifeln.

Hier ist es wichtig, die Eigenschaften des Tests zu verstehen ARC-AGI. Der Hauptindikator darin ist „Probenahmeeffizienz“, oder die Fähigkeit, sich an neue Bedingungen anzupassen und ein Minimum an Beispielen zu haben. Einfach ausgedrückt ermittelt der Test, wie viele Proben einer neuen Situation erforderlich sind, um zu verstehen, wie sie funktioniert.

Moderne Sprachmodelle wie ChatGPT auf Basis von GPT-4 können sich nicht mit einer hohen Sampling-Effizienz rühmen. Während des Trainings untersuchen sie Millionen von Fragmenten menschlicher Texte und leiten daraus die wahrscheinlichsten Wortkombinationen ab. Diese Methode hilft bei der Bewältigung typischer Aufgaben, schlägt jedoch in nicht standardmäßigen Situationen fehl, einfach weil nicht genügend ähnliche Beispiele in der Datenbank vorhanden sind.

KI kann vorerst nur dort eingesetzt werden, wo sich Aufgaben wiederholen oder zufällige Fehler keine schwerwiegenden Folgen haben. Das Hauptproblem ist das Modelle wissen nicht, wie sie schnell lernen und sich an neue Umstände anpassen können.

Es ist eine Frage der „Verallgemeinerung“

Die Fähigkeit, auf der Grundlage einer begrenzten Menge an Informationen richtige Lösungen für unbekannte Probleme zu finden, wird von Wissenschaftlern als Generalisierung bezeichnet. In der wissenschaftlichen Gemeinschaft gilt dieses Merkmal als notwendiges und grundlegendes Zeichen der Intelligenz. Der ARC-AGI besteht aus quadratischen Gitteraufgaben, die den IQ-Tests in Schulen ähneln. Auf dem Bildschirm erscheinen zwei Bilder: das Ausgangsschema und ein Beispiel für den Zustand, den es nach bestimmten Manipulationen erreichen sollte. Das Programm muss cdas Transformationsmodell vom Anfangszustand in den Endzustand verstehen.

Zu jeder Aktivität gehören drei Lehrbeispiele. Nachdem ich sie studiert hatte, Der Algorithmus muss die Regeln ableiten und in der Praxis anwenden. Mit diesem Ansatz können Sie überprüfen, wie schnell die Anpassung erfolgt.

Bei der Untersuchung von Mustern ist es wichtig, keine unnötigen Annahmen zu treffen oder unnötig ins Detail zu gehen. Wenn Sie theoretisch die einfachsten Regeln finden, die für eine Lösung ausreichen, kann sich das Programm besser an neue Situationen anpassen.

Der „einfache Regeln“ Sie können normalerweise in kurzen Sätzen beschrieben werden. Bei einer Aufgabe mit einem Quadratgitter könnte die Regel beispielsweise wie folgt lauten: „Die Figur mit der hervorstehenden Linie bewegt sich zum Ende dieser Linie und verdeckt alle Figuren auf ihrem Weg.“

Wie o3 genau funktioniert, ist noch unbekannt, aber es ist unwahrscheinlich, dass Ihnen speziell beigebracht wurde, danach zu suchen „einfache Regeln“. OpenAI hat eine generische Version des Modells als Grundlage genommen, die länger über komplexe Fragen nachdenken kann, und es dann weiter trainiert, um den ARC-AGI-Test zu bestehen.

O3 arbeitet mit Argumentationsketten

Das schlägt der französische KI-Forscher Francois Chollet vor, der den Test entwickelt hat o3 durchläuft verschiedene „Argumentationsketten“ oder Schrittfolgen, um ein Ziel zu erreichen. Anschließend wird anhand bestimmter Regelvorschläge die beste Option ausgewählt.

Es ist jedoch noch zu früh, um zu sagen, wie nahe wir der Schaffung von AGI kommen. Die grundlegenden Mechanismen für die Arbeit mit der Sprache bleiben möglicherweise dieselben, nur dass sie jetzt effektiver an die Lösung einer bestimmten Art von Problem angepasst sind.

OpenAI hält fast alle Informationen über seine Entwicklung geheim. Das Unternehmen beschränkte sich auf einige Medienpräsentationen und o3 durfte nur von einigen Forschern getestet werden, Labore und Organisationen, die sich mit KI-Sicherheit befassen.

Redaktionsteam
Das Redaktionsteam von Red Hot Cyber besteht aus einer Gruppe von Einzelpersonen und anonymen Quellen, die aktiv zusammenarbeiten, indem sie Vorschauinformationen und Neuigkeiten zu Cybersicherheit und IT im Allgemeinen bereitstellen.

Der ARC-AGI-Test und die Sampling-Logik

Es ist eine Frage der „Verallgemeinerung“

O3 arbeitet mit Argumentationsketten

Related posts