Vom 5. bis 18. Dezember veranstaltet OpenAI 12 Tage lang Ankündigungen und Demos. Es werden neue KI-Modelle und innovative Features erwartet.
Nach dem Prinzip des Vorwärtskalenders hat OpenAI vom 5. bis 18. Dezember eine Reihe neuer Funktionen und Demonstrationen geplant. Das JDN enthüllt Ihnen Tag für Tag alle Ankündigungen, die Sie sich merken sollten.
D8: Die ChatGPT-Suche verbessert sich erneut und gelangt in den Sprachmodus
ChatGPT Search wurde vor zwei Monaten für zahlende Abonnenten eingeführt und ermöglicht es KI, das Internet zu durchsuchen, um aktuelle Antworten bereitzustellen. Drei wesentliche Verbesserungen werden angekündigt: schnellere, für Mobilgeräte optimierte Suche mit einem neuen Kartenerlebnis, Integration der Suche in den erweiterten Sprachmodus und globale Bereitstellung auf allen Plattformen.
Bezahlte und kostenlose Benutzer können jetzt natürliche Konversationssuchen durchführen, nativ auf Multimedia-Inhalte (Bilder, Videos) zugreifen und ChatGPT als Standardsuchmaschine in ihrem Browser verwenden. OpenAI hat bereits angekündigt, dass D9 mit einem „Mini-Dev-Day“ den Entwicklern gewidmet sein wird, der einige spannende neue Funktionen verspricht.
D7: OpenAI führt Projekte in ChatGPT ein
Auf D7 seiner Shipmas führt OpenAI eine lange erwartete neue Funktionalität ein ChatGPT: Projekte. Mit dieser neuen Funktion können Benutzer Bereiche erstellen, die ihren verschiedenen Projekten gewidmet sind, in denen sie Dateien hochladen, personalisierte Eingabeaufforderungen definieren und alle Gespräche zum gleichen Thema gruppieren können. Die Integration ist mit vorhandenen Funktionen wie der Suche und dem Canvas-Modus abgeschlossen. Benutzer können sich auch für eine einfachere Nutzung als Ordnersystem zur Organisation ihrer Diskussionen entscheiden.
Das Tool hat sich intern bereits bewährt, insbesondere für die Verwaltung persönlicher Projekte wie Hauswartung oder Webentwicklung. Die Funktionalität wird heute für Abonnenten außerhalb Europas, Plus, Pro und Teams bereitgestellt und schrittweise auf kostenlose Benutzer ausgeweitet, bevor sie Anfang 2025 die Enterprise- und Education-Versionen erreicht. Ein Update, das die Benutzererfahrung erheblich verbessern soll, indem es endlich eine Lösung bietet die manchmal chaotische Verwaltung von Gesprächen in ChatGPT.
D6: ChatGPT wechselt zur Nordpolzeit
Am sechsten Tag seiner Ankündigung schlägt OpenAI mit der Enthüllung einen ausgesprochen festlichen Ton an ein einzigartiges Spracherlebnis mit dem Weihnachtsmann. Alle ChatGPT-Benutzer können sich jetzt im Sprachmodus direkt mit der berühmten Figur unterhalten. Diese neue Stimme ist über ein einfaches Schneeflockensymbol in der Benutzeroberfläche zugänglich und ermöglicht einen abwechslungsreichen Austausch, von der Diskussion über das Leben am Nordpol bis hin zum Teilen von Geschenklisten, einschließlich herzerwärmender Geschichten über Rentiere. Benutzer können sogar personalisierte Sprachnachrichten vom Weihnachtsmann erstellen.
Eine temporäre Funktion, die nicht im Gesprächsverlauf gespeichert wird. Alles wird von einer vollständigen Anleitung zur Verwendung von OpenAI-Tools für die Feiertage begleitet: von der Hilfe bei der Planung von Geschenken mit DALL-E bis hin zu Kochtipps im Sprachmodus, einschließlich der Erstellung personalisierter Familienspiele. Ein schöner Kommunikationsschritt. Schließlich kündigt OpenAI auch die Einführung von Live Vision im Sprachmodus an. Bildschirm- oder Kamerafreigabe: Der Benutzer kann den Feed auswählen, den er live mit der KI teilt.
D5: Apple Intelligence kommt nach und nach
An seinem fünften Tag zieht OpenAI eine Bilanz seiner bereits angekündigten Partnerschaft mit Apple Intelligence (generative KI auf Apple-Geräten), die sich allmählich konkretisiert. Die Integration von ChatGPT in das Herzstück des Apple-Ökosystems wird schrittweise umgesetzt, mit einer ersten Phase auf macOS für Benutzer mit der neuesten Version des Betriebssystems. Der Assistent kann sich nun an den Kontext aktueller Prozesse erinnern und sorgt so für ein konsistenteres Erlebnis.
iOS-Nutzer innerhalb der EU müssen bis April 2024 warten, um von diesen Funktionen profitieren zu können. Bei der Demonstration wurde insbesondere die Erstellung personalisierter Wiedergabelisten hervorgehoben – obwohl das direkte Öffnen in der Musikanwendung noch nicht möglich ist – sowie die zukünftige Integration mit der Kamerataste des iPhone 16 für den direkten Zugriff auf ChatGPT Vision.
J4: Der Canvas-Modus wird erweitert und intelligenter
Am vierten Tag seiner „Shipmas“ verändert sich OpenAI radikal Son-Modus Canvas in einen echten automatisierten Entwicklerassistenten. Die Funktion, die jetzt für kostenpflichtige und kostenlose Benutzer verfügbar ist, ist nicht mehr nur eine visuelle Schnittstelle: Sie wird zu einer vollständigen Entwicklungsumgebung, in der KI nach Daten suchen, Code generieren, ihn ausführen und die Ergebnisse direkt in der Konsole visualisieren kann.
Canvas ist nun als Entwicklungs-Co-Pilot positioniert, der Entwickler und Datenwissenschaftler während ihres gesamten Arbeitsablaufs unterstützen kann. OpenAI erweitert diese Funktion auch auf benutzerdefinierte GPTs. Ein Update, das noch weiter in Richtung intelligenter Automatisierung von Entwicklungs- und Datenanalyseaufgaben geht.
D3: Sora verfügbar für ChatGPT Plus- und Pro-Benutzer
OpenAI führt seine mit Spannung erwartete Version ein Sora AI-Videogeneratorzehn Monate nach seiner ersten Ankündigung (Lesen Sie unseren Artikel Video-Generierung: 10 Monate nach seiner Ankündigung ist Sora von OpenAI (endlich) da). Der Dienst ist für ChatGPT Plus- und Pro-Abonnenten in den USA verfügbar und verfügt über eine neue dedizierte Schnittstelle und ein schnelleres Turbo-Modell. Benutzer können aus Texten, Bildern oder vorhandenen Videos Videos mit einer Länge von bis zu 20 Sekunden in verschiedenen Auflösungen (480p für Plus, 1080p für Pro) generieren.
Die Technologie zeichnet sich durch Kamerabewegungen und Szenenkohärenz aus, trotz einiger Einschränkungen bei der Physik von Objekten. OpenAI legt Wert auf Sicherheit mit Anti-Deepfake-Filtern, systematischem C2PA-Wasserzeichen und Einschränkungen bei der Nachahmung von Künstlerstilen. Angesichts der enormen Nachfrage schränkt OpenAI derzeit den Zugriff auf das Modell ein.
D2: Die Einführung der Feinabstimmung der Verstärkung für Entwickler
An seinem zweiten Ankündigungstag richtet sich OpenAI an Unternehmen mit einer wichtigen Innovation: Feinabstimmung der Verstärkung (RFT). Die Technik ermöglicht es Entwicklern, OpenAI-Modelle mithilfe eigener Datensätze und Bewertungskriterien an komplexe Aufgaben anzupassen. Die Technologie, die Anfang 2025 in der Alpha-Version über eine API zugänglich sein wird, zielt insbesondere auf die Bereiche Recht, Gesundheit, Finanzen und Ingenieurwesen ab. Das Ziel besteht darin, Expertenmodelle zu erhalten, die in speziellen Bereichen, in denen es objektiv korrekte Antworten gibt, hochpräzise Antworten liefern können.
J1: ein neues Abonnement und die endgültige Version von o1
Am ersten Tag schlägt OpenAI hart zu und präsentiert die endgültige Version von o1sein Argumentationsmodell. Diese endgültige Version, die die Nachfolge von o1-preview antritt, die im vergangenen September veröffentlicht wurde, stellt einen erheblichen Fortschritt in Bezug auf die Leistung bei Benchmarks dar. Das Modell, das in der kostenpflichtigen Version von ChatGPT verfügbar ist, erreicht jetzt eine Erfolgsquote von 78 % bei mathematischen Wettbewerbsproblemen von AIME 2024 und erreicht das 89. Perzentil bei Codeforces-Programmierherausforderungen.
Dabei enthüllt das Unternehmen ChatGPT Proein neues monatliches Angebot im Wert von 200 US-Dollar, das sich an Fachleute und Forscher richtet, die mehr Rechenleistung benötigen. Das Abonnement bietet Zugriff auf das gesamte OpenAI-Ökosystem (o1, o1-mini, GPT-4o, Advanced Voice) und führt den „Pro-Modus“ von o1 ein, eine optimierte Version, die mehr Rechenressourcen für die komplexesten Aufgaben mobilisiert.