Meta setzt auf Vision und Stimme, um seine KI populär zu machen

-

Wie ChatGPT (OpenAI) oder Gemini (Google) beantwortet Meta AI kostenlos Fragen der Benutzer, erstellt auf Anfrage Bilder, schreibt Nachrichten und schlägt Reiserouten oder Aktivitätsideen vor.

Meta gab am Mittwoch bekannt, dass sein Assistent natürlicher werde: Er werde nun mündlich interagieren und auch Bilder analysieren. So könne er beispielsweise anhand eines Fotos eines Gerichts ein Rezept vorschlagen oder ein Foto nach Wunsch bearbeiten.

Nutzer können zwischen verschiedenen künstlichen Stimmen oder den KI-Stimmen von Prominenten wählen, darunter der US-Schauspielerin Awkwafina, der britischen Komikerin Judi Dench und dem Wrestling-Star John Cena.

Im vergangenen Juni sah sich OpenAI durch die Hinzufügung einer Sprachfunktion zu ChatGPT gezwungen, sich bei der Schauspielerin Scarlett Johansson für die Entwicklung einer Stimme zu entschuldigen, die ihrer eigenen sehr ähnlich war. Dies löste eine Kontroverse über die Schaffung von Stimmen aus, die menschlichen Stimmen nachempfunden sind.

– „Nicht sehr persönlich“ –

Über die Smart Glasses von Ray-Ban mit eingebauter Kamera und Kopfhörern können Benutzer mit dem Assistenten sprechen, statt ihn vor jeder Frage beim Namen nennen zu müssen. Der Assistent kann auch live übersetzen, was der Gesprächspartner sagt.

Julie JAMMOT

Aber im Moment ist Meta AI „nicht sehr persönlich. Ich habe nicht das Gefühl, dass es mich gut kennt“, sagt Carolina Milanesi, eine unabhängige Analystin.

Sie trägt Ray-Bans seit fast einem Jahr als Sonnenbrille und verwendet sie zum Fotografieren, zum Musikhören auf der Straße und zum Drehen von Videos zur Präsentation neuer Produkte.

Sie glaubt jedoch, dass „viele Verbraucher Schwierigkeiten haben werden, Meta zu vertrauen“, dem zweitgrößten Online-Werbeunternehmen der Welt.

Um daraus einen echten digitalen Begleiter zu machen, muss der kalifornische Konzern einen Kompromiss finden zwischen einer besseren Anpassung des Tools, der Anforderung von mehr Informationen über die Benutzer und der Wahrung der Vertraulichkeit der Daten.

Besonders schwierig ist diese Gleichung in Europa zu lösen, wo Gesetze zu personenbezogenen Daten, digitalen Märkten und KI verabschiedet wurden.

Mehrere große amerikanische Konzerne, darunter Apple und Meta, haben daher den Einsatz ihrer generativen KI-Tools (Verarbeitung und Produktion von Texten, Bildern und anderen Inhalten auf einfache Anfrage in Alltagssprache) in der Europäischen Union ausgesetzt.

– Metaversum –

Am Mittwoch sagte Meta, dass mittlerweile fast 500 Millionen Menschen Meta AI mindestens einmal im Monat besuchen.

Doch die Konkurrenz ist groß. Google und Microsoft (der Hauptinvestor von OpenAI) haben sich einen Vorsprung verschafft, insbesondere in den Bereichen Produktivität und bedarfsgesteuerte Ausführung von Aktionen.

Und Apple ist nun endlich im Spiel: Das Unternehmen hat gerade seine ersten iPhones auf den Markt gebracht, deren Betriebssystem direkt mit generativer KI integriert ist. So wird der Sprachassistent Siri zu einer Art allwissender, ständig verfügbarer Sekretärin.

2a99a84bdff7240714188fd935b294bbec1859982a99a84bdff7240714188fd935b294bbec185998
Julie JAMMOT

Meta hat die Anzahl der verschiedenen Versionen seines Llama-Sprachmodells verdoppelt und diese als Open Source (offener Programmiercode) bereitgestellt.

Bei der Fotobearbeitung kann Meta AI einem Foto Hintergründe hinzufügen oder sogar aus einem Scan des Gesichts des Benutzers Bilder als Superheld oder Astronaut erstellen.

Das Ergebnis ähnelt dem der Konkurrenztools: hochauflösende, farbenfrohe Bilder mit oft merkwürdigen Details, wie beispielsweise der ungefähren Anzahl der Finger an jeder Hand.

Meta hält auch am Metaversum fest, seiner Vision einer Vermischung des Realen und des Virtuellen mittels Hightech-Brillen und -Headsets.

Das Unternehmen hat mit dem Quest 3S sein neues Mixed-Reality-Headset (erweitert und virtuell) auf den Markt gebracht, ein Einstiegsmodell, das mehr Verbraucher ansprechen soll. Es wird ab 300 Dollar erhältlich sein.

Mark Zuckerberg schloss seine Präsentation mit Orion ab, seinem ersten Prototyp einer Augmented-Reality-Brille, die hochmoderne holografische Projektionen mit der Erscheinung nahezu harmloser Brillengestelle kombiniert.

Die Abteilung Reality Labs, die Geräte und Software für das Metaversum entwickelt, macht jedes Quartal Milliardenverluste.

-

PREV KI ist für 88 % der Eltern unverzichtbar
NEXT Nationalrat unterstützt Individualbesteuerung