DayFR Deutsch

VLC bringt ein Feature auf den Markt, auf das Serienfans lange gewartet haben

-

VLC wird generative KI in seinen Open-Source-Videoplayer integrieren. Die bekannteste französische Software bereitet einen automatischen Untertitelgenerator vor, der mehrere Dutzend Sprachen sprechen kann.

Auf der CES 2025 sind nicht nur die Tech-Giganten vertreten! VLC, der Inbegriff freier Software, präsentiert sich auf der großen Messe in Las Vegas mit einem Stand, der der Feier seiner 6. Milliarde Downloads gewidmet ist.

Um diese symbolische Schwelle zu feiern, setzt der VideoLAN-Verband auf eine neue Funktionalität: die automatische Untertitelung von Videos dank generativer Intelligenz. Die Freiwilligen hinter VLC haben uns diese Funktion kurz vorgestellt.

>
Die VLC-Delegation auf der CES in Las Vegas. // Quelle: Numerama

Videos automatisch lokal untertiteln: das VLC-Projekt

Auf der Messe demonstriert das VLC-Team eine Option zur Live-Untertitelung von Videos ohne Untertiteldatei (die berühmten .srt-Dateien). Die Idee besteht darin, eines der ältesten Probleme von Mediaplayern zu beseitigen: das Fehlen von Untertiteln. Fans von Serien wissen, dass es nicht immer einfach ist, einen Untertitel in der richtigen Sprache zu finden. Normalerweise dauert es mehrere Stunden, bis die französischsprachige Community eine erste Version einer .srt-Datei veröffentlicht, während andere Sprachen möglicherweise nie verfügbar sind.

Dank des Whisper-Modells, das Sie auf Ihrem Computer installieren müssen, wird VLC bald in der Lage sein, ein Video unabhängig von seiner Sprache zu transkribieren und es dann zu übersetzen. Kostenlos und Open Source, alles funktioniert lokal. Gleichzeitig bedeutet dies das Ende desynchronisierter Untertitel, da die KI den Text an der richtigen Stelle synchronisiert.

>
VLC ist sehr stolz, die Marke von 6 Milliarden Downloads überschritten zu haben. // Quelle: Numerama

Auf die Frage von Numerama nach der Bereitstellung dieser Technologie erklärt das VideoLAN-Team mit seinen feinen Hüten, dass das Problem hauptsächlich technischer Natur sei. Eine Transkriptionsvorlage kann mehrere Gigabyte wiegen, wobei das Risiko besteht, dass beim Start der Funktion Millionen gleichzeitiger Downloads stattfinden. Da VLC als Open-Source-Projekt nicht in der Lage ist, den Anforderungen standzuhalten, benötigt es Hilfe. Dennoch wird von einem Start in den kommenden Monaten gesprochen.

Als zweiten Schritt könnte VideoLAN mithilfe von KI einen ASL-Dolmetscher (Gebärdensprache) in der Ecke des Videos hinzufügen. Eine weitere Neuheit, die sehr spannend aussieht!


Related News :