Künstliche Intelligenz ist fast täglich in aller Munde. Auch wenn die Einsatzmöglichkeiten vielfältig und manchmal nicht besonders nützlich sind, gibt es heute einen technologischen Fortschritt, der das Leben einer großen Zahl von Menschen verbessern könnte. Der Einsatz von KI in der medizinischen Welt boomt: Ein Forscherteam der Florida Atlantic University hat gerade ein Modell entwickelt, das die amerikanische Gebärdensprache (ASL) in Echtzeit dekodieren kann. Dieser Durchbruch könnte das Leben und den Umgang mit Technologie von schwerhörigen und gehörlosen Menschen tiefgreifend verändern.
Werbung, Ihr Inhalt wird unten fortgesetzt
Kommunikationsbarrieren mit KI überwinden
Mithilfe der Computer-Vision-Technologie haben Forscher erfolgreich ein KI-Modell entwickelt, das ASL-Alphabet-Gesten mit einer Genauigkeit von 98 % in Text umwandeln kann. Um dieses Ergebnis zu erzielen, trainierten die Forscher ein Modell anhand von 29.820 statischen Bildern von Handgesten. Sie kombinierten diese Fotos mit Bewegungsverfolgungstechnologie basierend auf 21 Orientierungspunkten, die an strategischen Orten für die Gebärdensprache platziert wurden.
Zu diesem Zeitpunkt erreicht das Modell bereits eine bemerkenswerte Genauigkeit. Der nächste Schritt für die Forscher der University of Florida besteht darin, die Trainingshardware des Modells zu erweitern, um es noch zuverlässiger zu machen. Das Team arbeitet außerdem nach eigenen Angaben daran, das System so zu optimieren, dass es auch auf leistungsschwächeren Geräten wie Smartphones läuft. Das ultimative Ziel dieser Forschung? Ermöglichen Sie den Einsatz eines Echtzeit-Übersetzungstools für Gebärdensprache, um Kommunikationsbarrieren zwischen hörgeschädigten Personen, gehörlosen Menschen und dem Rest der Bevölkerung abzubauen. Es gäbe viele Einsatzmöglichkeiten für ein solches System und wir können uns bereits vorstellen, wie nützlich es für den Bildungs- oder Gesundheitssektor sein könnte.
Werbung, Ihr Inhalt wird unten fortgesetzt