Niederländische Forscher verbessern die Sarkasmuserkennung mithilfe eines multimodalen Ansatzes

Niederländische Forscher verbessern die Sarkasmuserkennung mithilfe eines multimodalen Ansatzes
Niederländische Forscher verbessern die Sarkasmuserkennung mithilfe eines multimodalen Ansatzes
-

Oscar Wilde sagte einmal, dass Sarkasmus die niedrigste Form des Witzes, aber die höchste Form der Intelligenz sei. Wenn Menschen manchmal Schwierigkeiten haben, diese subtile Form der Kommunikation zu begreifen, ist sie für Maschinen eine Herausforderung. Ein Forscherteam der Universität Groningen ging diese Herausforderung mit einem innovativen Ansatz an, der Text- und akustische Analyse kombinierte, um einen genaueren Sarkasmusdetektor zu schaffen.

Es ist bekanntermaßen schwierig, Sarkasmus durch Text zu vermitteln; die subtilen Veränderungen im Ton, die Sarkasmus vermitteln, verwirren oft Computeralgorithmen und schränken virtuelle Assistenten und Inhaltsanalysetools ein.

Xiyuan Gao, Shekhar Nayak und Matt Coler vom Speech Technology Laboratory der Universität Groningen, Campus Fryslân, Niederlande, haben einen multimodalen Algorithmus entwickelt, der die Sarkasmuserkennung verbessert. Ihre Arbeit wurde auf dem letzten gemeinsamen Treffen der Acoustic Society of America und der Canadian Acoustics Association in Ottawa vorgestellt.

Ein multimodaler Ansatz

Herkömmliche Algorithmen zur Sarkasmuserkennung basieren in der Regel auf einem einzigen Parameter, beispielsweise nur dem Text, um ihre Ergebnisse zu erzielen. Dieser begrenzte Ansatz ist der Hauptgrund dafür, dass sie oft scheitern. Sarkasmus hängt von Natur aus nicht nur von den Worten ab, sondern auch von der Art und Weise, wie sie gesagt werden, und vom Kontext.

Anstatt sich auf eine einzige Dimension zu beschränken, wählten die Forscher einen multimodalen Ansatz und nutzten zwei komplementäre Techniken: Stimmungsanalyse per Text und Emotionserkennung per Audio.

Erklärung von Xiyuan Gao:

„Wir haben akustische Parameter wie Tonhöhe, Sprechgeschwindigkeit und Sprechenergie extrahiert und dann mithilfe der automatischen Spracherkennung die Sprache zur Stimmungsanalyse in Text transkribiert.“.

Anschließend wurde jedes Sprachsegment mit Emoticons angereichert, die seinen emotionalen Inhalt widerspiegelten, um eine vollständige und genaue Analyse des Sarkasmus zu ermöglichen.

Obwohl das Team hinsichtlich der Leistung seines Algorithmus optimistisch ist, sucht es bereits nach Möglichkeiten, ihn zu verbessern. „Es gibt eine Reihe von Ausdrücken und Gesten, mit denen Menschen sarkastische Elemente in ihrer Sprache hervorheben.“Anmerkung Xiyuan Gao. „Diese müssen besser in unser Projekt integriert werden. Darüber hinaus möchten wir weitere Sprachen einbeziehen und Techniken zur Sarkasmuserkennung übernehmen.“

Mögliche Anwendungen

Die Implikationen dieser Technologie gehen weit über die bloße Identifizierung von Sarkasmus hinaus, was anderen Forschungsbereichen, die Sentimentanalysen und Emotionserkennung nutzen, von Nutzen sein kann.

Xiyuan Gao hinzugefügt:

„Traditionell konzentriert sich die Stimmungsanalyse hauptsächlich auf Text und wird für Anwendungen wie die Erkennung von Hassreden im Internet und die Untersuchung von Kundenmeinungen entwickelt. Sprachbasierte Emotionserkennung kann auf die KI-gestützte Gesundheitsversorgung angewendet werden. Eine Technologie zur Sarkasmuserkennung, die einen multimodalen Ansatz anwendet, ist für diese Forschungsbereiche aufschlussreich.“

Artikelreferenzen:

Akustische Gesellschaft von Amerika. „Einen besseren Sarkasmusdetektor bauen.“ » ScienceDaily

-

PREV FF XIV Dawntrail, Zenless Zone Zero, The First Descendant … Der Veröffentlichungsplan für Videospiele der Woche – Neuigkeiten
NEXT OpenAI führt kritisches GPT ein, um GPT-4 zu beheben