Sentiment Analyse - Funktionsweise und Anwendungsgebiete

Methoden zur automatischen Erfassung von Stimmung und Polarität in natürlicher Sprache und typische Anwendungsgebiete im Marketing und der Marktanalyse

Veröffentlicht am 01.05.2022. Zuletzt aktualisiert am 15.05.2022. 667 Wörter.

Die Stimmungsanalyse (Sentiment Analysis) verwendet Methoden des Natural Language Processings und des maschinelles Lernens, um Emotionen in Texten zu erkennen und zu klassifizieren. Sentiment Analysis ist ein unerlässliches Instrument der Marktforschung um die Stimmung gegenüber von Unternehmen, Marken und Produkten in sozialen Medien zu erkennen und Reputation zu messen.

Funktionsweise der Stimmungsanalyse

Die Stimmungsanalyse verwendet verschiedene Methoden und Algorithmen des Natural Language Processing (NLP). Hier können die folgenden Ansätze unterschieden werden.

Wörterbuchbasierte Ansätze

Wörterbuchbasierte Ansätze stützen sich dabei sowohl auf Techniken des Natural Language Processing, zum Beispiel Tokenisierung, Part-of-Speech-Tagging und Parsing als auch auf Wörterbücher, d.h. Listen von Wörtern und Ausdrücken. Diese Wörterbücher stellen den Kern dieser Ansätze dar. Zunächst werden zwei oder mehr Listen von Wörtern definiert, die jeweils Ausdrücke unterschiedlicher Polarität enthalten, beispielsweise Wörter mit negativer und positiver Konnotation. Daraufhin werden die den Listen zugehörigen Wörter gezählt, die in einem bestimmten Text vorkommen. Wenn die Anzahl der positiven Wörter größer ist als die Anzahl der negativen, gibt das System eine positive Polarität aus und umgekehrt. Eine neutrale Polarität ist das Ergebnis einer (nahezu) ausgeglichenen Anzahl positiver und negativer Wörter. Das Hauptproblem des regelbasierten Ansatzes ist, dass Wörter isoliert betrachtet werden, ohne Kontext. Sie sind jedoch einfach zu verstehen und können durch das Bearbeiten der Wörterbücher leicht angepasst werden.

Ansätze aus dem maschinellen Lernen

Methoden des maschinellen Lernens beruhen im Gegensatz zu regelbasierten Systemen nicht auf manuell erstellten Wortlisten, sondern üblicherweise auf überwachten Lernverfahren in Form von Klassifizierern. Dabei wird ein solcher Klassifikator anhand von Textbeispiel mit zugehöriger Kategorie (zum Beispiel positiv, negativ, neutral) angelernt. In diesem Trainingsprozess lernt das Modell, einen bestimmten Input (d.h. einen Text) mit dem entsprechenden Output (Kategorie) zu assoziieren, basierend auf den für das Training verwendeten Testmustern. Damit Klassifikatoren jedoch Text verarbeiten können, müssen die Texte zunächst vektorisiert werden. Dies geschieht mit Techniken des Natural Language Processing. Klassischerweise werdend dafür die Ansätze bag-of-words oder bag-of-ngrams verwendet. Neuerdings werden auch Techniken angewandt, die auf Worteinbettungen basieren. Für die Klassifizierung werden in der Regel statistische Modelle verwendet. Naive Bayes Algorithmen basieren auf probabilistischen Algorithmen, die das Bayes'sche Theorem zur Vorhersage der Kategorie eines Textes verwenden. Die lineare Regression ist ebenfalls ein sehr bekannter Algorithmus in der Statistik, der verwendet wird, um einen bestimmten Wert (Y) bei einem Satz von Merkmalen (X) vorherzusagen. Support Vector Machines bezeichnen ein nicht-probabilistisches Modell, das Textbeispiele als Punkte in einem mehrdimensionalen Raum darstellt. Beispiele für verschiedene Kategorien (Stimmungen) werden auf verschiedene Regionen innerhalb dieses Raums abgebildet. Dann werden neue Texte einer Kategorie zugeordnet, die auf Ähnlichkeiten mit bestehenden Texten und den Regionen, denen sie zugeordnet sind, basiert. Für die Sentiment Analyse finden zunehmend auch Ansätze aus dem Deep Learning Verwendung.

Anwendungsmöglichkeiten der Sentiment Analysis

Marktforschung

Die Sentiment Analysis ermöglicht alle Arten von Marktforschung und Wettbewerbsanalyse. So können zum Beispiel Online-Bewertungen von Produkten analysiert werden und mit denen der Konkurrenten verglichen werden oder Kundeneinstellungen gegenüber einer Marke oder einem Produkt bestimmt werden. Ziel ist es häufig auch, neue Märkte und Trends schnell zu erkennen, indem das Interesse an neuen Produktkategorien überwacht wird.

Monitoring

Durch den Einsatz von Algorithmen zur Stimmungsanalyse können Unternehmen aus der Kommunikation in sozialen Netzwerken verwertbare Erkenntnisse gewinnen und Probleme erkennen, bevor sie außer Kontrolle geraten. Auch das Monitoring von Nachrichtenseiten, Blogs, Foren und Bewertungsseiten gehört dazu. Die Stimmungsanalyse in Echtzeit ermöglicht es, potenzielle PR-Krisen zu erkennen und schnell Maßnahmen zu ergreifen. Weiter ermöglicht die Stimmungsanalyse auch eine Einschätzung der Reputation der Konkurrenz, indem deren Bewertungen in den sozialen Medien betrachtet werden.

Kundenservice

Kunden erwarten, dass die Kommunikation mit Unternehmen schnell und problemlos erfolgt. Die Analyse der Interaktionen mit dem Kundensupport erlaubt es sicherzustellen, dass die Kommunikation zur Zufriedenheit des Kunden erfolgt und Kundenabwanderung minimiert wird.