Krisensentiment - Wie Sie Stimmungen in Sozialen Medien erkennen

Forschung & Entwicklung, Künstliche Intelligenz, Data Science

Sentimentanalyse am Beispiel Yammer - Künstliche Intelligenz wertet Stimmung von Kommentaren aus

Gestalten Sie Teile Ihrer Unternehmenskommunikation in sozialen Medien, dann kommen Sie um eine Auswertung der entstehenden Kommentare nicht herum. Ein nützliches Tool hierfür ist die Sentimentanalyse, mittels welcher sich die Stimmung oder die Gefühlslage aus Texten extrahieren lässt. Somit erfahren Sie, wie die aktuelle Kampagne die Außenwirkung Ihres Unternehmens beeinflusst, und können reagieren, wenn die Stimmung kippt. Am realen Beispiel des viadee Yammer-Netzwerkes behandelt der Artikel das grundsätzliche Vorgehen einer semantischen Sentimentanalyse von Texten.

Unternehmenskommunikation und Social Media - Wer liest schon alle Kommentare? ...

Eine Sekunde – so lange dauert es im Durchschnitt, bis 9.000 Tweets oder 1.700 Tumblr-Beiträge verfasst werden^1. Dabei sind soziale Medien längst nicht mehr Privatnutzerinnen und -nutzern vorbehalten. Vielmehr entdecken nahezu alle Unternehmen den Wert der verschiedenen Kanäle für sich: So nutzten 2019 laut Statista bspw. 94 Prozent aller Unternehmen weltweit Facebook und 73 Prozent Instagram. Doch wie können die so anfallenden Datenmassen effektiv ausgewertet werden?

Zunächst sollte sich ein Unternehmen klar werden, welche Ziele es mit der Teilnahme an einem sozialen Netzwerk verfolgt. Häufig ist der Erhalt von Kundenbeziehungen, die zielgerichtete Schaltung von Werbung oder auch die Vermittlung von Informationen im Fokus. Hierbei unterliegt allen Netzwerken eine bidirektionale Kommunikation, die es Kunden ermöglicht, ihre Meinungen und ihr Feedback öffentlich sichtbar zu äußern. Solch direkte Interaktionen sind enorm hilfreich für Unternehmen. Sie ermöglichen es, das sonst kaum zu erreichende Feedback der Verbraucher einzuholen. So können bspw. Kampagnen zielgerichtet gestaltet und ihre Wirkung anschließend überwacht werden.

Eine Möglichkeit, die Inhalte des Feedbacks zu überwachen, bietet sich durch die Analyse des Sentiments. Sentiment bedeutet in diesem Kontext so viel wie Empfindung oder Gefühl. Deren Analyse hat folglich das Ziel, die Stimmung eines Textes oder Kommentars zu ermitteln. Sie wird daher der Disziplin des Text Minings bzw. der semantischen Textanalyse zugeordnet. Betrachten wir die oben genannten Beiträge pro Sekunde, wird schnell klar, dass die manuelle Analyse, welche das Lesen und Bewerten eines jeden Kommentars beinhaltet, zeitaufwendig, teuer und letztendlich nicht realisierbar ist. Bei einer fortlaufenden Marktbetrachtung oder größeren Mengen an Kommentaren wird also zwangsläufig eine Automatisierungslösung benötigt. Diese kann durch eine automatisierte Sentimentanalyse erfolgen.

Die automatische Bestimmung des Sentiments gestaltet sich jedoch ebenfalls schwierig. Denn i. d. R. sind nicht nur einfache Sätze, wie „Mir gefällt der Beitrag“, zu bewerten, sondern unter anderem auch geschachtelte, doppelt verneinte oder gar sarkastische Kommentare, wie „Das ist mal wieder ein ganz toller Beitrag“. Um dieser Komplexität zu begegnen, werden häufig Verfahren der künstlichen Intelligenz, des maschinellen Lernens oder generell des Natural Language Processings (NLP) angewandt.

Natürlich sind wir nicht auf das zuvor beschriebene Einsatzgebiet des Marketings limitiert, sondern können sämtliche Texte, angefangen bei Tweets bis hin zu Gesetzestexten, bzgl. ihrer Stimmung bewerten. Eine für uns ideale Datenquelle ist Microsofts soziales Unternehmensnetzwerk Yammer, welches wir innerhalb der viadee nutzen. Hier finden ein reger Informationsaustausch und viele Diskussionen statt. Zusätzlich bietet sich durch die aktuelle Corona-Krise ein sehr interessanter Zeitpunkt, um eine Momentaufnahme der unternehmensweiten Stimmung zu nehmen.

... natürlich die KI!

Um die Sentimentanalyse durchzuführen, nutzen wir einen mehrschrittigen Ansatz:

Datensammlung: Zunächst exportieren wir die Yammer-Daten, indem wir die Yammer-REST-API benutzen. Leider ist die API nicht auf unseren Zweck, und zwar alle Daten zu beziehen, ausgerichtet, sodass wir eine Mischung mehrerer Methoden benötigen, um alle Daten zu erhalten. Zusätzlich müssen wir auf das Rate-Limiting achten: Es dürfen maximal zehn Requests alle 30 Sekunden ausgeführt werden.
Berechnung des Scores: Nachdem uns der Export vorliegt, bewerten wir jeden einzelnen Kommentar bzgl. seines Sentiments. Hierfür eignet sich das Python Textverarbeitungs-Framework textblob-de, welches speziell auf deutsche Texte ausgerichtet ist.
Reporting/Visualisierung: Nun liegt uns eine Liste aller Kommentare, der Gruppe, in der sie geschrieben wurden und ihr Sentiment-Score (numerisch; im Bereich von -1 und 1) vor. Wir können somit die Daten auswerten und visualisieren.

Die durch diesen Prozess erlangten Ergebnisse geben uns nun einige Einblicke in die Stimmung der Beiträge. Grafik 1 verschafft zunächst einen Gesamtüberblick und stellt die durchschnittliche Stimmung aller Beiträge seit 2011 dar. Es ist gut zu erkennen, wie das Sentiment als dauerhaft positiv bewertet wird und zwischen 0.1 und 0.25 pendelt. Zudem lässt sich durch abwechselnde Hoch- und Tiefpunkte die Dynamik der Community sehen und erkennen, dass insgesamt kein klarer Auf- oder Abwärtstrend herrscht.

Sentimentanalyse-entwicklung-der-stimmung-grafik-gesamtheit-aller-beitraege

Grafik 2 stellt die kürzere Vergangenheit bis 2019 dar. Hier lassen sich kurzfristige Trends identifizieren. Besonders interessant: Im Februar 2020 gibt es einen deutlichen Knick im Sentiment. Nachvollziehbar – denn hier wurde das Thema Corona ausführlich und emotional diskutiert. Glücklicherweise scheint der erste Schock überwunden und ein deutlicher Aufwärtstrend ist seit April/Mai zu beobachten.

Sentimentanalyse-entwicklung-der-stimmung-grafik-2019

Schlussendlich lässt sich der Betrachtungsumfang der Auswertung auch auf einzelne Gruppen herunterbrechen. Grafik 3 zeigt, wie die Yammer-Gruppe „Bundesligatippspiel“ besonders polarisierende Kommentar-Scores aufweist.

Und weiter?

Um noch präzisere Ergebnisse bzw. treffendere Bewertungen zu erlangen, könnten einige Maßnahmen umgesetzt werden. In der prototypischen Implementierung werden Bilder und Videos nicht behandelt, da hier kein Text extrahiert werden kann. Zusätzlich findet nur eine sehr grundlegende Datenaufbereitung statt. Hier sollte Zeit investiert werden, um die Qualität der Ausgangsdaten zu verbessern. Nicht zuletzt wäre es von Vorteil, ein besseres Modell zu finden oder gar ein eigenes zu trainieren. Vereinzelt weisen Bewertungen von Kommentaren, wie „Schön ist das nicht ;)“ (Score von 1.0) oder „Das Protokoll ist fertig“ (Score von -1.0), darauf hin, dass unser genutztes Modell in bestimmten Situationen nicht gut performt und noch Luft nach oben hat.

Insgesamt konnten wir mit dieser kurzen Analyse erste interessante Informationen aus den Beiträgen der Mitarbeiterinnen und Mitarbeiter gewinnen. Die Methodik lässt sich analog auf sämtliche anderen Domänen übertragen, wodurch verschiedenste Texte bewertet werden könnten. Es ist daher vorstellbar, dass wir diesen Ansatz erweitern und weitere Quellen, wie bspw. Twitter oder Facebook, hinzunehmen oder hiermit relevante Trends und deren Bedeutung für die IT-Branche verfolgen. Hierfür stehen uns jede Menge weiterer Werkzeuge zur Verfügung, mittels welcher sich noch mehr Erkenntnisse aus Kommentaren gewinnen lassen.

zurück zur Blogübersicht