Agilität: Stimmung mithilfe von Machine Learning analysieren
Datenaufbereitung ist ein wichtiger Bestandteil in der Entwicklung von ML-Software. Der Artikel führt Schritt für Schritt durch den Aufbau einer ML-Pipeline.
Das Beispielprojekt dieses Artikels beschäftigt sich mit politischer Meinungsforschung. Die Aufgabenstellung für das mittels einer Stimmungsanalyse zu lösende Geschäftsproblem ist bereits definiert: "Automatische Klassifizierung von deutschsprachigen Tweets mit dem Hashtag #Russland in positiv, negativ und neutral". Die Wertschöpfung durch ML ergibt sich aus der signifikanten Vereinfachung und Rationalisierung bisheriger klassischer empirischer Methoden und der Nutzung einer viel größeren Datenmenge, was zu einer erhöhten Aussagekraft der Ergebnisse führt.
Die für das Training benötigten Daten liegen seit der zweiten Phase des ML-Projekts vor und sind teilweise schon aufgearbeitet. Es ist nun an der Zeit, mit der Sentiment-Analyse zu beginnen und mit den Daten zu arbeiten (Phase 3).
Mit dem Einstieg in die dritte Phase stellt sich die Frage, welche Aufgaben vorliegen. Eine Stimmungsanalyse folgt dem Ziel, Textdaten mittels trainierter Algorithmen hinsichtlich des Sentiments, also der Autorenmeinung und Haltung zu einem bestimmten Thema, zu klassifizieren. Dabei gilt es zu klären, welcher Weg zwischen einem Tweet und seiner automatischen Klassifizierung in die Kategorien positiv, neutral oder negativ liegt.
Das war die Leseprobe unseres heise-Plus-Artikels "Agilität: Stimmung mithilfe von Machine Learning analysieren".
Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.
Immer mehr Wissen. Das digitale Abo für IT und Technik.
Nur bis zum 31. Mai: heise+ 1 Jahr für nur 1,90 pro Woche lesen. Unbegrenzter Zugriff auf alle heise+ Artikel inklusive allen Digital-Magazinen.Länger lesen, mehr sparen: heise+ 1 Jahr lang für nur 1,90 € pro Woche lesen und brandaktuelles IT- und Tech-Wissen sichern. Zugriff auf alle heise+ Artikel inklusive der Digital-Magazine. Nur bis zum 31. Mai!