iX 7/2021
S. 122
Praxis
Data Science

Datenanalyse eines sozialen Netzwerks, Teil 2: Communitystrukturen

Kurvendiskussion

Prof. Dr. Stefanie Scholz, Dr. Christian Winkler

Bei Reddit dreht sich alles um Communitys, die miteinander verflochten sind. Mit Python lässt sich visualisieren, wie diese aufgebaut sind und welche Abhängigkeiten es gibt.

Der erste Teil der Reddit-Analyse hat hauptsächlich statistische Metainformationen verwendet, um damit Erkenntnisse über Autoren, Flairs und Volumen zu produzieren. Besonders bei den Flairs hat sich gezeigt, dass hier eine gewisse Bereinigung erfolgen muss, bevor belastbare Aussagen darüber getroffen werden können. Allerdings ist Reddit ein soziales Netzwerk, bei dem es hauptsächlich um die Community geht. Hierüber konnte die Statistik noch nichts ermitteln.

Dieser Teil widmet sich nun der Communitystruktur. Er untersucht, ob die Diskussionen innerhalb der Community eine flache Hierarchie besitzen oder ob es eine tiefer verschachtelte Kommentarstruktur gibt. Außerdem erläutert er, wie die Autorinnen und Autoren miteinander verknüpft sind, welche die einflussreichsten sind und ob es Subcommunitys gibt.

Kommentieren