iX 1/2021
S. 56
Titel
Data Science

Datenvisualisierung mit Jupyter-Notebooks, Teil 1

Wie verwandelt

Stefanie Scholz, Christian Winkler

Jupyter-Notebooks eignen sich zusammen mit Python für das Visualisieren von Daten. Sie kommen daher häufig in den Bereichen Data Science und Datenanalyse zum Einsatz.

Für die Datenanalyse und Statistik (neudeutsch: Data Science) hat sich in den letzten Jahren neben R mehr und mehr die Kombination aus der Programmiersprache Python und Jupyter Notebook zum interaktiven Analysieren und Visualisieren als Plattform etabliert. Die Bibliothek pandas erlaubt dabei die einfache Verarbeitung auch großer Datenmengen und leistungsfähige Transformationen zwischen unterschiedlichen Formaten und Darstellungen. Mithilfe von GeoPandas gelingt es auch, Geodaten in den gängigen Formaten zu lesen und in pandas zu nutzen.

pandas integriert Matplotlib und erlaubt damit viele Visualisierungsvarianten mit nur einem einzigen Befehl. Das Python-­Ökosystem hat hier noch deutlich mehr zu bieten, etwa das auf Matplotlib aufbauende seaborn. Beide Varianten finden im Artikel Verwendung, daneben gibt es weitere wie Plotly oder Bokeh.

Kommentieren