Deskriptive und explorative Datenanalyse
1. Balkendiagramme
- Anwendungsfälle: Vergleich von Kategorien, Darstellung von Häufigkeiten.
- Nutzen: Einfache und klare Darstellung von Vergleichen.
Python-Beispiel:
import matplotlib.pyplot as plt plt.bar(categories, values) plt.xlabel('Kategorien') plt.ylabel('Werte') plt.title('Beispiel eines Balkendiagramms') plt.show()
2. Histogramme
- Anwendungsfälle: Verteilung von Daten, Häufigkeitsanalyse.
- Nutzen: Visualisierung der Datenverteilung.
Python-Beispiel:
import matplotlib.pyplot as plt plt.hist(data, bins=4, edgecolor='black') plt.xlabel('Wert') plt.ylabel('Häufigkeit') plt.title('Histogramm-Beispiel') plt.show()
3. Streudiagramme
- Anwendungsfälle: Beziehungen zwischen zwei Variablen, Korrelationen.
- Nutzen: Erkennung von Mustern und Ausreißern.
Python-Beispiel:
import matplotlib.pyplot as plt plt.scatter(x, y) plt.xlabel('X-Achse') plt.ylabel('Y-Achse') plt.title('Streudiagramm-Beispiel') plt.show()
4. Liniendiagramme
- Anwendungsfälle: Trends über die Zeit, kontinuierliche Daten.
- Nutzen: Darstellung von Trends und Entwicklungen.
Python-Beispiel:
import matplotlib.pyplot as plt plt.plot(zeit, werte, marker='o') plt.xlabel('Zeit') plt.ylabel('Werte') plt.title('Liniendiagramm-Beispiel') plt.show()
5. Boxplots
- Anwendungsfälle: Verteilung und Ausreißer, Vergleich von Gruppen.
- Nutzen: Zusammenfassung der Datenverteilung.
Python-Beispiel:
import matplotlib.pyplot as plt plt.boxplot(data) plt.ylabel('Werte') plt.title('Boxplot-Beispiel') plt.show()
6. Heatmaps
- Anwendungsfälle: Korrelationen zwischen vielen Variablen, Datenmatrix.
- Nutzen: Visualisierung von Korrelationen und Mustern.
Python-Beispiel:
import seaborn as sns import matplotlib.pyplot as plt sns.heatmap(data, annot=True, cmap='coolwarm') plt.title('Heatmap-Beispiel') plt.show()
7. Kreisdiagramme
- Anwendungsfälle: Proportionen und Anteile, Zusammensetzung.
- Nutzen: Einfache Darstellung von Anteilen.
Python-Beispiel:
import matplotlib.pyplot as plt plt.pie(groessen, labels=beschriftungen, autopct='%1.1f%%') plt.title('Kreisdiagramm-Beispiel') plt.show()
8. Netzwerkgraphen
- Anwendungsfälle: Beziehungen zwischen Entitäten, Netzwerkanalyse.
- Nutzen: Visualisierung komplexer Beziehungen.
Python-Beispiel:
import networkx as nx import matplotlib.pyplot as plt G = nx.Graph() G.add_edges_from(kanten) nx.draw(G, with_labels=True) plt.title('Netzwerkgraph-Beispiel') plt.show()
9. Word Clouds
- Anwendungsfälle: Häufigkeit von Wörtern, Textanalyse.
- Nutzen: Visualisierung von Textdaten.
Python-Beispiel:
from wordcloud import WordCloud import matplotlib.pyplot as plt wordcloud = WordCloud().generate(text) plt.imshow(wordcloud, interpolation='bilinear') plt.axis('off') plt.show()
10. Geospatiale Karten
- Anwendungsfälle: Geografische Daten, räumliche Verteilung.
- Nutzen: Visualisierung von Standortdaten.
Python-Beispiel:
import geopandas as gpd import matplotlib.pyplot as plt world = gpd.read_file(gpd.datasets.get_path('naturalearth_lowres')) world.plot() plt.title('Geospatial Map Example') plt.show()
11. Kontingenztabellen
- Anwendungsfälle: Beziehungen zwischen kategorischen Variablen, Häufigkeitsverteilung.
- Nutzen: Analyse der Zusammenhänge zwischen zwei kategorischen Variablen.
Python-Beispiel:
import pandas as pd kontingenztabelle = pd.crosstab(kategorie1, kategorie2) print(kontingenztabelle)
12. Kontingenztabellen erwarteter Werte
- Anwendungsfälle: Erwartete Häufigkeiten, Unabhängigkeitstests.
- Nutzen: Vergleich von beobachteten und erwarteten Häufigkeiten.
Python-Beispiel:
import pandas as pd from scipy.stats import chi2_contingency beobachtet = pd.crosstab(kategorie1, kategorie2) chi2, p, dof, erwartet = chi2_contingency(beobachtet) print(erwartet)
Schlussfolgerung
Datenvisualisierung ist ein mächtiges Werkzeug zum Verständnis und zur Kommunikation von Daten-Einblicken. Jede Methode hat ihre Stärken und ist für unterschiedliche Arten von Daten und Analysezielen geeignet.