Methoden zur Datenvisualisierung – Analytics & Visibility

Deskriptive und explorative Datenanalyse

1. Balkendiagramme

Anwendungsfälle: Vergleich von Kategorien, Darstellung von Häufigkeiten.
Nutzen: Einfache und klare Darstellung von Vergleichen.

Python-Beispiel:

import matplotlib.pyplot as plt

plt.bar(categories, values)
plt.xlabel('Kategorien')
plt.ylabel('Werte')
plt.title('Beispiel eines Balkendiagramms')
plt.show()

2. Histogramme

Anwendungsfälle: Verteilung von Daten, Häufigkeitsanalyse.
Nutzen: Visualisierung der Datenverteilung.

Python-Beispiel:

import matplotlib.pyplot as plt

plt.hist(data, bins=4, edgecolor='black')
plt.xlabel('Wert')
plt.ylabel('Häufigkeit')
plt.title('Histogramm-Beispiel')
plt.show()

3. Streudiagramme

Anwendungsfälle: Beziehungen zwischen zwei Variablen, Korrelationen.
Nutzen: Erkennung von Mustern und Ausreißern.

Python-Beispiel:

import matplotlib.pyplot as plt

plt.scatter(x, y)
plt.xlabel('X-Achse')
plt.ylabel('Y-Achse')
plt.title('Streudiagramm-Beispiel')
plt.show()

4. Liniendiagramme

Anwendungsfälle: Trends über die Zeit, kontinuierliche Daten.
Nutzen: Darstellung von Trends und Entwicklungen.

Python-Beispiel:

import matplotlib.pyplot as plt

plt.plot(zeit, werte, marker='o')
plt.xlabel('Zeit')
plt.ylabel('Werte')
plt.title('Liniendiagramm-Beispiel')
plt.show()

5. Boxplots

Anwendungsfälle: Verteilung und Ausreißer, Vergleich von Gruppen.
Nutzen: Zusammenfassung der Datenverteilung.

Python-Beispiel:

import matplotlib.pyplot as plt

plt.boxplot(data)
plt.ylabel('Werte')
plt.title('Boxplot-Beispiel')
plt.show()

6. Heatmaps

Anwendungsfälle: Korrelationen zwischen vielen Variablen, Datenmatrix.
Nutzen: Visualisierung von Korrelationen und Mustern.

Python-Beispiel:

import seaborn as sns
import matplotlib.pyplot as plt

sns.heatmap(data, annot=True, cmap='coolwarm')
plt.title('Heatmap-Beispiel')
plt.show()

7. Kreisdiagramme

Anwendungsfälle: Proportionen und Anteile, Zusammensetzung.
Nutzen: Einfache Darstellung von Anteilen.

Python-Beispiel:

import matplotlib.pyplot as plt

plt.pie(groessen, labels=beschriftungen, autopct='%1.1f%%')
plt.title('Kreisdiagramm-Beispiel')
plt.show()

8. Netzwerkgraphen

Anwendungsfälle: Beziehungen zwischen Entitäten, Netzwerkanalyse.
Nutzen: Visualisierung komplexer Beziehungen.

Python-Beispiel:

import networkx as nx
import matplotlib.pyplot as plt

G = nx.Graph()
G.add_edges_from(kanten)

nx.draw(G, with_labels=True)
plt.title('Netzwerkgraph-Beispiel')
plt.show()

9. Word Clouds

Anwendungsfälle: Häufigkeit von Wörtern, Textanalyse.
Nutzen: Visualisierung von Textdaten.

Python-Beispiel:

from wordcloud import WordCloud
import matplotlib.pyplot as plt

wordcloud = WordCloud().generate(text)

plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()

10. Geospatiale Karten

Anwendungsfälle: Geografische Daten, räumliche Verteilung.
Nutzen: Visualisierung von Standortdaten.

Python-Beispiel:

import geopandas as gpd
import matplotlib.pyplot as plt

world = gpd.read_file(gpd.datasets.get_path('naturalearth_lowres'))
world.plot()
plt.title('Geospatial Map Example')
plt.show()

11. Kontingenztabellen

Anwendungsfälle: Beziehungen zwischen kategorischen Variablen, Häufigkeitsverteilung.
Nutzen: Analyse der Zusammenhänge zwischen zwei kategorischen Variablen.

Python-Beispiel:

import pandas as pd

kontingenztabelle = pd.crosstab(kategorie1, kategorie2)
print(kontingenztabelle)

12. Kontingenztabellen erwarteter Werte

Anwendungsfälle: Erwartete Häufigkeiten, Unabhängigkeitstests.
Nutzen: Vergleich von beobachteten und erwarteten Häufigkeiten.

Python-Beispiel:

import pandas as pd
from scipy.stats import chi2_contingency

beobachtet = pd.crosstab(kategorie1, kategorie2)
chi2, p, dof, erwartet = chi2_contingency(beobachtet)
print(erwartet)

Schlussfolgerung

Datenvisualisierung ist ein mächtiges Werkzeug zum Verständnis und zur Kommunikation von Daten-Einblicken. Jede Methode hat ihre Stärken und ist für unterschiedliche Arten von Daten und Analysezielen geeignet.