Zum Inhalt springen

Methoden zur Datenvisualisierung

Deskriptive und explorative Datenanalyse


1. Balkendiagramme

  • Anwendungsfälle: Vergleich von Kategorien, Darstellung von Häufigkeiten.
  • Nutzen: Einfache und klare Darstellung von Vergleichen.
  • Python-Beispiel:

    import matplotlib.pyplot as plt
    
    plt.bar(categories, values)
    plt.xlabel('Kategorien')
    plt.ylabel('Werte')
    plt.title('Beispiel eines Balkendiagramms')
    plt.show()
    

2. Histogramme

  • Anwendungsfälle: Verteilung von Daten, Häufigkeitsanalyse.
  • Nutzen: Visualisierung der Datenverteilung.
  • Python-Beispiel:

    import matplotlib.pyplot as plt
    
    plt.hist(data, bins=4, edgecolor='black')
    plt.xlabel('Wert')
    plt.ylabel('Häufigkeit')
    plt.title('Histogramm-Beispiel')
    plt.show()
    

3. Streudiagramme

  • Anwendungsfälle: Beziehungen zwischen zwei Variablen, Korrelationen.
  • Nutzen: Erkennung von Mustern und Ausreißern.
  • Python-Beispiel:

    import matplotlib.pyplot as plt
    
    plt.scatter(x, y)
    plt.xlabel('X-Achse')
    plt.ylabel('Y-Achse')
    plt.title('Streudiagramm-Beispiel')
    plt.show()
    

4. Liniendiagramme

  • Anwendungsfälle: Trends über die Zeit, kontinuierliche Daten.
  • Nutzen: Darstellung von Trends und Entwicklungen.
  • Python-Beispiel:

    import matplotlib.pyplot as plt
    
    plt.plot(zeit, werte, marker='o')
    plt.xlabel('Zeit')
    plt.ylabel('Werte')
    plt.title('Liniendiagramm-Beispiel')
    plt.show()
    

5. Boxplots

  • Anwendungsfälle: Verteilung und Ausreißer, Vergleich von Gruppen.
  • Nutzen: Zusammenfassung der Datenverteilung.
  • Python-Beispiel:

    import matplotlib.pyplot as plt
    
    plt.boxplot(data)
    plt.ylabel('Werte')
    plt.title('Boxplot-Beispiel')
    plt.show()
    

6. Heatmaps

  • Anwendungsfälle: Korrelationen zwischen vielen Variablen, Datenmatrix.
  • Nutzen: Visualisierung von Korrelationen und Mustern.
  • Python-Beispiel:

    import seaborn as sns
    import matplotlib.pyplot as plt
    
    sns.heatmap(data, annot=True, cmap='coolwarm')
    plt.title('Heatmap-Beispiel')
    plt.show()
    

7. Kreisdiagramme

  • Anwendungsfälle: Proportionen und Anteile, Zusammensetzung.
  • Nutzen: Einfache Darstellung von Anteilen.
  • Python-Beispiel:

    import matplotlib.pyplot as plt
    
    plt.pie(groessen, labels=beschriftungen, autopct='%1.1f%%')
    plt.title('Kreisdiagramm-Beispiel')
    plt.show()
    

8. Netzwerkgraphen

  • Anwendungsfälle: Beziehungen zwischen Entitäten, Netzwerkanalyse.
  • Nutzen: Visualisierung komplexer Beziehungen.
  • Python-Beispiel:

    import networkx as nx
    import matplotlib.pyplot as plt
    
    G = nx.Graph()
    G.add_edges_from(kanten)
    
    nx.draw(G, with_labels=True)
    plt.title('Netzwerkgraph-Beispiel')
    plt.show()
    

9. Word Clouds

  • Anwendungsfälle: Häufigkeit von Wörtern, Textanalyse.
  • Nutzen: Visualisierung von Textdaten.
  • Python-Beispiel:

    from wordcloud import WordCloud
    import matplotlib.pyplot as plt
    
    wordcloud = WordCloud().generate(text)
    
    plt.imshow(wordcloud, interpolation='bilinear')
    plt.axis('off')
    plt.show()
    

10. Geospatiale Karten

  • Anwendungsfälle: Geografische Daten, räumliche Verteilung.
  • Nutzen: Visualisierung von Standortdaten.
  • Python-Beispiel:

    import geopandas as gpd
    import matplotlib.pyplot as plt
    
    world = gpd.read_file(gpd.datasets.get_path('naturalearth_lowres'))
    world.plot()
    plt.title('Geospatial Map Example')
    plt.show()
    

11. Kontingenztabellen

  • Anwendungsfälle: Beziehungen zwischen kategorischen Variablen, Häufigkeitsverteilung.
  • Nutzen: Analyse der Zusammenhänge zwischen zwei kategorischen Variablen.
  • Python-Beispiel:

    import pandas as pd
    
    kontingenztabelle = pd.crosstab(kategorie1, kategorie2)
    print(kontingenztabelle)
    

12. Kontingenztabellen erwarteter Werte

  • Anwendungsfälle: Erwartete Häufigkeiten, Unabhängigkeitstests.
  • Nutzen: Vergleich von beobachteten und erwarteten Häufigkeiten.
  • Python-Beispiel:

    import pandas as pd
    from scipy.stats import chi2_contingency
    
    beobachtet = pd.crosstab(kategorie1, kategorie2)
    chi2, p, dof, erwartet = chi2_contingency(beobachtet)
    print(erwartet)
    

Schlussfolgerung

Datenvisualisierung ist ein mächtiges Werkzeug zum Verständnis und zur Kommunikation von Daten-Einblicken. Jede Methode hat ihre Stärken und ist für unterschiedliche Arten von Daten und Analysezielen geeignet.