Seite ausdrucken | Fenster schließen


Beschreibende Statistik univariater Daten

In der Serienfertigung und der automatisierten Messtechnik entsteht eine Vielzahl von Daten. Die Datensätze sind oft komplex und unübersichtlich, eine Interpretation aller Daten im Detail ist zudem zeitaufwändig. Vor diesem Hintergrund ist es erforderlich, die Daten übersichtlich darstellen oder auf Kenngrößen komprimieren zu können.

Die Notwendigkeit der grafischen Darstellung unterstreicht ein Datensatz, der als Quadrat von Anscombe bekannt ist (Anscombe 1973). Er ist in Bild 3.1 grafisch dargestellt und besteht aus vier Daten­sätzen mit jeweils 11 Datenpunkten, die sehr unterschiedliche Zusammenhänge beschreiben.

Bild 3.1: Grafische Darstellung der Daten des Quadrats von Anscombe und der entsprechenden Regressionsgerade

Alle Datensätze besitzen dieselben charakteristischen Kenngrößen, die in Tabelle 3.1 zusammengefasst sind.

Tabelle 3.1: Kennwerte des Anscombe Quadrat

  Variable x Variable y
Mittelwert
Standardabweichung
Korrelation

 

Sogar die Berechnung einer Ausgleichgeraden würde in allen Fällen zu der Gerade

(3.1)

führen.

Das Beispiel macht deutlich, dass sowohl eine explorative Datenanalyse mit grafischen Auswertungen als auch eine numerische Beschreibung über Kenngrößen in Kombination nötig sind, um einen Datensatz einerseits zu verstehen und andererseits mathematisch sinnvoll weiterzuverarbeiten und kompakt darstellen zu können. Als Einstieg in die Statistik beschäftigt sich dieses Kapitel deshalb mit der Frage, wie Daten numerisch und grafisch aufbereitet werden können. Anschließend wird die zusammenfassende Beschreibung von Datensätzen mit Hilfe statistischer Kenngrößen eingeführt.