In der Serienfertigung und der automatisierten Messtechnik entsteht eine Vielzahl von Daten. Die Datensätze sind oft komplex und unübersichtlich, eine Interpretation aller Daten im Detail ist zudem zeitaufwändig. Vor diesem Hintergrund ist es erforderlich, die Daten übersichtlich darstellen oder auf Kenngrößen komprimieren zu können.
Die Notwendigkeit der grafischen Darstellung unterstreicht ein Datensatz, der als Quadrat von Anscombe bekannt ist (Anscombe 1973). Er ist in Bild 3.1 grafisch dargestellt und besteht aus vier DatenÂsätzen mit jeweils 11 Datenpunkten, die sehr unterschiedliche Zusammenhänge beschreiben.
Bild 3.1: Grafische Darstellung der Daten des Quadrats von Anscombe und der entsprechenden Regressionsgerade
Alle Datensätze besitzen dieselben charakteristischen Kenngrößen, die in Tabelle 3.1 zusammengefasst sind.
Tabelle 3.1: Kennwerte des Anscombe Quadrat
Variable x | Variable y | |
Mittelwert |
![]() |
![]() |
Standardabweichung |
![]() |
![]() |
Korrelation |
![]() |
Sogar die Berechnung einer Ausgleichgeraden würde in allen Fällen zu der Gerade
(3.1) |
führen.
Das Beispiel macht deutlich, dass sowohl eine explorative Datenanalyse mit grafischen Auswertungen als auch eine numerische Beschreibung über Kenngrößen in Kombination nötig sind, um einen Datensatz einerseits zu verstehen und andererseits mathematisch sinnvoll weiterzuverarbeiten und kompakt darstellen zu können. Als Einstieg in die Statistik beschäftigt sich dieses Kapitel deshalb mit der Frage, wie Daten numerisch und grafisch aufbereitet werden können. Anschließend wird die zusammenfassende Beschreibung von Datensätzen mit Hilfe statistischer Kenngrößen eingeführt.