In den Kapiteln 7 und 8 werden zwei- und mehrdimensionale Datensätze und Zufallsvariablen vorgestellt und beschrieben. Dabei wird die Kovarianz als Maß für den Zusammenhang zweier Zufallsgrößen diskutiert. Aufgrund einer fehlenden Normierung eignet sie sich jedoch nur bedingt zur Interpretation der Abhängigkeit. Eine geeignete Normierung liefert der Korrelationskoeffizient.
Ist der Korrelationskoeffizient ρ der Grundgesamtheit unbekannt, kann er auf Basis einer Stichprobe geschätzt werden. Die Bewertung dieser Schätzung erfolgt über einen Konfidenzbereich oder mithilfe eines Hypothesentests. Beide Verfahren werden in diesem Kapitel vorgestellt.
Der Korrelationskoeffizient r einer Stichprobe ist ein Maß dafür, wie ähnlich sich die zu untersuchenden Datensätze oder Zufallsvariablen sind. Er beschreibt den Grad der linearen Abhängigkeit. Die Daten oder Zufallsvariablen können dabei kontinuierlich oder diskret sein.
Zunächst wird der Korrelationskoeffizient zweidimensionaler Stichproben definiert. Diese Definition wird anschließend auf M-dimensionale Zufallsvektoren erweitert.