Die Verfahren zur Datenanalyse multivariater Daten sind von dem Merkmalstyp des Eingangssignals und der Zielgröße abhängig. Korrelationsfunktionen und Regressionsfunktionen beschreiben die Abhängigkeit von Zielgrößen als Funktion kontinuierlicher oder diskreter Eingangsgrößen. Leider versagt diese mathematische Beschreibung bei ordinalen oder gruppierenden Eingangsgrößen. Zum Beispiel lässt sich die Frage, ob Spritzgussteile aus unterschiedlichen Formnestern A - D gleiche Abmessungen besitzen, nicht mit Regressionsfunktionen beantworten. Mithilfe eines Hypothesentests könnte bewertet werden, ob die Teile aus zwei Formnestern dieselbe Geometrie haben. Die vorgestellten Hypothesentests versagen jedoch bei mehr als zwei Gruppen. Die Varianzanalyse (ANOVA, Analysis of Variance) schließt diese Lücke und bewertet den Einfluss einer oder mehrerer ordinaler Eingangsgrößen auf eine diskrete oder stetige Ausganggröße.
Die Varianzanalyse wird mit einem Beispiel eingeführt. Bei der Fertigung von Bolzen muss sichergestellt werden, dass unterschiedliche Fertigungseinrichtungen zu beliebigen Zeitpunkten dieselbe Qualität liefern. Als kritisches Qualitätsmerkmal der Bolzen wird der Bolzendurchmesser d gemessen, der normalen Fertigungsschwankungen unterliegt. Bei der Auswertung jeweils einer Stichprobe pro Fertigungscharge variiert der Mittelwert der Stichproben. Deshalb ist ein direkter Vergleich der Stichprobenmittelwerte von Charge zu Charge nicht aussagekräftig. Bild 9.1 verdeutlicht diesen Zusammenhang für vier Fertigungschargen 1 - 4.
Bild 9.1: Streuung der Stichprobenwerte bei der Fertigung von Bolzen und unterschiedlichen Fertigungschargen
Um zu entscheiden, ob die unterschiedlichen Chargen einen signifikanten Unterschied besitzen, muss versucht werden, den Einfluss der unterschiedlichen Chargen von der typischen Varianz des Prozesses zu trennen. Dies ist eine Aufgabe der einfaktoriellen Varianzanalyse. Die einfaktorielle Varianzanalyse prüft, ob zumindest eine Stichprobe signifikant von den anderen abweicht.
Bei der Optimierung von Fertigungsprozessen werden teilweise auch ganz gezielt Fertigungsparameter geändert. In diesem Fall wird der Einfluss unterschiedlicher Parameteränderung auf die Zielgröße untersucht. Sollen M Einflussparameter gleichzeitig untersucht werden, müssen die von den Einflussfaktoren hervorgerufenen Varianzen und die normale Fertigungsvarianz voneinander getrennt werden. Dies ist eine Aufgabe der M-faktoriellen Varianzanalyse, die im Folgenden als ein- und zweifaktorielle Varianzanalyse hergeleitet und dann auf eine mehrfaktorielle Varianzanalyse verallgemeinert wird.
Diese Aufgabenstellungen werden bei der klassischen Varianzanalyse unter der Annahme bearbeitet, dass die Gruppen von Zahlen aus normalverteilten Grundgesamtheiten entstammen, die alle dieselbe Varianz σ2 besitzen. Die Varianz σ2 muss dabei nicht bekannt sein. Diese Annahme ist durch geeignete Hypothesentests vor Durchführen einer Varianzanalyse zu prüfen. Sind die Annahmen nicht erfüllt, müssen parameterfreie Tests durchgeführt werden.