Teil C - Stochastische Signale > Beschreibende Statistik multivariater Daten > Darstellung und Charakterisierung zweidimensionaler Datensätze > Randhäufigkeit > 

Darstellung und Charakterisierung zweidimensionaler Datensätze

Randhäufigkeit

Die Kontingenztafel wird mit der Reihen- und Spaltensummen der einzelnen Häufigkeiten ergänzt. Zum Beispiel ist die Summe aller in Schicht 1 gefertigter Bauteile 5115 und die Summe aller am Dienstag gefertigten Produkte 3056. Die Summe aller gefertigten Teile ergibt sich zu 15240. Die Reihen- und Spaltensummen werden als absolute Randhäufigkeiten bezeichnet. Die Spaltensummen werden abgekürzt mit

(5.1)

und die Reihensummen entsprechend mit

(5.2)

bezeichnet. Die sich ergebenden Randhäufigkeiten ha(x) sind die Häufigkeiten, mit der das jeweilige Merkmal x die Werte x1, x2, …, xm angenommen wird, wenn das Merkmal y unberücksichtigt bleibt. Entsprechendes gilt für die Reihensummen. Beide hängen nur noch von einer Variablen ab.

Die Summe aller absoluten Häufigkeiten n ergibt sich aus

(5.3)

Allgemein ergibt sich für zweidimensionale Datensätze damit eine Kontingenztabelle, wie sie in Tabelle 5.3 dargestellt ist.

Tabelle 5.3: Allgemeine Darstellung einer Kontingenztafel mit absoluter Häufigkeit
  y 1 y 2 y l Summe
x 1 h a (x 1 ,y 1 ) h a (x 1 ,y 2 ) h a (x 1 ,y l ) h a (x 1 )
x 2 h a (x 2 ,y 1 ) h a (x 2 ,y 2 ) h a (x 2 ,y l ) h a (x 2 )
x m h a (x m ,y 1 ) h a (x m ,y 2 ) h a (x m ,y l ) h a (x m )
Summe h a (y 1 ) h a (y 2 ) h a (y l ) n

 

Entsprechend der Darstellungen zu univariaten Datensätzen kann alternativ die relative Häufigkeit von Ereignissen dargestellt werden. Dabei werden die einzelnen Häufigkeiten durch die Gesamtanzahl n dividiert.

(5.4)

Für das Beispiel aus Tabelle 5.2 ergibt sich die in Tabelle 5.4 dargestellte Kontingenztafel der relativen Häufigkeit.

Tabelle 5.4: Kontingenztafel der relativen Häufigkeit für die Fertigungsstatistik eines Produktes
  Mo Di Mi Do Fr Summe
Schicht 1 0.066 0.065 0.068 0.064 0.073 0.336
Schicht 2 0.068 0.076 0.076 0.072 0.073 0.365
Schicht 3 0.059 0.059 0.063 0.059 0.059 0.297
Summe 0.193 0.200 0.207 0.195 0.205 1

 

Die Randsummen der relativen Häufigkeit werden als relative Randhäufigkeiten bezeichnet. Analog zu der absoluten Randhäufigkeiten ha(x) ergibt sich für die relativen Randhäufigkeiten h(x)

(5.5)

und

(5.6)

Die allgemeinen Bezeichnungen für relative Häufigkeiten sind analog zur absoluten Häufigkeit in Tabelle 5.5 zusammengefasst.

Tabelle 5.5: Allgemeine Darstellung einer Kontingenztabelle mit relativer Häufigkeit
  y 1 y 2 y l Summe
x 1 h(x 1 ,y 1 ) h(x 1 ,y 2 ) h(x 1 ,y l ) h(x 1 )
x 2 h(x 2 ,y 1 ) h(x 2 ,y 2 ) h(x 2 ,y l ) h(x 2 )
x m h(x m ,y 1 ) h(x m ,y 2 ) h(x m ,y l ) h(x m )
Summe h(y 1 ) h(y 2 ) h(y l ) 1