1. Wahrscheinlichkeitsrechnung

1.1. Lageparameter

Lageparameter

Definition (Arithmetisches Mittel)

x1,x2,,xn seien Daten eines quantitativen Merkmals. Dann nennt man ¯x:=x1+x2++xnn=1nni=1xi

deren arithmetisches Mittel.

Hinweise

  1. Die zur Berechnung des arithmetischen Mittels notwendigen Operationen lassen sich nur bei quantitativen Merkmalen durchführen.
  2. Durch Umformung obiger Gleichung ergibt sich: n¯x=x1+x2++xn
    Die Summe aller n Einzelwerte kann man sich also durch die Summe von n gleich großen errechneten Werten ¯x ersetzt vorstellen. In diesem Sinne nimmt das arithmetische Mittel also eine Art Ersatzfunktion ein.
  3. Durch Umformung ergibt sich weiterhin, dass die Summe der Abweichungen aller Werte vom arithmetischen Mittel gleich Null ist: ni=1(xi¯x)=0
  4. Das arithmetische Mittel wird stark von „Ausreißern“ beeinflusst, also von einzelnen Daten, die stark vom Rest der Daten abweichen.

Definition (Gewogenes arithmetisches Mittel)

x1,x2,,xn seien Daten eines quantitativen Merkmals. Dann nennt man ¯x:=g1x1+g2x2++gnxng1+g2++gn=ni=1gixini=1gi

mit gi0 für i=1,2,3,,n und ni=1gi>0

das gewogene arithmetische Mittel der Daten. Dabei werden die nichtnegativen Zahlen gi als Gewichtungsfaktoren, bzw. Gewichtfaktoren bezeichnet. Sie weisen den einzelnen Werten ein höheres oder niedrigeres Gewicht zu. Alternativ ließe sich mit ganzzahligen gi auch bestimmen, wie oft ein Datum xi jeweils in der Messreihe vorkommt.

Definition (Geometrisches Mittel)

x1,x2,,xn seien Daten eines quantitativen Merkmals mit xi>0 für i=1,2,3,,n. Dann nennt man ¯xg:=nx1x2xn

deren geometrisches Mittel.

Definition (Gewogenes geometrisches Mittel)

x1,x2,,xn seien Daten eines quantitativen Merkmals mit xi>0 für i=1,2,3,,n. Dann nennt man ¯xg:=Gxg11xg22xgnn mit G=ni=1gi

deren gewogenes geometrisches Mittel.

Definition (Harmonisches Mittel)

x1,x2,,xn seien Daten eines quantitativen Merkmals mit xi>0 für i=1,2,3,,n. Dann nennt man ¯xh:=11n(1x1+1x2++1xn)

deren harmonisches Mittel.

Satz

x1,x2,,xn seien metrische Daten mit xi>0 für i=1,2,3,,n. Dann gilt:

¯xh¯xg¯x

Dabei gilt das Gleichheitszeichen nur dann, wenn x1=x2==xn

Graphische Veranschaulichung der Ungleichung für  n=2:

Für x1 und x2 gilt: ¯x=x1+x22

¯xg=x1x2
¯xh=112(1x1+1x2)

Damit gilt rechnerisch: ¯x2g=¯xh¯x

In einem Halbkreis mit Durchmesser x1+x2=2r hat der Radius gerade die Länge des arithmetischen Mittels ¯x.

Nach dem Höhensatz gilt: ¯x2g=x1x2=h2. ¯x ist Hypotenuse des "inneren" Dreiecks, dessen eine Kathete ¯xg ist. Nach obiger Rechnung gilt mit dem Kathetensatz: ¯xh¯x=¯x2g=m¯x,

wobei m der längere der beiden Hypotenusen-Abschnitte ist.

Dementsprechend lassen sich die drei „Mittel“ (für n=2 in ein rechtwinkliges Dreieck bzw. den zugehörigen Halbkreis einbeschreiben, anhand dessen sich leicht die obige Ungleichung graphisch belegen lässt.

Definition (Median)

Seien x(1)x(2)x(3)x(n) der Größe nach geordnete n Daten. Als Median wird die folgendermaßen definierte Zahl bezeichnet:

  1. Bei Daten von Rangmerkmalen x0,5:={x(n+12)bei ungeradem nx(n2) oder x(n2+1)bei geradem n
  2. Bei quantitativen nicht gruppierten Daten x0,5:={x(n+12)bei ungeradem n12(x(n2)+x(n2+1))bei geradem n

Die Schreibweise, Indizes in runde Klammern zu setzen, wird üblicherweise verwendet, um Daten zu kennzeichnen, die der Größe nach geordnet sind.

Für eine gerade Anzahl von Daten gibt es allerdings keine einheitliche Festlegung. Manchmal wird auch dabei das arithmetische Mittel aus x(n2) und x(n2+1) gewählt, so wie dies bei quantitativen Merkmalen geschieht.

Der Median zeichnet sich dadurch aus, dass er in der „Mitte“ einer der Größe nach geordneten Datenmenge liegt. Dabei sind mindestens 50% der Daten kleiner oder gleich und mindestens 50% der Daten größer oder gleich dem Median.

Zur Bestimmung dieses Wertes werden lediglich die Rangmerkmale benötigt. Quantitative Merkmale werden nicht gebraucht.

Grafik zum Median

Satz (Minimumseigenschaft des Medians)

Seien x1,x2,,xn quantitative Daten. Die Summe der absoluten Abweichungen aller Daten xi von ihrem Median ist kleiner oder gleich der Summe aller absoluten Abweichungen der Daten xi von irgendeinem anderen Wert c, ist also ein Minimum. Es gilt:

ni=1|xix0,5|ni=1|xic| für beliebiges cR

Definition (p-Quantil)

Seien x(1)x(2)x(3)x(n) der Größe nach geordnete n Daten. Eine Zahl xpR heißt p-Quantil, falls gilt: Mindestens p100% der Daten liegen vor xp, und mindestens (1p)100% der Daten liegen nach xp.

Dann berechnet sich das p-Quantil durch: xp:={x([np]+1) falls np nicht ganzzahlig ist12(x(np)+x(np+1)) falls np ganzzahlig ist

Dabei wird unter dem Symbol [np] die größte ganze Zahl verstanden, die kleiner oder gleich np ist.

Hinweise

  1. Für p=0,5 ergibt sich gerade der Median.
  2. p-Quantile kommen in der Praxis häufig vor. Dabei sind die folgenden Bezeichnungen üblich:
    • x0,25 heißt erstes Quartil (auch unteres Quartil).
    • x0,5 heißt zweites Quartil (Median).
    • x0,75 heißt drittes Quartil (auch oberes Quartil).
    • x0,1 heißt erstes Dezil.
    • x0,9 heißt neuntes Dezil.
    Das untere Quartil, der Median und das obere Quartil spielen bspw. in Box-Plot-Diagrammen eine Rolle.