Gedankenstütze zu wichtigen Funktionsbegriffen in der Statistik

Eine kleine Liste von fundermentalen Begriffen in der Statistik.

Gilt für eine reelle Funktion \(f: \mathbf{R} \to \mathbf{R}\):

  • \(f(x)\) ist nichtnegativ, d.h., \(f(x) \geq 0\), für alle \(x \in \mathbf{R}\).
  • \(f(x)\) ist integrierbar.
  • \(f(x)\) ist normiert in dem Sinne, dass \[\int_{-\infty}^\infty f(x) \text{d}x = 1\]

Dann nennen wir \(f(x)\) eine Wahrscheinlichkeitsdichtefunktion (engl. probability density funktion kurz pdf) oder kurz Dichte (engl. density).

Durch \[P([a, b]) := \int_a^b f(x) \text{d} x\] definiert \(f\) eine Wahrscheinlichkeitsverteilung auf den reellen Zahlen.

Ist \(X\) eine reelwertige Zufallsvariable (kurz ZV) und existiert eine reelle Funktion \(f_X(x)\) der Art, dass für alle \(a \in \mathbf{R}\)

\[P(X \leq a) = \int_{-\infty}^a f_X(x) \text{d}x\]

gilt, so nennt man \(f\) die Wahrscheinlichkeitsdichtefunktion von \(X\).

Die Funktion

\[F_X(a) = P(X \leq a)\]

nenen wir (Wahrscheinlichkeits-)Verteilung(-sfunktion) (engl. cumulative distribution function kurz cdf aber auch nur distribution function) von \(X\).

Genau dann ist eine Funktion \(F: \mathbf{R} \to [0, 1]\) eine Verteilungsfunktion, wenngilt:

  • Es ist \(\lim_{t \to -\infty} F(t)=0\) und \(\lim_{t \to +\infty} F(t)=1\)
  • Die Funktion \(\overline{F}(t)\) ist monoton wachsend.
  • Die Funktion \(\overline{F}(t)\) ist rechtsseitig stetig

Die Funktion

\[\overline{F}_X(a) = 1 - F_X(a)\]

nennen wir Überlebensfunktion (engl. survival function, complementarey cumulative distribution funktion kurz ccdf, tail distribution, exceedance oder reliability function).

Es gilt \(\overline{F}_X(a) + F_X(a) = 1\).

Genau dann ist eine Funktion \(\overline{F}: \mathbf{R} \to [0, 1]\) eine Überlebensfunktion, wenn gilt:

  • Es ist \(\lim_\limits{t \to -\infty} \overline{F}(t)=1\) und \(\lim_{t \to + \infty}\overline{F}(t)=0\)
  • Die Funktion \(\overline{F}(t)\) ist monoton fallend.
  • Die Funktion \(\overline{F}(t)\) ist rechtsseitig stetig

Ein paar weitere Eigenschaften von Überlebensfunktionen:

  • Nicht-negative stetige ZV \(X\) mit Erwartungswert, also \(\int_0^\infty x f(x) \text{d} x = \mu < \infty\), erfüllen die Markov-Ungleichung

\[\overline{F}_X(x) \leq \frac{\operatorname{E}(X)}{x}\] - Ist \(X\) eine ZV und \(\overline{F}_X\) die zugehörige Überlebensfunktion. Existiert \(E(X)\), dann gilt \(\lim_{t \to +\infty}\overline{F}(x)=0 = o\left(\frac{1}{x}\right)\). Beweisskizze: Sei \(f_X\) die Dichtefunktion von \(F_X\) zur ZV \(X\). Fü jedes \(c>0\) ist dann $$\[\begin{align*} E(X) = \int_0^\infty x \cdot f_X(x) \text{d}x &= \int_0^cx \cdot f_X(x) \text{d}x +\int_c^\infty x \cdot f_X(x) \text{d}x \\ &\geq \int_0^cx \cdot f_X(x) \text{d}x +\int_c^\infty c \cdot f_X(x) \text{d}x \\ &= \int_0^cx \cdot f_X(x) \text{d}x + c \cdot \int_c^\infty f_X(x) \text{d}x \\ &= \int_0^cx \cdot f_X(x) \text{d}x +c \cdot \overline{F}(c) \end{align*}\]$$

Damit gilt nun: \[0 \leq c \cdot \overline{F}(c) \leq E(X) - \int_0^cx \cdot f_X(x) \text{d}x\] Wegen \(\lim\limits_{c \to +\infty} \int_0^cx \cdot f_X(x) \text{d}x = E(X)\) folgt: \[0 \leq c \cdot \overline{F}(c) \leq E(X) - \int_0^cx \cdot f_X(x) \text{d}x\to 0 \text{ wenn } c \to \infty\] - Für nicht-negative ZV \(X\) gilt: \[E(X) = \int_0^\infty \overline{F}_X(x) \text{d} x\]

Norman Markgraf
Norman Markgraf
Diplom-Mathematiker

Norman Markgraf ist freiberuflicher Dozent für Mathematik, Statistik, Data Science und Informatik, sowie freiberuflicher Programmierer.

Ähnliches