Lehre

SBI - Simulation Based Inference

Wenn meine Tochter SBI hört, denkt sie an Sally Bollywood Investigation. – Und ich oft auch. – Mit SBI ist hier aber nicht der Trickfilm für Kinder, sondern Simulation Based Inference, gemeint. Angestachelt von Prof. Dr. Karsten Lübke und im Schlepptau von Prof. Dr. Oliver Gansser, Prof. Dr. Matthias Gehrke und Prof. Dr. Bianca Krol haben ein paar kluge Köpfe bei der FOM den Unterricht für Statistik auf eine neue Grundlage zu stellen.

Ein wenig schneller zur simulierten Nullverteilung

Ein Nullhypothesentest ist schnell geschrieben. Will man den approximativen Weg gehen, so hilft R einem mit entsprechenden Tests mit einfachen Befehlen. Nimmt man MOSAIC dazu, so bekommt man u.a. für den Test auf Anteils- oder Mittelwerte sogar einen sehr einfachen, weil einheitlichen, Syntax. Zwei Beispiele für approximative Hypothesentests mit MOSAIC Laden wir unsere Testdaten, die tipping Daten wie folgt: library(mosaic) download.file("https://goo.gl/whKjnl", destfile = "tips.csv") tips <- read.csv2("tips.csv") set.seed(2009) Dann erstellen wir zwei Forschungsfragen:

Nur ein wenig lineare Regression

Der tipping Datensatz wird oft analysiert. Das Verhältnis von Trinkgeld (tip) und Rechnungsbetrag (total_bill) steht dabei im Vordergrund einer lineare Regressionsanalyse. So auch hier. Wir wollen die einzelnen Angaben von R dabei in den Fokus rücken und einmal Hinterfragen, was wir bei der Ausgabe von R eigentlich genau sehen, woher es kommt und wie man es interpretieren kann. Zunächst laden wir dazu die tipping Daten mittels library(mosaic) download.file("https://goo.gl/whKjnl", destfile = "tips.

Prognose-, Konfidenz- und Fiduzialintervalle

*WORK IN PROGRESS Dieser Eintrag ist noch nicht fertig und wird in der Zukunft erweitert! Konfidenzintervalle Definition von Konfidenzintervallen1 Für unabhängig identisch verteilte Zufallsvariablen (X_1,\dotsc, X_n) mit unbekanntem reellen Verteilungsparameter (\vartheta) kann unter bestimmten Umständen zwei Stichprobenfunktionen (U) und (V) angeben, so dass [P(U < \vartheta < V) \geq \gamma] gilt, mit (\gamma \in (0,1)). Dann heißt das (stochastische) Intervall ([U, V]) ein Konfidenzintervall für (\vartheta) zum Konfidenzniveau (\gamma) (auch: ein (\gamma)-Konfidenzintervall).

Konfidenzintervalle

Zentrales Schwankungsintervall

Quartile, Quantile, Perzentile etc.

“Was hat das eigentlich mit den Quartilen, Quantilen und so weiter auf sich?” Diese Frage kommt ab und zu in Vorlesungen zur Statistik vor. Dabei ist die Antwort recht einfach. Quantile Definitorische Antwort Für eine gegebene reelle Zufallsvariable (X) heißt eine reelle Zahl (x_p) ein p-Quantil (von (X)), falls gilt: [P(X \leq x_p) \leq p \quad \text{ und }\quad P(x_p \leq X) \geq 1-p.] Was bedeutet das denn nun konkret?

10 Dinge die kein Talent benötigen!