Datenerhebung Und Statistik

Datenanalyse

Von Präsmissen und Signifizanzniveaus Eine Prämisse ist eine Annahme, Voraussetzung (eines Schlusses). Der Begriff ist im 19. Jahrhundert von lateinisch praemissio wörtlich: „das Vorausgeschickte“ entlehnt. (vgl. https://de.wiktionary.org/wiki/Prämisse) Sehr oft lese ich Sätze wie “Die Hypothesen werden im Folgenden unter der Prämisse von $\alpha =$0,05 getestet.” Hinter dem $\alpha$ vesteckt sich aber keine Prämisse, sondern ein Signifikanzniveau! Unter signifikant verstehen wir wie unwahrscheinlich es ist, dass ein Ergebnis durch Zufall zustande gekommen ist.

Die Sache mit dem p-Wert

Der p-Wert an Hand eines Beispiels In der Vorlesung “Datenerhebung und Statistik” wird versucht den p-Wert zu erklären. Die Situation ist die Folgende: Wir nehmen an, der IQ sei normalverteilt mit dem Mittelwert 100 und der Standardabweichung 15. Schaut man sich nun das Histogramm der Mittelwerte von 10.000 Stichproben mit Hilfe von R an library(mosaic) # für den Befehl "do" vieleStichproben <- do(10000) * mean(rnorm(n=30, mean=100, sd=15)) qplot(vieleStichproben$mean, main="Viele Mittelwerte von normalverteilten Zufallszahlen mit µ=100 und σ=15", xlab="Stichproben Mittelwerte", ylab="abs.

Viele Daten für die Datenanalyse mit R

Hier sammle ich eine kleine Liste von Webseiten auf denen man Daten findet, mit denen man sich an der Datenanalyse versuchen kann.

Histogramme und Hypothesen

Der folgende Text stammt aus einer Mitteilung an meine Studierende. Ich muss den Text für diese Seite vielleicht noch anpassen. Exkurs: Warum Histogramme, die 10000 wiederholten Stichproben und dieser Wert bei 9500? Mir ist bei der Nachbereitung der Vorlesung aufgefallen, dass einige von Ihnen noch nicht so ganz wissen, wieso wir eine Zeile wie Simulation <- do(10000)*mean(rnorm(n=200, mean=100, sd=50)) schreiben, kurz, wieso wir simulieren und vor allem was wir simulieren und wie das ganze nun mit den Hypothesentests zusammenhängt.