1 Vorbereitung

2 Aufgabe OE

Eine Organisationsentwicklungsabteilung möchte herausfinden, was die Ursachen für Unterschiede in der Motivation ihrer Mitarbeiter sind. Dazu berechnet ein Mitarbeiter den Zusammenhang von der Zufriedenheit mit der direkten Führungskraft (Variable: zuf) und der Arbeitsmotivation (engagement); der Datensatz mit den Daten heiße d (keine echte Daten; es ist ein theoretische Aufgabe).

  1. Schreiben Sie die R-Syntax, um ein 95%-Konfidenzintervall zu berechnen!
  2. Der Abteilungsleiter stöhnt, “So kompliziert! Inferenzstatistik braucht doch kein Mensch!” Erläutern Sie, in welchen Fällen bzw. wozu Inferenzstatistik nützlich ist.

LÖSUNG

  1. Syntax (hier nur theoretisch, also ohne echte Daten)
  1. Argumentation zum Chef

“Möchte man nur Aussagen treffen über eine Stichprobe, braucht man keine Inferenzstatistik. Möchte man von einer Stichprobe auf eine Grundgesamtheit schließen, so quantifiziert die Inferenzstatistik die Ungewissheit dieses Schlusses”.

3 Aufgabe Vertrieb

Ein Business-Development-Abteilung untersucht, ob die neue Version des Webshops ihrer Firma mehr Vertriebserfolg bringt als die alte Version (version). Vertriebserfolg wird gemessen als der Anteil der Besucher der Seite, die etwas kaufen beim aktuellen Besuch (buyer). (Der Datensatz heiße d; keine echte Daten; es ist ein theoretische Aufgabe).

  1. Ist folgende Syntax korrekt, um herauszufinden, ob die neue Seite signifikant mehr Umsatz erzielt als die alte Seite?
  1. Korrigieren Sie die Syntax ggf.

  2. Was würde ein Konfidenzintervall hier aussagen?

LÖSUNG

  1. Nein.

  2. Korrekte Syntax:

  1. KI: Das KI gibt einen Schätzbereich für den gesuchten Parameter an, hier also die Größe des Unterschieds in den Kaufquoten.

4 Aufgabe Eignungstest

Die Personalabteilung einer technisch orientierten Firma möchte einen Wissenstest zur Diagnose der Berufseignung implementieren. Der zuständige Facharbeiter entwirft 20 Wissensitems (Aussagen) zu einem IT-technischen Wissensgebiet, die jeweils mit Richtig bzw. Falsch zu beantworten sind (d.h. jede Aussage ist entweder richtig oder falsch). Jetzt überlegt sie: “Hm, wie viele Items muss eine Bewerberin richtig beantworten, damit wir sicher genug sind, dass sie nicht bloß geraten hat?”.

  1. Berechnen Sie die Anzahl für eine Sicherheit von 95%!
  2. Wie lauter der Fachbegriff für die Wahrscheinlichkeit, die die Facharbeiterin oben anspricht?
  3. Die erste Bewerberin hat 13 Aufgaben richtig; angenommen sie hat geraten, wie hoch ist die Wahrscheinlichkeit für dieses (oder ein noch extremes) Ergebnis?
  4. Wie 2) nur mit 15 Treffern.
  5. Angenommen, eine Bewerberin, Frau Sch. Ummel, mit 15 Treffern wird eingestellt. Tatsächlich hat sich aber nur geraten. Die Personalabteilung denkt als fälschlich, sie hätte einen “Treffer” (Effekt) gefunden. Nennen Sie den statistischen Fachbegriff für diese Art von Fehler.

LÖSUNG

  1. Anzahl nötiger Treffer:

Jetzt ausprobieren:

## prop_TRUE 
##     0.128
## prop_TRUE 
##      0.05
## prop_TRUE 
##     0.019

Antwort: 15 Treffer. Bei 15 Treffern ist die Wahrscheinlichkeit <5% (für so ein oder noch extremeres Ereignis), wenn man bloß rät. MaW: Der p-Wert ist kleiner als 5%.

Eleganter:

##   95% 
## 13.05

Man könnte die Münzwurfverteilung (sog. Binominalverteilung) durch die Normalverteilung approximieren. Berechnen wir dazu zunächst die Streuung (sd) und den Mittelwert (M) unserer Stichprobenverteilung der Münzwürfe:

## [1] 9.995

Dann können wir uns das Quantil (d.h. den Cutoff-Wert, X-Achse) bequem ausgeben lassen (unter Annahme einer Normalverteilung, was hier ausreichend gegeben ist).

## 
## If X ~ N(10, 2.218535), then
##  P(X <= 13.64917) = 0.95
##  P(X >  13.64917) = 0.05
## 

## [1] 13.64917

Antwort: Etwa 14 Treffer sind nötig, um einen Fehlalarm mit mind. 95% Wahrscheinlichkeit auszuschließen.

  1. Die Facharbeiterin spricht den p-Wert an. Der p-Wert ist der Anteil der Stichprobenergebnisse in der H0-Verteilung, die mind. so extrem sind wie das echte (empirische) Ergebnis. Das istn nicht genau das, was die Facharbeiterin gesagt hat, aber es geht in eine ähnliche Richtung und der p-Wert ist das beste Maß zur Entscheidung über eine Hypothese, das wir in diesem Kurs kennenlernen.

  2. \(p = 13\%\)

  3. \(p = 2\%\)

  4. Es handelt sich um einen Alphafehler oder Fehler 1. Art

5 Aufgabe “Freies Spiel der Kräfte”

Recherchieren Sie einen Datensatz, der zu ihrem (angestrebten) Berufsbild passt und importieren Sie ihn in Ihr RStudio. Treffen Sie ggf. Annahmen für den weiteren Verlauf der Aufgabe wo nötig.

  1. Nennen Sie eine Forschungsfrage für einen ungerichteten Zusammenhang (zu diesem Datensatz)!
  2. Berechnen Sie die relevanten deskriptiven Statistiken!
  3. Visualisieren Sie die Datenlage zur Ihrer Forschungsfrage!
  4. Berechnen Sie ein Konfidenzintervall für die Forschungsfrage!
  5. Formulieren Sie die passenden formalen statistischen Hypothesen dazu.
  6. Berechnen Sie den p-Wert!
  7. Nennen Sie die statistische Entscheidung und begründen Sie sie.