Kaufen Frauen wirklich häufiger Unterwäsche als Männer?
Es scheint Unterscheide im Konsumverhalten der Geschlechter zu geben, siehe z. B. (Pentecost and Andrews 2010).
Aber gilt dies auch für junge Dortmunder*innen, die neben dem Beruf studieren? Insbesondere: gilt dies auch für Unterwäsche?
Das Geschlecht kann recht einfach erfragt werden, aber die Ermittlung der Kauffrequenz ist schon schwieriger. Man könnte fragen: “Wie oft haben Sie in den letzten 24 Monaten Unterwäsche gekauft?” Diese Fragen können viele nicht wirklich gut beantworten. Eine Alternative ist zu fragen, wie lange der letzte Kauf her ist. Die Erhebung der Kauffrequenz erfolgte hier daher über diese Frage:
“Vor wie vielen Tagen haben Sie zuletzt Unterwäsche gekauft?”
Als Stichprobenverfahren wurde hier eine Gelegenheitsstichprobe verwendet: eine anonyme, freiwillige Papier+Bleistift Umfrage in der Vorlesung.
Die Datenerhebung erfolgte in drei Statistik Vorlesungen an der FOM Dortmund im Studiengang BBA/BAIM/BST. Die Rohdaten liegen als xlsx
Datei vor.
# Ggfs. Paket readxl installieren
# install.packages("readxl")
# Paket laden
library(readxl)
# Daten einlesen
uwaesche <- read_excel("Uwaesche.xlsx")
Vorbereitung:
# Ggfs. Paket mosaic installieren
# install.packages("mosaic")
# Paket laden
library(mosaic)
# Erste Datenübersicht
inspect(uwaesche)
##
## categorical variables:
## name class levels n missing
## 1 Geschlecht character 2 174 0
## distribution
## 1 m (51.1%), w (48.9%)
##
## quantitative variables:
## name class min Q1 median Q3 max mean sd n missing
## ...1 Tage numeric 1 30 77.5 120 420 94.1954 86.22016 174 0
Es liegen \(n=174\) Beobachtungen von 2 Variablen vor. Als kategoriale Variable “Geschlecht” und als numerische “Tage”, d. h. die Anzahl Tage seit letztem Unterwäschekauf.
Das Histogramm der Verteilung zeigt eine deutlich rechtsschiefe Verteilung:
gf_histogram(~ Tage, data = uwaesche)
Ein Dichteplot legt zudem nahe, dass sich die Verteilungen zwischen Männern und Frauen unterscheiden:
gf_density(~ Tage, fill = ~ Geschlecht, alpha = 0.5, data = uwaesche)
Es scheint so zu sein, dass das weibliche Geschlecht einen höheren Anteil an Personen hat, die vor kürzerer Zeit Unterwäsche gekauft haben. Dies wird auch durch einen Boxplot bestätigt:
gf_boxplot(Tage ~ Geschlecht, data = uwaesche)
Unteres Quartil, obereres Quartil und Median sind bei den Frauen geringer. Der Interquartilsabstand bei den Männern größer. Bei beiden Geschlechtern gibt es Ausreißer nach oben.1
Das, was die Abbildungen zeigen, zeigt sich auch in den Kennzahlen:
favstats(Tage ~ Geschlecht, data = uwaesche)
Sowohl im Median als auch im arithmetischen Mittelwert liegen die Geschlechter über einen Monat in der Zeit seit dem letzten Unterwäschekauf auseinander.
Für die Stichprobe stimmt also die Forschungsthese, dass berufstätig in Dortmund studierende Frauen häufiger Unterwäsche kaufen als Männer, da der letzte Einkauf kürzer zurückliegt.2
Aufgrund der Schiefe kann nicht von einer Normalverteilung ausgegangen werden, ein Permutationstest ist aber möglich, wenn die Verteilung unter \(H_0\) gleich ist: \(F_w=F_m\). Dann kann \(m\) und \(w\) permutiert werden.
Liefern die Daten Belege für die Forschungsthese in der Population? Da aus der Literatur eine Richtung vermutet werden kann, wird hier gerichtet getestet.3. Eine Analyse ist z. B. über den arithmetischen Mittelwert möglich:
\[H_0: \mu_w \geq \mu_m \quad vs. \quad H_A: \mu_w < \mu_m\]
# Beobachtete Differenz
diff.stipro <- diffmean(Tage ~ Geschlecht, data = uwaesche)
diff.stipro
## diffmean
## -42.47323
# Reproduzierbarkeit
set.seed(1896)
# Permutation
Nullvtlg <- do(10000) * diffmean(Tage ~ shuffle(Geschlecht), data = uwaesche)
Verteilung der Teststatistik, wenn die Nullhypothese der Gleichheit der Verteilungen gilt:
gf_histogram( ~ diffmean, data = Nullvtlg) %>%
gf_vline(xintercept = ~ diffmean(Tage ~ Geschlecht, data = uwaesche))
Der beobachtete Unterschied von \(\bar{x}_w-\bar{x}_m=-42\) ist unwahrscheinlich, wenn Gleicheit der Verteilungen gilt:
# P-Wert
p.value <- prop(~ (diffmean <= diff.stipro), data = Nullvtlg)
p.value
## prop_TRUE
## 3e-04
Der Anteil der \(10000\) Simulationen mit mindestens so großen negativen Abweichungen wie in der Stichprobe, wenn die Nullhypothese in der Population stimmt, liegt bei \(3\times 10^{-4}\), d.h. der p-Wert ist kleiner als \(0.1\%\).
Der Unterschied ist damit signifikant. Ist er auch relevant? Betrachten wir dazu die Effektgröße Cohens d:
# Ggfs. Paket lsr installieren
# install.packages("lsr")
# Paket laden
library(lsr)
# Cohens d
d.stipro <- cohensD(Tage ~ Geschlecht, data = uwaesche)
d.stipro
## [1] 0.5068874
Es liegt ein mittlerer Effekt des Geschlechts auf die Anzahl Tage seit letztem Unterwäschekauf vor.
Der Punktschätzer für die Differenz liegt bei \(\hat{\mu}_w - \hat{\mu}_m = \bar{x}_w-\bar{x}_m=-42\).
# Reproduzierbarkeit
set.seed(1896)
# Bootstrap
Bootvtlg <- do(10000) * diffmean(Tage ~ Geschlecht, data = resample(uwaesche))
Der Standardfehler \(se\) für die Differenz der Mittelwerte kann anhand der Bootstrap Verteilung geschätzt werden:
# Standardfehler se
se.boot <- sd( ~ diffmean, data = Bootvtlg)
se.boot
## [1] 12.67265
Die Bootstrap Verteilung für die Differenz sieht wie folgt aus:
gf_histogram( ~ diffmean, data = Bootvtlg)
quantile( ~ diffmean, probs = c(0.025, 0.975), data = Bootvtlg)
## 2.5% 97.5%
## -67.58301 -18.02143
Das \(95\%\)-Resampling-Konfidenzintervall für die Differenz der Mittelwerte geht von -68 bis -184 (\(\bar{x}_w-\bar{x}_m=-42; \quad se=12.67\)).
Das Paket dabestr
bietet ein sehr schöne Übersicht des Ergebnisses über Estimation Plots (Ho et al. 2019):
# Ggfs. Paket dabestr installieren
# install.packages("dabestr")
# Paket laden
library(dabestr)
dabest(uwaesche, Geschlecht, Tage,
idx = c("m", "w"),
paired = FALSE) %>%
mean_diff() %>%
plot()
Aufgrund der Größe des Stichprobe5 kann auch ein parametrischer t-Test (gerichtet) durchgeführt werden, der zum selben Ergebnis kommt.6
t.test(Tage ~ Geschlecht, data = uwaesche, alternative = "greater")
##
## Welch Two Sample t-test
##
## data: Tage by Geschlecht
## t = 3.3546, df = 169.83, p-value = 0.0004902
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
## 21.53292 Inf
## sample estimates:
## mean in group m mean in group w
## 114.94382 72.47059
Kaufen Frauen (wirklich) häufiger Unterwäsche als Männer?
Anhand der vorliegenden Daten, bezogen auf den arithmetischen Mittelwert lautet die Antwort: Ja. Im Mittelwert haben Frauen das letzte Mal vor 72 (\(sd=77\)) Tagen Unterwäsche gekauft, Männer vor 115 (\(sd=90\)). Dies ist mittlerem Effekt (\(d=0.51\)). Die Nullhypothese der Gleichheit wird mit einem p-Wert \(<0.001\) verworfen.
Da es sich um eine Beobachtungsstudie handelt sind keine Kausalaussagen möglich. Auch wurden außer dem Geschlecht keine weiteren Variablen wie z. B. Einkommen oder Modebewußtsein erhoben, die auch einen Einfluss auf die Kauffrequenz haben können. Aufgrund der Gelegenheitsstichprobe kann maximal auf an der FOM BBA/BAIM/BST Studierende geschlossen werden, sofern davon ausgegangen wird, dass der Standort Dortmund repräsentativ ist. Z. B. könnten ältere Menschen ein anderes Einkaufsverhalten haben. Auch ist die Validität der Messung ggf. eingeschränkt, da nicht die tatsächliche Kauffrequenz, sondern nur die Erinnerung erhoben wurde.
Verwendete Pakte:
mosaic
Version: 1.8.2ggformula
Version: 0.9.4lsr
Version: 0.5readxl
Version: 1.3.1dabestr
Version: 0.3.0Ho, Joses, Tayfun Tumkaya, Sameer Aryal, Hyungwon Choi, and Adam Claridge-Chang. 2019. “Moving Beyond P Values: Everyday Data Analysis with Estimation Plots.” bioRxiv. https://doi.org/10.1101/377978.
Pentecost, Robin, and Lynda Andrews. 2010. “Fashion Retailing and the Bottom Line: The Effects of Generational Cohorts, Gender, Fashion Fanship, Attitudes and Impulse Buying on Fashion Expenditure.” Journal of Retailing and Consumer Services 17 (1): 43–52. https://doi.org/https://doi.org/10.1016/j.jretconser.2009.09.003.
Hoffentlich wird die Unterwäsche wenigstens öfter gewechselt…↩︎
Bei mehr oder weniger gleichmäßigen Kaufintervallen kann von der Dauer seit dem letzten Kauf auf die Anzahl Anzahl der Käufe in einem Zeitraum geschlossen werden.↩︎
Standardfall: ungerichtet!↩︎
Die mittlere Differenz von \(0\) Tagen (kein Unterschied) ist nicht im Konfidenzintervall enthalten.↩︎
Zentraler Grenzwertsatz↩︎
Beachte, dass statt \(\mu_w-\mu_m\) (Permutation, diffmean()
) im t-Test \(\mu_m-\mu_w\) analysiert wird.↩︎