Eine Schlagzeile vom 16.11.2020 lautet (Link):
Frauen in Firmen-Vorständen sind besser bezahlt als Männer
Kann das sein? Mensch denkt doch immer eher, das Frauen im Job benachteiligt werden.
Ja, beides kann gleichzeitig stimmen: Frauen können im Job benachteiligt werden und Frauen können als Vorstand ein höheres Gehalt erzielen als Männer.
Warum soll diese kleine, fiktive R
Simulation zeigen:
Laden wir zunächst mosaic
:
library(mosaic)
Setzen wir den Zufallszahlengenerator und sagen, dass wir das berufliche Schicksal von \(n=10000\) Menschen simulieren wollen:
set.seed(1896)
# Stichprobenumfang
n <- 10000
Und hier die qualitativen Annahmen des datengenerierenden Prozesses:
Die Fähigkeit für den (Vorstands-)Job ist unabhängig vom Geschlecht.
Ob jemand in den Vorstand kommt hängt ab von der Fähigkeit und dem Geschlecht. Frauen müssen fähiger sein als Männer - so hier die Annahme.
Das Gehalt, das eine Person bekommt, hängt ab von der Fähigkeit (fähigere Leute verdienen mehr), von der Tätigkeit als Vorstand (diese verdienen mehr) und vom Geschlecht (Männer verdienen mehr).
Treffen wir zusätzlich noch quantitative Modellannahmen für das Beispiel:
faehigkeit
ist normalverteilt mit \(\mu=1000\) und \(\sigma=15\).
geschlecht
ist Bernoulliverteilt mit einer Wahrscheinlichkeit von \(\pi=0.5\) für eine Frau.
Ein Mann kommt ab einer faehigkeit
größer als 115 in den Vorstand, eine Frau erst ab 130.
Das gehalt
setzt sich zusammen aus faehigkeit
(\(\cdot 10\)). Es ist im vorstand
doppelt so hoch und für Männer noch einmal \(5\%\) höher: \[\text{gehalt} = \text{faehigkeit} \cdot 10 \cdot \begin{cases}2, \,\text{ist Vorstand} \\ 1, \,\text{sonst} \end{cases} \cdot \begin{cases}1.05, \,\text{ist Mann} \\ 1, \,\text{sonst} \end{cases}\]
Simuliere Daten gemäß des obigen Modells in R
:
# Faehigkeit N(100,15) verteilt
faehigkeit <- rnorm(n, mean = 100, sd = 15)
# Geschlecht B(0.5) verteilt
geschlecht <- sample(c("w","m"), size = n, replace = TRUE)
# "Aufstieg" ins Management ab einer faehigkeit von 115 für Männer, ab 130 für Frauen
vorstand <- ifelse(((geschlecht == "m" & faehigkeit > 115) |
(geschlecht == "w" & faehigkeit > 130)),
"j","n")
# Gehalt: Faehigkeit * 10 * 2 (wenn Vorstand) * 1.05 (wenn Mann)
gehalt <- faehigkeit * 10 *
ifelse(vorstand == "j", 2, 1) *
ifelse(geschlecht == "m", 1.05, 1)
Zur Klarstellung: Dies ist eine fiktive Simulation, die nur das Phänomen plausibel machen soll!
Beachte: Bei gleicher Fähigkeit im gleichen Job verdienen Männer hier nach Konstruktion \(5\%\) mehr als Frauen.
Wie konstruiert: keine nennenswerten Unterschiede (hier: im arithmetischen Mittelwert, engl. mean) …
mean(faehigkeit ~ geschlecht)
## m w
## 100.0101 99.7140
Wie erwartet: höhere Fähigkeit (welche genau ist hier undefiniert…) im Vorstand - wieder arithmetischer Mittelwert:
mean(faehigkeit ~ vorstand)
## j n
## 124.58502 97.50777
Und es gibt weniger Frauen als Männer im Vorstand:
tally(vorstand ~ geschlecht)
## geschlecht
## vorstand m w
## j 767 102
## n 4190 4941
767 Männer im Vergleich zu 102 Frauen.
Insgesamt verdienen Frauen weniger - im Mittelwert:
mean(gehalt ~ geschlecht)
## m w
## 1250.277 1024.435
Im Vorstand werden höhere Gehälter erzielt:
mean(gehalt ~ vorstand)
## j n
## 2600.4458 997.0496
Aber, der arithmetiche Mittelwert des Gehalts der Frauen im Vorstand ist höher als der der Männer (im Vorstand):
mean(gehalt ~ geschlecht + vorstand)
## m.j w.j m.n w.n
## 2587.3449 2698.9597 1005.5202 989.8664
Hier 2699 im Vergleich zu 2587 bei den Männern, d.h., \(4\%\) im Mittelwert mehr als Männer (und nicht weniger) - im Vorstand.
Warum? Na klar, das Gehalt hängt ja auch von der Fähigkeit (welcher auch immer…) ab, und die musste bei Frauen höher sein um in den Vorstand zu kommen:
mean(faehigkeit ~ geschlecht + vorstand)
## m.j w.j m.n w.n
## 123.20690 134.94798 95.76383 98.98664
Vorstand ist hier ein sogenannter Collider zwischen Geschlecht und Fähigkeit:
\[\text{geschlecht} \rightarrow \text{vorstand} \leftarrow \text{faehigkeit}\] Wenn ich auf diesen bedinge, d.h. z.B. weiß, dass eine Person im Vorstand ist, dann weiß ich außerdem, dass eine Frau dafür besonders befähigt sein musste (und daher ein höheres Gehalt hat). Damit wird ein nicht-kausaler biasing-path zwischen Geschlecht und Gehalt aufgemacht. Die Zahlen stimmen - und sind nur scheinbar wiedersprüchlich.
Noch einmal: Dies war nur ein fiktives Modell, und über die verwendeten Annahmen kann mensch sicherlich disktuieren. Mit Statistik kann beides (höheres Gehalt und Benachteiligung) beschrieben werden.