Vorteil Frauen?

Eine Schlagzeile vom 16.11.2020 lautet (Link):

Frauen in Firmen-Vorständen sind besser bezahlt als Männer

Kann das sein? Mensch denkt doch immer eher, das Frauen im Job benachteiligt werden.

Ja, beides kann gleichzeitig stimmen: Frauen können im Job benachteiligt werden und Frauen können als Vorstand ein höheres Gehalt erzielen als Männer.

Warum soll diese kleine, fiktive R Simulation zeigen:

Vorbereitungen

Laden wir zunächst mosaic:

library(mosaic)

Setzen wir den Zufallszahlengenerator und sagen, dass wir das berufliche Schicksal von \(n=10000\) Menschen simulieren wollen:

set.seed(1896)

# Stichprobenumfang
n <- 10000

Annahmen

Und hier die qualitativen Annahmen des datengenerierenden Prozesses:

  1. Die Fähigkeit für den (Vorstands-)Job ist unabhängig vom Geschlecht.

  2. Ob jemand in den Vorstand kommt hängt ab von der Fähigkeit und dem Geschlecht. Frauen müssen fähiger sein als Männer - so hier die Annahme.

  3. Das Gehalt, das eine Person bekommt, hängt ab von der Fähigkeit (fähigere Leute verdienen mehr), von der Tätigkeit als Vorstand (diese verdienen mehr) und vom Geschlecht (Männer verdienen mehr).

Treffen wir zusätzlich noch quantitative Modellannahmen für das Beispiel:

  1. faehigkeit ist normalverteilt mit \(\mu=1000\) und \(\sigma=15\).

  2. geschlecht ist Bernoulliverteilt mit einer Wahrscheinlichkeit von \(\pi=0.5\) für eine Frau.

  3. Ein Mann kommt ab einer faehigkeit größer als 115 in den Vorstand, eine Frau erst ab 130.

  4. Das gehalt setzt sich zusammen aus faehigkeit (\(\cdot 10\)). Es ist im vorstand doppelt so hoch und für Männer noch einmal \(5\%\) höher: \[\text{gehalt} = \text{faehigkeit} \cdot 10 \cdot \begin{cases}2, \,\text{ist Vorstand} \\ 1, \,\text{sonst} \end{cases} \cdot \begin{cases}1.05, \,\text{ist Mann} \\ 1, \,\text{sonst} \end{cases}\]

Simulation

Simuliere Daten gemäß des obigen Modells in R:

# Faehigkeit N(100,15) verteilt
faehigkeit <- rnorm(n, mean = 100, sd = 15)
# Geschlecht B(0.5) verteilt
geschlecht <- sample(c("w","m"), size = n, replace = TRUE)

# "Aufstieg" ins Management ab einer faehigkeit von 115 für Männer, ab 130 für Frauen
vorstand <- ifelse(((geschlecht == "m" & faehigkeit > 115) | 
                      (geschlecht == "w" & faehigkeit > 130)),
                   "j","n")

# Gehalt: Faehigkeit * 10 * 2 (wenn Vorstand) * 1.05 (wenn Mann)
gehalt <- faehigkeit * 10 * 
  ifelse(vorstand == "j", 2, 1) * 
  ifelse(geschlecht == "m", 1.05, 1)

Zur Klarstellung: Dies ist eine fiktive Simulation, die nur das Phänomen plausibel machen soll!

Beachte: Bei gleicher Fähigkeit im gleichen Job verdienen Männer hier nach Konstruktion \(5\%\) mehr als Frauen.

Auswertung

Fähigkeit und Geschlecht

Wie konstruiert: keine nennenswerten Unterschiede (hier: im arithmetischen Mittelwert, engl. mean) …

mean(faehigkeit ~ geschlecht)
##        m        w 
## 100.0101  99.7140

Fähigkeit und Vorstand

Wie erwartet: höhere Fähigkeit (welche genau ist hier undefiniert…) im Vorstand - wieder arithmetischer Mittelwert:

mean(faehigkeit ~ vorstand)
##         j         n 
## 124.58502  97.50777

Geschlecht und Vorstand

Und es gibt weniger Frauen als Männer im Vorstand:

tally(vorstand ~ geschlecht)
##         geschlecht
## vorstand    m    w
##        j  767  102
##        n 4190 4941

767 Männer im Vergleich zu 102 Frauen.

Gehalt und Geschlecht

Insgesamt verdienen Frauen weniger - im Mittelwert:

mean(gehalt ~ geschlecht)
##        m        w 
## 1250.277 1024.435

Gehalt und Vorstand

Im Vorstand werden höhere Gehälter erzielt:

mean(gehalt ~ vorstand) 
##         j         n 
## 2600.4458  997.0496

Gehalt, Geschlecht und Vorstand

Aber, der arithmetiche Mittelwert des Gehalts der Frauen im Vorstand ist höher als der der Männer (im Vorstand):

mean(gehalt ~ geschlecht + vorstand) 
##       m.j       w.j       m.n       w.n 
## 2587.3449 2698.9597 1005.5202  989.8664

Hier 2699 im Vergleich zu 2587 bei den Männern, d.h., \(4\%\) im Mittelwert mehr als Männer (und nicht weniger) - im Vorstand.

Warum? Na klar, das Gehalt hängt ja auch von der Fähigkeit (welcher auch immer…) ab, und die musste bei Frauen höher sein um in den Vorstand zu kommen:

mean(faehigkeit ~ geschlecht + vorstand)
##       m.j       w.j       m.n       w.n 
## 123.20690 134.94798  95.76383  98.98664

Erklärung

Vorstand ist hier ein sogenannter Collider zwischen Geschlecht und Fähigkeit:

\[\text{geschlecht} \rightarrow \text{vorstand} \leftarrow \text{faehigkeit}\] Wenn ich auf diesen bedinge, d.h. z.B. weiß, dass eine Person im Vorstand ist, dann weiß ich außerdem, dass eine Frau dafür besonders befähigt sein musste (und daher ein höheres Gehalt hat). Damit wird ein nicht-kausaler biasing-path zwischen Geschlecht und Gehalt aufgemacht. Die Zahlen stimmen - und sind nur scheinbar wiedersprüchlich.

Noch einmal: Dies war nur ein fiktives Modell, und über die verwendeten Annahmen kann mensch sicherlich disktuieren. Mit Statistik kann beides (höheres Gehalt und Benachteiligung) beschrieben werden.