Was ist der Unterschied zwischen Median und Mittelwert?

In der Datenanalyse ist es oft die wichtigste Aufgabe, den einen "typischen" Wert zu finden, der eine ganze Gruppe von Zahlen repräsentiert. Egal ob du Umfrageergebnisse auswertest oder Labordaten analysierst, du stehst schnell vor der Frage, wie du diese Datenmasse sinnvoll zusammenfasst. Genau hier kommen die beiden bekanntesten statistischen Maße ins Spiel.

Der Mittelwert (arithmetisches Mittel) ist der Durchschnitt aller Werte, der berechnet wird, indem man alle Zahlen addiert und durch ihre Anzahl teilt. Der Median (Zentralwert) ist die genaue Mitte einer nach Größe sortierten Datenreihe. Beide Maße helfen dir dabei, große Datenmengen mit einer einzigen, repräsentativen Zahl zusammenzufassen.

Definitionen von Mittelwert und Median

Der Mittelwert, oft auch einfach Durchschnitt genannt, summiert alle Beobachtungswerte auf und verteilt diese Summe gleichmäßig auf alle Datenpunkte. Er berücksichtigt somit mathematisch jeden einzelnen Wert in deiner Stichprobe. Der Median hingegen schaut nur auf die Position. Wenn du alle deine Werte der Größe nach aufreihst, ist der Median exakt die Zahl, die die Datenreihe in zwei gleich große Hälften teilt.

  • Mittelwert:  rechnerischer Durchschnitt. Bezieht jeden Wert ein, ist aber empfindlich gegenüber Ausreißern.
  • Median:  positionaler Mittelpunkt. Ignoriert extreme Ränder und zeigt den typischen Wert der exakten Mitte.

Häufige Verwechslung

Viele Studierende setzen den "Durchschnitt" automatisch mit dem typischen Wert gleich. Das stimmt aber nur bei perfekt symmetrischen Daten. Bei verzerrten Datenreihen ist der Median oft der "typischere" Vertreter als der Mittelwert.

Wie man den Mittelwert und den Median berechnet

Die Berechnung beider Maße erfordert unterschiedliche Herangehensweisen. Während du beim Mittelwert rechnest, musst du beim Median vor allem sortieren und zählen.

  1. Werte addieren.
    Zähle alle Zahlen deiner Datenreihe zusammen.
  2. Durch Anzahl teilen.
    Dividiere die entstandene Summe durch die Gesamtzahl der Werte (n).

Schauen wir uns das an einem konkreten Beispiel zum Thema Einstiegsgehälter (in Euro) an.

Beispiel: Mittelwert bei Einstiegsgehältern

Daten: 40.000, 42.000, 45.000, 46.000, 90.000
Rechnung: (40.000 + 42.000 + 45.000 + 46.000 + 90.000) / 5
Ergebnis: 263.000 / 5 = 52.600 Euro.

Für den Median gehst du komplett anders vor.

  1. Daten sortieren.
    Ordne alle Werte aufsteigend von der kleinsten zur größten Zahl.
  2. Mitte finden.
    Suche den Wert, der genau in der Mitte steht.

Beispiel: Median bei Einstiegsgehältern

Sortierte Daten: 40.000, 42.000, 45.000, 46.000, 90.000
Ergebnis: Der mittlere Wert ist 45.000 Euro. Genau zwei Werte sind kleiner und zwei sind größer.

Bei einer ungeraden Anzahl an Werten (wie den 5 Gehältern oben) ist der Median genau die mittlere Zahl. Bei einer geraden Anzahl gibt es zwei mittlere Zahlen. In diesem Fall addierst du diese beiden Zahlen und teilst sie durch zwei (du bildest also den Mittelwert der beiden mittleren Werte).

Warum der Unterschied wichtig ist: Ausreißer und Schiefe

Der arithmetische Durchschnitt reagiert extrem empfindlich auf Ausreißer. Eine einzige sehr große oder sehr kleine Zahl zieht den Mittelwert stark in ihre Richtung. Der Zentralwert bleibt davon unbeeindruckt. Er ist robust, weil ihn die exakte Höhe der Randwerte nicht interessiert, sondern nur deren Position. Das macht ihn zur besten Wahl bei schiefen (asymmetrischen) Verteilungen.

Beispiel: Ausreißer bei Einstiegsgehältern

Stell dir vor, ein Absolvent gründet ein Startup und verdient plötzlich 500.000 Euro. Die neue Datenreihe lautet: 40.000, 42.000, 45.000, 46.000, 500.000.

Lass uns betrachten, wie sich dieser einzelne extrem hohe Wert auf unsere beiden Maße auswirkt.

MaßOhne Ausreißer (Max 90.000)Mit Ausreißer (Max 500.000)Veränderung
Mittelwert52.600 Euro.134.600 Euro.Massiver Anstieg, nicht mehr repräsentativ für die Gruppe.
Median45.000 Euro.45.000 Euro.Bleibt exakt gleich und zeigt weiterhin das typische Gehalt.

Wie die Tabelle zeigt, verzerrt der Ausreißer den Mittelwert völlig. Niemand aus der regulären Gruppe verdient auch nur annähernd 134.600 Euro. Der Median spiegelt die Realität der meisten Absolventen hier deutlich besser wider.

Wann man den Mittelwert und wann den Median benutzt

Nutze den Mittelwert, wenn deine Daten symmetrisch verteilt sind und keine extremen Ausreißer enthalten. Er ist ideal für biologische Messungen wie Körpergröße oder Blutdruck, da hier jeder Wert gleichmäßig ins Gewicht fallen soll. Der Median ist die richtige Wahl bei schiefen Verteilungen. Typische Szenarien sind Einkommensverteilungen, Immobilienpreise oder die Studiendauer, da hier oft wenige extrem hohe Werte vorkommen, die das Gesamtbild verzerren würden.

  • Vorteil von Mittelwert.
    Mathematisch präzise. Erlaubt weitere komplexe statistische Berechnungen (wie die Standardabweichung), da er alle Datenpunkte nutzt.
  • Vorteil von Median.
    Hohe Robustheit. Liefert auch bei unsauberen Daten oder extremen Ausreißern ein verlässliches Bild der typischen Mitte.

Die folgende Übersicht hilft dir dabei, im Alltag schnell die richtige Entscheidung für deine Daten zu treffen.

Verteilung / DatentypEmpfohlenes MaßGrund
Symmetrisch (Normalverteilung)MittelwertNutzt alle Informationen der Datenreihe optimal aus.
Rechtsschief / LinksschiefMedianWird nicht von extremen Werten an den Rändern verzerrt.
Ordinale Daten (z.B. Schulnoten)MedianAbstände zwischen den Werten sind nicht immer exakt gleich groß.

Visualisierung von Mittelwert vs. Median

Um beide Maße gemeinsam darzustellen, eignen sich Boxplots (Kastengrafiken) oder Histogramme (Säulendiagramme) am besten. Diese Grafiken helfen dir, die Form deiner Daten auf einen Blick zu erfassen. Bei einer perfekt symmetrischen, glockenförmigen Verteilung liegen beide Maße exakt übereinander in der Mitte. Sobald die Verteilung jedoch schief ist - also einen langen Ausläufer auf einer Seite hat - driften sie auseinander.

  • Symmetrische Verteilung:  die Mittelwert und Median liegen exakt an der gleichen Stelle, am höchsten Punkt des Histogramms.
  • Rechtsschiefe Verteilung (langer Ausläufer rechts):  der Mittelwert wird nach rechts zu den hohen Werten gezogen und liegt rechts vom Median.
  • Linksschiefe Verteilung (langer Ausläufer links):  der Mittelwert wird nach links zu den niedrigen Werten gezogen und liegt links vom Median.

Fazit und abschließende Gedanken

Die Wahl zwischen diesen beiden Maßen hängt letztlich immer von der Form deiner Daten ab. Der Mittelwert ist das präzisere Maß für symmetrische Verteilungen, während der Median dein sicherer Hafen bei Ausreißern und schiefen Datenreihen ist.

Ein bewährter Praxis-Tipp für deine tägliche Datenanalyse: Berechne anfangs immer beide Maße. Wenn Mittelwert und Median stark voneinander abweichen, weißt du sofort, dass Ausreißer oder eine schiefe Verteilung vorliegen, die du dir genauer ansehen musst.