Garmin VO2max: Wie weit liegt dein Wert daneben? (79-Paar-Kohorte, 2026)
Dein Garmin zeigt 52. Stimmt das? In unserem Kohorten-Datensatz mit gepaarten Powertests lagen die Garmin-VO2max-Werte bei 68 % der Athleten höher als der tatsächlich gemessene Wert – und wie groß die Abweichung ist, hängt davon ab, wie fit du bereits bist.
Was Garmin tatsächlich misst
Moderne Garmin-Uhren messen VO2max nicht im labormedizinischen Sinne. Sie schätzen den Wert aus der Beziehung zwischen Herzfrequenz und Tempo (oder Leistung am Cycling-Computer) während deiner alltäglichen Ausfahrten und Läufe. Der Algorithmus – meistens das FirstBeat-HRV-und-Belastungsmodell – sucht nach submaximalen Datenpunkten und extrapoliert, welche maximale Sauerstoffaufnahme du bei vollständiger Ausbelastung erreichen würdest.
Das ist ein bemerkenswert cleverer technischer Trick für einen kostenlosen, immer aktiven Schätzer. Doch „Schätzer" ist das richtige Wort, und ein Schätzer trägt eine Verzerrung in sich. Die entscheidende Frage für jeden Athleten, der eine Zahl auf dem Handgelenk liest, lautet: Wie groß ist die Verzerrung in meinem Fitnessbereich, und in welche Richtung zieht sie?
Wie wir es getestet haben
Ein Powertest nach dem Mader-Modell misst VO2max und VLamax direkt aus einem kurzen Maximalprotokoll. Wir haben mehr als 13.300 gültige Powertests in unserer Cycling-Kohorte durchgeführt, und ein Teil dieser Athleten trägt außerdem eine Garmin- (oder Garmin-kompatible) Uhr, die innerhalb des Vergleichsfensters einen VO2max-Schätzwert liefert.
Für diese Analyse haben wir 79 gepaarte Beobachtungen herangezogen – Rad-Powertests mit einem anonym zugeordneten Uhren-VO2max-Schätzwert, der zeitlich nah genug lag, dass keine signifikante Fitnessveränderung zwischen beiden Messungen stattfinden konnte. Achtzig Paare würden die unten stehenden Kernaussagen um maximal 0,1 verändern, aber Transparenz über die Stichprobengröße ist uns wichtig.
Wir behaupten nicht „15.000 Uhrenvergleiche". Wir behaupten 79 – und das stratifizierte Muster, das diese 79 zeigen, ist über alle Fitnessbereiche hinweg konsistent genug, dass wir es guten Gewissens veröffentlichen.
Die wichtigsten Zahlen
| Kennzahl | Wert |
|---|---|
| Mittlere Verzerrung (Uhr − Powertest) | +3,19 VO2max-Punkte |
| Innerhalb ±3 Punkte des Messwerts | 41,8 % |
| Innerhalb ±5 Punkte des Messwerts | 57,0 % |
| Uhr überschätzt | 68,4 % |
| Uhr unterschätzt | 31,6 % |
Ein „wahrer" Schätzer würde symmetrisch um den Messwert streuen. Garmins Verteilung ist verschoben: Die meisten Athleten erhalten einen etwas bis deutlich höheren Wert als das Labor zurückliefert. Diese Verzerrung ist das zuverlässigste Merkmal der Daten.
Die Verzerrungskurve – und warum sie sich umkehrt
Das nützlichste Diagramm, das wir dir geben können, ist die Verzerrung aufgeschlüsselt nach Fitness-Bucket. Sie ist monoton – und dreht sich am Elite-Ende ins Negative.
| Powertest VO2max-Bucket | n | Powertest Ø | Uhr Ø | Verzerrung (Uhr − PT) |
|---|---|---|---|---|
| <45 (untrainiert) | 10 | 39,7 | 51,5 | +11,79 |
| 45–55 (Freizeit) | 30 | 50,5 | 55,0 | +4,52 |
| 55–65 (trainiert) | 25 | 60,9 | 62,1 | +1,19 |
| 65+ (Elite) | 14 | 70,6 | 68,3 | −2,23 |
Lies die Tabelle von oben nach unten. Ein untrainierter Fahrer mit einem echten VO2max von 40 erhält einen Uhren-Wert von etwa 52 – eine Überschätzung von fast zwölf Punkten. Ein trainierter Fahrer um 60 liegt fast genau auf dem Messwert. Eine Eliteathletin bei 70+ wird sogar um etwa zwei Punkte unterschätzt.
Warum Regression zur Mitte das erklären kann
Das Muster ist ein klassisches Kennzeichen eines Schätzers, der auf einem Populations-Prior verankert ist. Vereinfacht gesagt: Der Algorithmus hat eine eingebaute Erwartung, dass „die meisten Menschen um 55–58 VO2max haben". Wenn die übrigen Daten (deine submaximale HR-Leistungs-Steigung, deine demografischen Daten, deine Trainingshistorie auf der Uhr) uneindeutig sind, zieht das Modell hin zu diesem Prior. Je weiter du vom Prior entfernt bist, desto stärker driftet dein Handgelenkswert zurück zu ihm.
Für die meisten ambitionierten Leser ist die Schlussfolgerung einfach: Ein Handgelenkswert nahe 55 ist der vertrauenswürdigste Bereich der Kurve. Darunter oder darüber ist mit einer Komprimierung zu rechnen.
So interpretierst du deinen Garmin-Wert
Hier ist eine Ein-Schritt-Korrektur, die du ohne Rechnen anwenden kannst:
| Selbsteinschätzung | Garmin zeigt | Wahrscheinlichster echter VO2max |
|---|---|---|
| Neu im strukturierten Training, überwiegend lockere Ausfahrten | 48–55 | 10–12 Punkte abziehen |
| Freizeit, etwas Intervalle, 4–6 h/Woche | 53–58 | 4–5 Punkte abziehen |
| Trainiert, strukturierter Plan, Rennen | 60–65 | Wert vertrauen ±1–2 |
| Elite oder nahezu Elite, häufige Rennen | 65–72 | 2 Punkte addieren |
Das ist kein Ersatz für eine Messung – es ist eine Plausibilitätsprüfung. Die Korrekturen sind Zentral-Schätzer für unsere Kohorte; die individuelle Streuung darum herum ist erheblich (Standardabweichung der Verzerrung über alle 79 Paare: 5,7 Punkte). Behandle sie als „dein Garmin-Wert liegt wahrscheinlich in diesem Bereich", nicht als „dein wahrer Wert ist genau dieser".
Was ist mit Apple Watch und Polar?
Für Nicht-Garmin-Uhren haben wir noch keine gepaarte Vergleichskohorte mit gleicher methodischer Strenge. Auf Basis der Fachliteratur und bestehender VO2max-Uhrenvergleiche:
Apple Watch nutzt ein ähnliches HR-und-Tempo-Inferenzverfahren (basierend auf dem eigenen Modell des Sports-Science-Teams, nicht FirstBeat). Unabhängige Studien berichten mittlere Verzerrungen in ähnlicher Größenordnung – grob +2 bis +5 Punkte beim Laufen, etwas uneinheitlicher beim Radfahren ohne gepaarte Leistungsdaten. Die Richtung der Verzerrung hin zur Überschätzung scheint zu gelten.
Polar ist von den dreien am ehrlichsten in Bezug auf Unsicherheit: Die Uhr liefert einen VO2max-Wert mit einem angegebenen Konfidenzband, und Polars Dokumentation weist ausdrücklich darauf hin, dass der Schätzwert bei Fitnessniveaus weit vom Populationszentrum entfernt schlechter wird. Veröffentlichte Vergleiche berichten ähnliche Verzerrungsbeträge wie bei Apple, mit etwas engerer Streuung.
Ehrliches Fazit: Bei allen drei Marken scheint die Richtung der Verzerrung (Überschätzung bei Untrainierten, genau im trainierten Mittel, Unterschätzung bei Elite) eine Eigenschaft der HR-basierten VO2max-Schätzung im Allgemeinen zu sein – kein markenspezifisches Versagen.
Die Messung, die keine Korrektur braucht
Wenn du eine Zahl willst, auf der du tatsächlich dein Training aufbauen kannst – ohne Verzerrungskurven-Nachschlagen –, dauert der Mader-Modell-Powertest 25 Minuten und liefert dir sowohl deinen VO2max als auch deinen VLamax (den zweiten Motor, den die Uhr überhaupt nicht erfassen kann). Die meisten A Faster You-Athleten machen ihren ersten Powertest in der ersten Woche und testen alle 4–6 Wochen erneut.
Für weiterführende Referenzen dazu, wie „trainiert" tatsächlich über verschiedene Distanzen und Fahrertypen aussieht, vergleicht unser großer Kohortenbericht 3.491 Athleten mit ACSM-Normen: VO2max & VLamax Kohortenbericht →
Starte einen kostenlosen Test von A Faster You und dein erster Powertest setzt die Baseline. Von da an plant die AI jedes Intervall und jeden Ruhetag auf Basis echter Zahlen – keine Schätzwerte.
FAQ
Warum ändert sich mein Garmin-VO2max täglich um 2 Punkte? Der Schätzer aktualisiert sich nach jeder aeroben Aktivität, und die zugrunde liegende HR-Tempo-Beziehung ist rauschbehaftet: Koffein, Schlaf, Umgebungstemperatur und Hydratation verschieben sie um einige Prozent. Vertraue dem 28-Tage-Trend, nicht einem einzelnen Tag. Das tägliche Zittern ist normal und ist kein Zeichen dafür, dass deine Fitness tatsächlich geschwankt hat.
Ist der Uhren-Wert als Trend zuverlässig, auch wenn der Absolutwert daneben liegt? Größtenteils ja. Die Verzerrungsrichtung ist für einen bestimmten Athleten über Monate hinweg tendenziell konsistent. Ein von der Uhr gemeldeter Anstieg von 50 auf 53 spiegelt daher in der Regel einen echten Fitnessgewinn wider, auch wenn dein echter VO2max durchgehend eher bei 48 liegt. Behandle die Entwicklung als Signal; behandle den Absolutwert als groben Anker.
Spielt es eine Rolle, ob ich laufe oder radle? Ja, erheblich. Die meisten Consumer-Uhren zeigen für denselben Athleten einen höheren Lauf-VO2max als Rad-VO2max, weil die Algorithmen auf Laufdaten kalibriert sind. Wenn deine Uhr zwei Werte anzeigt, ist der Laufwert der besser validierte der beiden. Die Powertest-Vergleiche in diesem Artikel sind Rad-gepaartet; Lauf-gepaarte Daten sind ein separater Kohortenausschnitt, den wir später veröffentlichen werden.
Mein Garmin sagt 60, aber mein Powertest kam mit 50 zurück. Welchem soll ich glauben? Glaube dem Powertest. Die laborgradige Messung ist die Referenz; der Uhren-Wert ist der abgeleitete Schätzwert. Eine 10-Punkte-Differenz liegt am oberen Ende dessen, was wir sehen, ist aber im Einklang mit dem, was die Verzerrungskurve für einen Freizeitfahrer vorhersagt, dessen Garmin nahe am Populationsmittel liegt.
Wird mein Garmin-Wert genauer, wenn ich mehr Ausfahrten mache? Leicht, ja – der Algorithmus profitiert von mehr submaximalen Datenpunkten und von Herzfrequenzproben nahe der Schwelle. Aber er wird nicht auf deinen wahren Wert konvergieren; die Verzerrung ist strukturell, nicht datenvolumenbedingt.
Wenn ich meinen VO2max durch Training steigere, bewegt sich dann auch der Uhren-Wert? Ja, in dieselbe Richtung, aber komprimiert. Drei echte Punkte mehr (Powertest +3) tauchen in unserer Kohorte typischerweise als ein bis zwei Uhren-Punkte auf, weil die Uhr zum Populationszentrum hin verzerrt. Plane auf Basis des Powertest-Deltas, nicht des Uhren-Deltas.
Sind die Uhren-VO2max-Werte sicher genug, um sie einem Coach zu zeigen? Für grobe Einordnung: ja. Für die Ableitung von Trainingszonen: nein – handgelenkbasierter VO2max ist zu verrauscht, um Zonenberechnungen darauf zu verankern. Ein Coach, der aus einem Uhren-Wert plant, plant aus einem Schätzwert eines Schätzwerts.
Quellen: Mader, A. (2003) — Glycolysis and oxidative phosphorylation as a function of cytosolic phosphorylation state and power output of the muscle cell. Eur J Appl Physiol, 88(4–5), 317–338. Mader, A. & Heck, H. (1986) — A theory of the metabolic origin of the "anaerobic threshold". Int J Sports Med, 7 Suppl 1, 45–65. Bassett, D.R. & Howley, E.T. (2000) — Limiting factors for maximum oxygen uptake. Med Sci Sports Exerc, 32(1), 70–84. FirstBeat Technologies — Automated Fitness Level (VO2max) Estimation with Heart Rate and Speed Data (white paper, 2014, updated 2019). Kohorte: 13.300+ gültige Powertests mit 79 rad-gepaarten Garmin-artigen VO2max-Beobachtungen, A Faster You interne Datenbank, Snapshot 2026-05-12.