Apple Watch VO2max Genauigkeit (2026): Wie zuverlässig ist sie?

Apple Watch VO2max Genauigkeit (2026): Wie zuverlässig ist sie?

Diesen Artikel anhören Gesprochen von Björn Kafka · 6 Min

Deine Apple Watch sagt, dein VO2max ist 48. Die Garmin deines Trainingspartners zeigt 55. Derselbe Hügel, derselbe Morgen – welche Zahl ist also real? Möglicherweise keine von beiden.

VO2max ist die wichtigste Fitnesszahl auf jeder modernen Sportuhr, und sie wirkt präzise: eine saubere Zahl, aktualisiert nach jeder Einheit. Aber deine Uhr hat noch keinen einzigen Atemzug Sauerstoff gemessen. Sie hat geschätzt. Und die Lücke zwischen einer guten Schätzung und deinem wahren Wert ist größer, als die meisten Athleten ahnen – groß genug, um dein Training monatelang in der falschen Zone zu halten.

Unabhängige Labortests beziffern den durchschnittlichen VO2max-Fehler der Apple Watch auf 6,92 ml/min/kg – groß genug, um einen trainierten Läufer um zwei vollständige Fitnesskategorien nach unten zu verschieben. Im Folgenden: wo die Schätzung versagt, warum sie bei trainierten Athleten am schlechtesten funktioniert und wie du eine Zahl bekommst, auf der du wirklich trainieren kannst.

Was deine Uhr wirklich tut

Ein Labor-VO2max-Test setzt dir eine Maske auf und misst den Sauerstoff, den du einatmest, und das Kohlendioxid, das du ausatmest, während du dich bis zur Erschöpfung steigerst. Das ist eine direkte Messung der Sauerstoffaufnahme.

Deine Uhr tut nichts davon. Sie hat keine Maske und keinen Gasaustausch. Stattdessen beobachtet sie zwei Dinge, die du bei einem leichten bis mittleren Lauf produzierst – dein Tempo (oder deine Leistung) und deine Herzfrequenz – und stellt einem statistischen Modell eine einfache Frage: Wie viel Sauerstoff würde eine typische Person benötigen, um bei dieser Herzfrequenz so schnell zu laufen?

Garmin-Uhren verarbeiten das über die Firstbeat-Analyse-Engine; Apple Watch nutzt ihren eigenen Algorithmus bei Outdoor-Spaziergängen und -Läufen. Die Mechanik unterscheidet sich, aber die Logik ist identisch: eine submaximale Tempo-zu-Herzfrequenz-Beziehung, extrapoliert auf ein Maximum, das du nie wirklich erreicht hast, verglichen mit einem Bevölkerungsdurchschnitt, dem du vielleicht nicht entsprichst.

Das funktioniert überraschend gut als Trendlinie. Als präzise, individuelle Zahl funktioniert es weit weniger gut – und die Forschung zeigt genau, wie weit daneben es liegen kann.

Der Anspruch vs. die Evidenz

Hersteller sind zuversichtlich. Apple hat interne Validierungen zitiert, die nahelegen, dass sein VO2max mit Referenzwerten innerhalb von etwa ±1 ml/min/kg übereinstimmt – was es nahezu laborwertig machen würde.

Unabhängige, peer-reviewte Validierungen erzählen eine andere Geschichte. Eine Studie aus 2025 in PLOS ONE testete die Apple Watch Series 9 und Ultra 2 gegen einen ordentlichen Labor-VO2max-Test bei 28 Teilnehmern. Die Ergebnisse:

  • Mittlerer absoluter Fehler (MAE): 6,92 ml/min/kg (95 % KI 4,89–8,94)
  • Mittlerer absoluter prozentualer Fehler (MAPE): 13,31 %
  • Systematischer Bias: Die Uhr unterschätzte den VO2max um durchschnittlich 6,07 ml/min/kg
  • Übereinstimmungsgrenzen: von −6,1 bis +18,3 ml/min/kg

Lies die letzte Zeile zweimal. Die 95-%-Übereinstimmungsgrenzen umspannen mehr als 24 ml/min/kg. Für einen einzelnen Athleten könnte die Uhrenzahl plausiblerweise sechs Punkte über dem wahren Wert liegen – oder achtzehn Punkte darunter. Das ist kein Rundungsfehler. Das ist der Unterschied zwischen „Freizeitläufer" und „Elite".

Der Herstelleranspruch von ±1 und der gemessene Fehler von ±7 (mit individuellen Ausreißern, die weit größer sind) sind keine kleine Diskrepanz. Sie beantworten zwei verschiedene Fragen. Marketing berichtet, wie das Modell im Durchschnitt über eine Menge abschneidet. Die peer-reviewte Zahl berichtet, wie falsch es für dich sein kann.

Warum trainierte Athleten am stärksten betroffen sind

Es gibt eine Wendung, die für jeden, der einen Trainingsblog liest, wichtig ist: Der Bias kehrt sich um, je nachdem, wer du bist.

In der PLOS ONE-Stichprobe – die ungewöhnlich fit war, wobei die meisten Teilnehmer in der Kategorie „Hervorragend" oder „Exzellent" rangierten – unterschätzte die Apple Watch den VO2max. Das ist konsistent mit einem bekannten Muster: Uhren-Algorithmen sind auf Bevölkerungsdurchschnitte ausgerichtet, sodass sie dazu neigen, hochtrainierte Menschen zu unterschätzen (deren echte Werte weit über dem Durchschnitt liegen) und untrainierte Menschen zu überschätzen.

Garmin-Nutzer sehen oft den entgegengesetzten Trend – eine Tendenz, trainierte Athleten mit optimistischen Zahlen zu schmeicheln. Die Richtung hängt vom Gerät und dem Algorithmus ab. Aber die Lehre ist dieselbe: Je weiter deine echte Fitness vom Bevölkerungsmittelwert entfernt ist, desto weniger kann der Zahl deiner Uhr vertraut werden. Die Athleten, denen die Zahl am wichtigsten ist, werden von ihr am schlechtesten bedient.

Deshalb ist die breitere Literatur so klar darüber. Tragbarer VO2max ist wirklich nützlich, um Trends in einer Population oder bei dir selbst im Laufe der Zeit zu erkennen – aber er ist nicht zuverlässig für individuelle Präzision. Eine steigende Linie über sechs Wochen bedeutet etwas. Der genaue Wert an einem bestimmten Tag bedeutet viel weniger.

Was ein Sechs-Punkte-Fehler dich wirklich kostet

„Sechs daneben" klingt abstrakt. Im Trainingsbereich ist es teuer. VO2max bildet direkt auf Fitnesskategorien und Rennergebnispotenzial ab, ein Sechs-Punkte-Fehler verschiebt dich also nicht nur in der Zahl – er versetzt dich in eine andere Kategorie.

VO2max-FehlerWo er dich einordnetMarathon-ZeitfehleinschätzungTrainingsauswirkung
±1 (der Herstelleranspruch)gleiche Kategorie~4–6 minvernachlässigbar
±6–7 (der gemessene Durchschnitt)1–2 ACSM-Kategorien~25–35 minIntervalle landen in der falschen Zone
bis zu ±18 (die äußere Grenze)3+ Kategorien~60+ minjedes Zieltempo ist falsch

Ein konkretes Beispiel: Ein 45-jähriger Mann mit einem echten VO2max von 47 liegt an der Spitze von „Gut" in den ACSM-Normen. Wenn seine Uhr um sieben unterschätzt und 40 zeigt, stuft sie ihn in „Überdurchschnittlich" herab – und die KI oder der Trainer, der diese Zahl liest, verschreibt Intervalltempi, die für einen langsameren Athleten gebaut sind. Er trainiert einen ganzen Block unter seiner echten Decke und fragt sich, warum er sich nicht verbessert. Die Zahl hat ihn nicht nur in die Irre geführt; sie hat sein Training leise gedeckelt.

Da ungefähr 5 ml/min/kg VO2max 20–30 Minuten im Marathon wert sind, kann ein Uhrenfehler von sechs oder mehr Punkten dazu führen, dass du ein Zielzeitziel verfolgst, das eine halbe Stunde an der Realität vorbeigeht.

VO2 Max Tabelle nach Alter (ACSM + 15K Powertests, 2026)VO2 Max Tabelle nach Alter — Männer & Frauen. ACSM-Normen plus 15.000 Powertests aus 1.202 trainierten Athleten zeigen, was normal und wa…

Wie wir wissen, wie „real" aussieht

Wir können dir den persönlichen Fehler deiner Uhr nicht nennen – und wir werden so tun als ob auch nicht. Wir haben nie eine Uhrenschätzung mit einem Labortest an derselben Person verglichen. Was wir haben, ist die andere Hälfte der Gleichung: ein sehr großer Satz von direkt bestimmten VO2max-Werten, um zu zeigen, wie die echte Verteilung tatsächlich aussieht.

Über 1 Million+ Trainingseinheiten, destilliert in 15.000+ standardisierten Powertests unserer 1.202-Athleten-Kohorte, wird jeder VO2max auf dieselbe Weise berechnet – und diese Konsistenz ist der Punkt.

Methodik: Wie der Powertest misst, statt zu schätzen

Der A Faster You Powertest extrapoliert nicht von einem leichten Joggen. Er verwendet ein standardisiertes Leistungsprotokoll – eine Rampenbelastung plus ein maximales 12-minütiges Alles-Geben – und führt das Ergebnis durch das Mader-Modell (Mader, 2003), dasselbe physiologische Rahmenwerk, das bei laktatbasierten Labortests verwendet wird. Aus deiner tatsächlichen Leistung oder deinem Tempo bei bekannten Intensitäten löst es die darunter liegenden Stoffwechselparameter: VO2max und VLamax, deine maximale Laktatproduktionsrate.

Zwei Dinge halten es ehrlich:

  • Validitätsgrenzen. Ein Ergebnis zählt nur, wenn es in einem physiologisch plausiblen Bereich landet (VO2max zwischen 18 und 100 ml/min/kg, VLamax 0,05–1,3 mmol/l/s, alle Leistungswerte real). Unplausible Tests werden als ungültig markiert, nicht still hineingemittelt.
  • Echte Anstrengungen, keine Modelle von Anstrengungen. Die Zahl ergibt sich aus dem, was du in einem maximalen Test produziert hast, nicht aus dem, was ein Bevölkerungsmodell annimmt, dass jemand in deinem Tempo produzieren sollte.

Das ist der Unterschied in einem Satz: Eine Uhr schließt von einer submaximalen Anstrengung auf deine Decke; ein Powertest misst sie anhand einer maximalen Anstrengung.

Wann deine Uhr gut genug ist – und wann nicht

Das alles bedeutet nicht, dass deine Uhr nutzlos ist. Es bedeutet, dass du sie für das verwenden solltest, wofür sie gut ist.

Vertrau deiner Uhr bei:

  • Trends. Steigt deine VO2max-Linie über einen Trainingsblock? Dieses Signal ist real, auch wenn der absolute Wert es nicht ist.
  • Einem groben Plausibilitätscheck. „Bin ich ungefähr in dem Bereich, den ich erwarten würde?" – gut.
  • Motivation. Zu sehen, wie sich die Zahl bewegt, ist ein wirklich nützlicher Anstoß, am Ball zu bleiben.

Vertrau deiner Uhr nicht bei:

  • Dem Einstellen der Intervallintensität. VO2max-Intervalle funktionieren nur in einem engen Bereich. Ankere sie an eine Zahl, die sechs Punkte falsch liegt, und du trainierst entweder zu wenig oder brennst aus – beides stoppt die Anpassung.
  • Rennzielen. Eine Marathon-Fehleinschätzung von 25–35 Minuten ist der Unterschied zwischen einem klugen Ziel und einem Einbruch bei Kilometer 30.
  • Dem Verfolgen kleiner Veränderungen. Tägliche Schwankungen durch Hitze, Ermüdung, Schlaf und Gelände sind oft größer als die echte Fitnessveränderung, die du zu sehen versuchst.

Hol dir eine Zahl, auf der du wirklich trainieren kannst

Wenn du nur wissen willst, ob du im Aufwärtstrend bist, erledigt das deine Uhr bereits. Wenn du Trainingszonen festlegen, Rennzeiten vorhersagen und aufhören möchtest zu raten, brauchst du einen Wert, der gemessen statt abgeleitet wurde.

Der Powertest gibt dir deinen genauen VO2max – plus VLamax und die individuellen Trainingszonen, die damit einhergehen – aus deinem normalen Trainingsaufbau und einem Herzfrequenzmesser. Kein Labor, keine Maske. Zwischen den Tests aktualisiert unsere KI deinen VO2max aus jeder Einheit, damit du einen Live-Trend auf einem soliden Basiswert hast.

Starte deinen kostenlosen Test auf A Faster You → und trainiere auf deinen echten Zahlen statt auf einem Bevölkerungsdurchschnitt mit deinem Namen.

Noch eine Sache – die Zahl, die deine Uhr nie zeigen wird

Selbst ein perfekter VO2max sagt dir nur die Größe deines Motors. Er sagt nichts darüber aus, wie sauber dieser Motor bei Rennintensität läuft – und das wird durch einen zweiten Wert entschieden, den keine Konsumentenuhr auch nur zu schätzen versucht: VLamax, deine maximale Laktatproduktionsrate.

Zwei Läufer mit einem identischen VO2max von 55 können einen Marathon 24 Minuten auseinander beenden – allein deshalb. Deine Uhr kann das nicht sehen. Ein Powertest misst beides gleichzeitig – denn eines ohne das andere liest nur die Hälfte deines Athletenprofils. Wenn du das vollständige Bild davon haben möchtest, wo du stehst, beginne mit deinem VO2max nach Alter und was er vorhersagt.


FAQ

Wie genau ist der VO2max der Apple Watch? Bei unabhängigen peer-reviewten Tests (Apple Watch Series 9 und Ultra 2 vs. Labor-VO2max, PLOS ONE 2025) betrug der mittlere absolute Fehler 6,92 ml/min/kg und der MAPE 13,31 %, wobei die Uhr den VO2max im Durchschnitt um etwa 6 ml/min/kg unterschätzte. Individuelle Übereinstimmungsgrenzen lagen zwischen −6 und +18 ml/min/kg – nützlich für Trends, unzuverlässig für einen präzisen persönlichen Wert.

Ist Garmin VO2max genauer als Apple Watch? Keines von beiden ist eine präzise individuelle Messung. Beide schätzen VO2max aus Herzfrequenz und Tempo mithilfe populationsbasierter Algorithmen (Garmin über Firstbeat). Die Richtung des Fehlers unterscheidet sich – Garmin überschätzt oft trainierte Athleten, während Apple Watch dazu neigte, eine leistungsstarke Stichprobe zu unterschätzen – aber beide weichen in der Regel weit über ihre Marketingversprechen hinaus ab. Für Trainingsentscheidungen ist ein gemessener Test die zuverlässige Option.

Warum weicht mein Uhren-VO2max von einem Labor- oder Powertest-Wert ab? Weil deine Uhr deine Sauerstoffaufnahme nie gemessen hat – sie hat sie aus einer submaximalen Tempo-zu-Herzfrequenz-Beziehung gegen einen Bevölkerungsdurchschnitt abgeleitet. Abweichungen von 10–15 % von wahren Werten sind normal, und sie sind am größten bei trainierten Athleten, deren echte Werte am weitesten von diesem Durchschnitt entfernt liegen. Eine falsche HRmax in deinem Uhrenprofil vergrößert die Lücke weiter.

Warum unterschätzt die Uhr fitte Menschen und überschätzt untrainierte? Die Algorithmen sind auf Bevölkerungsdurchschnitte ausgerichtet. Hochtrainierte Athleten liegen über dem Durchschnitt, sodass ein Modell ihre Schätzung nach unten zieht; untrainierte Nutzer liegen darunter, sodass das Modell sie nach oben zieht. Je weiter du von der Mitte entfernt bist, desto größer ist der systematische Bias.

Kann ich meinen Uhren-VO2max verwenden, um Trainingszonen festzulegen? Es ist riskant. Die Intervallintensität für VO2max-Arbeit trifft nur in einem engen Fenster, und ein Fehler von sechs oder mehr Punkten bringt deine Einheiten in die falsche Zone – zu leicht, um Anpassungen anzutreiben, oder zu schwer, um durchzuhalten. Verwende einen gemessenen Wert für Zonen; nutze die Uhr, um den Trend zu beobachten.

Bedeutet ein höherer VO2max auf meiner Uhr, dass ich wirklich fitter geworden bin? Ein steigender Trend über mehrere Wochen ist bedeutsam – das können Wearables gut. Ein einzelner Sprung zwischen zwei Tagen ist eher Rauschen durch Hitze, Ermüdung, Gelände oder Tempo als eine echte Fitnessveränderung.

Was ist die genaueste Methode, VO2max ohne Labor zu messen? Ein standardisierter Leistungstest, der durch ein Stoffwechselmodell interpretiert wird. Der A Faster You Powertest verwendet eine Rampe plus einen maximalen 12-Minuten-Effort und das Mader-Modell, um VO2max und VLamax aus deiner realen Leistung zu bestimmen – weit näher an Laborwerten als eine Uhrenschätzung, ohne Maske.


Apple Watch-Genauigkeitsdaten: unabhängige Validierung der Apple Watch Series 9 und Ultra 2 gegen Labor-VO2max, PLOS ONE 2025 (10.1371/journal.pone.0323741). Tragbarer VO2max wird weithin als geeignet für populations- und trendbasierte Analysen statt für individuelle Präzision charakterisiert. VO2max-Normen: American College of Sports Medicine (ACSM) und Cooper Institute. A Faster You-Kohorte: Trainings-Athleten-Teilmenge einer Plattform mit 1 Million+ Trainingseinheiten; Referenzverteilung abgeleitet aus 15.000+ standardisierten Powertests bei 1.202 Athleten, VO2max bestimmt über das Mader-Modell (Mader, 2003; Mader & Heck, 1986), European Journal of Applied Physiology.

Bereit, ein Schnelleres Du zu werden?

Starte noch heute deinen kostenlosen 14-Tage-Test. Erlebe den intelligentesten Trainingsplan der Welt.

14-tägige kostenlose Testphase
Jederzeit kündbar
Jetzt anmelden