Precisión del VO2max del Apple Watch (2026): ¿Qué tan exacto es?
Tu Apple Watch dice que tu VO2max es 48. La Garmin de tu compañero de entrenamiento dice 55. La misma cuesta, la misma mañana — ¿cuál es entonces el número real? Posiblemente ninguno de los dos.
VO2max es el número de referencia de forma física en todos los relojes deportivos modernos, y parece preciso: una cifra limpia, actualizada después de cada carrera. Pero tu reloj nunca midió ni un solo aliento de oxígeno. Lo estimó. Y la brecha entre una buena estimación y tu número real es mayor de lo que la mayoría de los atletas percibe — lo suficientemente grande como para mantenerte entrenando en la zona equivocada durante meses.
Las pruebas de laboratorio independientes sitúan el error promedio de VO2max del Apple Watch en 6,92 ml/min/kg — suficiente para bajar a un corredor entrenado dos categorías completas de forma física. A continuación: dónde falla la estimación, por qué falla peor con atletas entrenados y cómo obtener un número con el que realmente puedas entrenar.
Lo que tu reloj hace realmente
Una prueba de VO2max en laboratorio te coloca una máscara en la cara y mide el oxígeno que inhalas y el dióxido de carbono que exhalas mientras aumentas la intensidad hasta el agotamiento. Eso es una medición directa de la captación de oxígeno.
Tu reloj no hace nada de eso. No tiene máscara ni intercambio de gases. En cambio, observa dos cosas que produces en una carrera de intensidad ligera a moderada — tu ritmo (o potencia) y tu frecuencia cardíaca — y le hace a un modelo estadístico una pregunta simple: ¿cuánto oxígeno necesitaría una persona típica para correr a esta velocidad con esta frecuencia cardíaca?
Los relojes Garmin procesan esto a través del motor de análisis de Firstbeat; el Apple Watch utiliza su propio algoritmo durante caminatas y carreras al aire libre. La mecánica difiere, pero la lógica es idéntica: una relación subóptima ritmo-frecuencia cardíaca, extrapolada a un máximo que nunca alcanzaste realmente, comparada con un promedio poblacional al que puede que no te ajustes.
Eso funciona sorprendentemente bien como línea de tendencia. Funciona mucho peor como número preciso e individual — y la investigación muestra exactamente cuánto puede desviarse.
La afirmación frente a la evidencia
Los fabricantes tienen confianza. Apple ha citado validaciones internas que sugieren que su VO2max concuerda con valores de referencia en aproximadamente ±1 ml/min/kg — lo que lo haría casi equiparable a un laboratorio.
La validación independiente con revisión por pares cuenta una historia diferente. Un estudio de 2025 en PLOS ONE probó el Apple Watch Series 9 y Ultra 2 frente a un VO2max de laboratorio en 28 participantes. Los resultados:
- Error absoluto medio (MAE): 6,92 ml/min/kg (IC 95% 4,89–8,94)
- Error porcentual absoluto medio (MAPE): 13,31%
- Sesgo sistemático: el reloj subestimó el VO2max en 6,07 ml/min/kg de media
- Límites de concordancia: de −6,1 a +18,3 ml/min/kg
Lee esa última línea dos veces. Los límites de concordancia del 95% abarcan más de 24 ml/min/kg. Para un atleta individual, el número del reloj podría plausiblemente estar seis puntos por encima de tu valor real — o dieciocho puntos por debajo. No es un error de redondeo. Es la diferencia entre "recreativo" y "élite".
La afirmación del fabricante de ±1 y el error medido de ±7 (con variaciones individuales mucho mayores) no son una pequeña discrepancia. Son dos preguntas diferentes. El marketing informa cómo funciona el modelo en promedio en una multitud. El número revisado por pares informa cuánto puede equivocarse para ti.
Por qué los atletas entrenados salen peor parados
Hay un giro que importa para cualquiera que lea un blog de entrenamiento: el sesgo se invierte dependiendo de quién seas.
En la muestra de PLOS ONE — que era inusualmente en forma, con la mayoría de los participantes en el rango de forma física Superior o Excelente — el Apple Watch subestimó el VO2max. Eso es consistente con un patrón conocido: los algoritmos de los relojes están anclados a promedios poblacionales, por lo que tienden a subestimar a las personas muy entrenadas (cuyos valores reales están muy por encima de la media) y a sobreestimar a las personas poco en forma.
Los usuarios de Garmin a menudo ven el sesgo opuesto — una tendencia a halagar a los atletas entrenados con números optimistas. La dirección depende del dispositivo y el algoritmo. Pero la lección es la misma: cuanto más lejos esté tu forma física real del promedio poblacional, menos se puede confiar en el número de tu reloj. Los atletas más interesados en el número son los que peor servicio reciben de él.
Por eso la literatura más amplia es contundente al respecto. El VO2max de los wearables es genuinamente útil para detectar tendencias en una población o en ti mismo a lo largo del tiempo — pero no es fiable para precisión a nivel individual. Una línea ascendente durante seis semanas significa algo. El valor exacto en cualquier día dado significa mucho menos.
Lo que un error de seis puntos te cuesta realmente
"Seis de diferencia" suena abstracto. En términos de entrenamiento, es caro. El VO2max se mapea directamente sobre categorías de forma física y potencial de carrera, por lo que un error de seis puntos no solo afecta a un número — te reubica.
| Error de VO2max | Dónde te sitúa | Mala lectura del tiempo en maratón | Impacto en el entrenamiento |
|---|---|---|---|
| ±1 (la afirmación del fabricante) | misma categoría | ~4–6 min | insignificante |
| ±6–7 (el promedio medido) | 1–2 categorías ACSM | ~25–35 min | los intervalos aterrizan en la zona equivocada |
| hasta ±18 (el límite exterior) | 3+ categorías | ~60+ min | cada ritmo objetivo es incorrecto |
Un ejemplo concreto: un hombre de 45 años con un VO2max real de 47 se sitúa en la cima de "Bueno" en las normas ACSM. Si su reloj subestima en siete y muestra 40, lo desciende a "Por encima de la media" — y la IA o el entrenador que lee ese número prescribe ritmos de intervalo diseñados para un atleta más lento. Entrena por debajo de su techo real durante todo un bloque y se pregunta por qué no mejora. El número no solo lo engañó; silenciosamente limitó su entrenamiento.
Dado que aproximadamente 5 ml/min/kg de VO2max equivalen a 20–30 minutos en el maratón, un error del reloj de seis o más puntos puede llevarte a perseguir un objetivo de tiempo que está a media hora de la realidad.
Cómo sabemos cómo se ve lo «real»
No podemos decirte el error personal de tu reloj — y no vamos a fingir que podemos. Nunca hemos comparado una estimación de un reloj con una prueba de laboratorio en la misma persona. Lo que sí tenemos es la otra mitad de la ecuación: un conjunto muy grande de valores de VO2max determinados directamente para mostrar cómo luce realmente la distribución real.
A lo largo de más de 1 millón de sesiones de entrenamiento, destiladas en más de 15.000 Powertests estandarizados en nuestra cohorte de 1.202 atletas, cada VO2max se calcula de la misma manera — y esa consistencia es el punto.
Metodología: cómo el Powertest mide en lugar de adivinar
El A Faster You Powertest no extrapola desde un trote suave. Utiliza un protocolo de rendimiento estandarizado — un esfuerzo en rampa más un máximo de 12 minutos a tope — y pasa el resultado por el Mader-Modell (Mader, 2003), el mismo marco fisiológico utilizado en las pruebas de laboratorio basadas en lactato. A partir de tu potencia o ritmo real en intensidades conocidas, resuelve los parámetros metabólicos subyacentes: VO2max y VLamax, tu tasa máxima de producción de lactato.
Dos cosas lo mantienen honesto:
- Umbrales de validez. Un resultado solo cuenta si aterriza en un rango fisiológicamente plausible (VO2max entre 18 y 100 ml/min/kg, VLamax 0,05–1,3 mmol/l/s, todos los valores de potencia reales). Las pruebas implausibles se marcan como inválidas, no se promedian silenciosamente.
- Esfuerzos reales, no modelos de esfuerzos. El número proviene de lo que tú produjiste en una prueba máxima, no de lo que un modelo poblacional asume que debería producir alguien con tu ritmo.
Esa es la diferencia en una frase: un reloj infiere tu techo desde un esfuerzo submáximo; un Powertest lo mide desde uno máximo.
Cuándo tu reloj es suficientemente bueno — y cuándo no
Nada de esto significa que tu reloj sea inútil. Significa que debes usarlo para lo que se le da bien.
Confía en tu reloj para:
- Tendencias. ¿La línea de tu VO2max está derivando hacia arriba durante un bloque de entrenamiento? Esa señal es real, aunque el valor absoluto no lo sea.
- Una comprobación aproximada de cordura. «¿Estoy aproximadamente en el rango que esperaría?» — bien.
- Motivación. Ver cómo se mueve el número es un estímulo genuinamente útil para seguir apareciendo.
No confíes en tu reloj para:
- Establecer la intensidad de los intervalos. Los intervalos de VO2max solo funcionan en una zona estrecha. Anclarlos a un número que esté seis puntos equivocado y o bien entrenas de menos o te quemas — ambos detienen la adaptación.
- Objetivos de carrera. Una mala lectura de 25–35 minutos en el maratón es la diferencia entre un objetivo inteligente y un desplome en el kilómetro 30.
- Seguir pequeños cambios. Las oscilaciones diarias por calor, fatiga, sueño y terreno a menudo son mayores que el cambio real de forma física que intentas ver.
Consigue un número con el que realmente puedas entrenar
Si solo quieres saber si estás en tendencia ascendente, tu reloj ya hace eso. Si quieres establecer zonas de entrenamiento, predecir tiempos de carrera y dejar de adivinar, necesitas un valor que haya sido medido en lugar de inferido.
El Powertest te da tu VO2max exacto — más VLamax y las zonas de entrenamiento individuales que vienen con él — desde tu configuración de entrenamiento normal y un monitor de frecuencia cardíaca. Sin laboratorio, sin máscara. Entre pruebas, nuestra IA actualiza tu VO2max de cada sesión para que mantengas una tendencia en tiempo real sobre una línea base sólida.
Comienza tu prueba gratuita en A Faster You → y entrena con tus números reales en lugar de un promedio poblacional que lleva tu nombre.
Una cosa más — el número que tu reloj nunca mostrará
Incluso un VO2max perfecto solo te dice el tamaño de tu motor. No dice nada sobre qué tan limpiamente funciona ese motor a la intensidad de carrera — y eso lo decide un segundo valor que ningún reloj de consumidor ni siquiera intenta estimar: VLamax, tu tasa máxima de producción de lactato.
Dos corredores con un VO2max idéntico de 55 pueden terminar un maratón con 24 minutos de diferencia puramente por eso. Tu reloj no puede verlo. Un Powertest mide ambos a la vez — porque uno sin el otro lee solo la mitad de tu perfil como atleta. Si quieres el panorama completo de dónde te encuentras, empieza con tu VO2max por edad y lo que predice.
FAQ
¿Qué tan preciso es el VO2max del Apple Watch? En pruebas independientes revisadas por pares (Apple Watch Series 9 y Ultra 2 frente a VO2max de laboratorio, PLOS ONE 2025), el error absoluto medio fue de 6,92 ml/min/kg y el MAPE fue del 13,31%, con el reloj subestimando en aproximadamente 6 ml/min/kg de media. Los límites individuales de concordancia oscilaron entre −6 y +18 ml/min/kg — útil para tendencias, poco fiable para un valor personal preciso.
¿Es el VO2max de Garmin más preciso que el del Apple Watch? Ninguno es una medición individual precisa. Ambos estiman el VO2max a partir de la frecuencia cardíaca y el ritmo usando algoritmos basados en la población (Garmin a través de Firstbeat). La dirección del error difiere — Garmin a menudo sobreestima a los atletas entrenados mientras que el Apple Watch tendió a subestimar a una muestra de alta forma física — pero ambos suelen desviarse bien más allá de sus afirmaciones de marketing. Para decisiones de entrenamiento, una prueba medida es la opción fiable.
¿Por qué difiere el VO2max de mi reloj de un valor de laboratorio o de Powertest? Porque tu reloj nunca midió tu captación de oxígeno — la infirió a partir de una relación subóptima ritmo-frecuencia cardíaca comparada con un promedio poblacional. Las desviaciones del 10–15% de los valores reales son normales, y son mayores en los atletas entrenados cuyos números reales se alejan más de ese promedio. Una HRmax incorrecta en el perfil de tu reloj amplía aún más la brecha.
¿Por qué el reloj subestima a las personas en forma y sobreestima a las menos en forma? Los algoritmos están anclados a promedios poblacionales. Los atletas muy entrenados se sitúan por encima de la media, por lo que un modelo tira de su estimación hacia abajo; los usuarios poco en forma se sitúan por debajo, por lo que el modelo los eleva. Cuanto más lejos estés del centro, mayor es el sesgo sistemático.
¿Puedo usar el VO2max de mi reloj para establecer zonas de entrenamiento? Es arriesgado. La intensidad de intervalos para el trabajo de VO2max solo aterriza en una ventana estrecha, y un error de seis o más puntos pone tus sesiones en la zona equivocada — demasiado fácil para impulsar la adaptación, o demasiado difícil para mantenerlo. Usa un valor medido para las zonas; usa el relógio para observar la tendencia.
¿Un VO2max más alto en mi reloj significa que realmente me puse más en forma? Una tendencia ascendente durante varias semanas es significativa — eso es lo que los wearables hacen bien. Un salto único entre dos días es más probable que sea ruido por calor, fatiga, terreno o ritmo que un cambio real de forma física.
¿Cuál es la forma más precisa de medir el VO2max sin laboratorio? Una prueba de rendimiento estandarizada interpretada a través de un modelo metabólico. El A Faster You Powertest utiliza una rampa más un esfuerzo máximo de 12 minutos y el Mader-Modell para determinar el VO2max y VLamax a partir de tu producción real — mucho más cercano a los valores de laboratorio que una estimación de un reloj, sin necesidad de máscara.
Datos de precisión del Apple Watch: validación independiente del Apple Watch Series 9 y Ultra 2 frente al VO2max de laboratorio, PLOS ONE 2025 (10.1371/journal.pone.0323741). El VO2max de los wearables se caracteriza ampliamente como adecuado para el análisis a nivel de población y tendencias en lugar de precisión individual. Normas de VO2max: American College of Sports Medicine (ACSM) e Instituto Cooper. Cohorte de A Faster You: subconjunto de atletas entrenados de una plataforma con más de 1 millón de sesiones de entrenamiento; distribución de referencia derivada de más de 15.000 Powertests estandarizados en 1.202 atletas, VO2max determinado mediante el Mader-Modell (Mader, 2003; Mader & Heck, 1986), European Journal of Applied Physiology.