Validez externa

Introducción

La validez externa es la medida en que puede generalizar los hallazgos de un estudio a otras situaciones, personas, entornos y medidas. En otras palabras, ¿puede aplicar los hallazgos de su estudio a un contexto más amplio?
El objetivo de la investigación científica es producir conocimiento generalizable sobre el mundo real. Sin una alta validez externa, no puede aplicar los resultados del laboratorio a otras personas o al mundo real.

En los estudios cualitativos, la validez externa se denomina transferibilidad.

Desarrollo del tema

Tipos de validez externa

Hay dos tipos principales de validez externa: validez de población y validez ecológica.

Validez poblacional

La validez de la población se refiere a si puede generalizar razonablemente los hallazgos de su muestra a un grupo más grande de personas (la población).

La validez de la población depende de la elección de la población y de la medida en que la muestra del estudio refleja esa población. Los métodos de muestreo no probabilístico se utilizan a menudo por conveniencia. Con este tipo de muestreo, la generalización de los resultados se limita a poblaciones que comparten características similares con la muestra.

Ejemplo: baja validez poblacional

Desea probar la hipótesis de que las personas tienden a percibirse a sí mismas como más inteligentes que otras en términos de habilidades académicas. Su población objetivo son los 10.000 estudiantes de pregrado de su universidad.

Reclutas a más de 200 participantes. Son estudiantes de ciencias e ingeniería; la mayoría son estadounidenses, hombres, de 18 a 20 años y de un entorno socioeconómico alto. En un entorno de laboratorio, administra una prueba de matemáticas y ciencias y luego les pide que califiquen qué tan bien creen que se desempeñó. Encuentra que el participante promedio cree que es más inteligente que el 66% de sus compañeros. ¿Puedes concluir que la mayoría de las personas creen que son mucho mejores que otros en matemáticas y ciencias?

En este caso, su muestra no es representativa de toda la población de estudiantes de su universidad. Los hallazgos solo pueden generalizarse razonablemente a poblaciones que comparten características con los participantes, por ejemplo, hombres con educación universitaria y carreras en STEM.

Para una mayor validez poblacional, su muestra necesitaría incluir personas con diferentes características (por ejemplo, mujeres, personas no binarias y estudiantes de diferentes carreras, países y niveles socioeconómicos).
Muestras como esta, de países occidentales, educados, industrializados, ricos y democráticos (WEIRD), se utilizan en aproximadamente el 96 % de los estudios de psicología, aunque representan solo el 12 % de la población mundial. Dado que son valores atípicos en términos de percepción visual, razonamiento moral y categorización (entre muchos otros temas), las muestras EXTRAÑAS limitan la validez de una amplia población en las ciencias sociales.

Validez ecológica

La validez ecológica se refiere a si puede generalizar razonablemente los hallazgos de un estudio a otras situaciones y entornos en el «mundo real».

Ejemplo: baja validez ecológica

Desea probar la hipótesis de que los tiempos de reacción al conducir se vuelven más lentos cuando las personas prestan atención a los demás que hablan.

En un entorno de laboratorio, configura una tarea simple basada en computadora para medir los tiempos de reacción. Se les dice a los participantes que se imaginen a sí mismos conduciendo por la pista de carreras y que hagan doble clic con el mouse cada vez que vean un gato naranja en la pantalla. Durante una ronda, los participantes escuchan un podcast. En la otra ronda, no necesitan escuchar nada. Después de evaluar los resultados, descubre que los tiempos de reacción son mucho más lentos cuando escucha el podcast.

¿Puedes concluir que los tiempos de reacción al conducir son más lentos cuando las personas escuchan hablar a los demás?

En el ejemplo anterior, es difícil generalizar los hallazgos a las condiciones de manejo de la vida real. Una tarea basada en computadora usando un mouse no se parece a las condiciones de conducción de la vida real con un volante. Además, es posible que una imagen estática de un gato naranja no represente obstáculos comunes de la vida real al conducir.

Para mejorar la validez ecológica en un entorno de laboratorio, podría usar un simulador de conducción inmersivo con volante y pedal en lugar de una computadora y un mouse. Esto aumenta el realismo psicológico al reflejar más de cerca la experiencia de conducir en el mundo real.

Alternativamente, para una mayor validez ecológica, se puede realizar el experimento utilizando un curso de manejo real.

Compensación entre validez externa e interna

La validez interna es la medida en que puede estar seguro de que la relación causal establecida en su experimento no puede explicarse por otros factores.

Existe una compensación inherente entre la validez interna y la externa; cuanto más aplicable haga su estudio a un contexto más amplio, menos podrá controlar los factores extraños en su estudio.

Ejemplo de validez interna vs. externa

En el estudio de tiempos de reacción de conducción, puede controlar las condiciones del experimento y asegurarse de que no haya factores extraños que puedan explicar el resultado. Debido a que el experimento tiene una alta validez interna, puede concluir con confianza que escuchar el podcast provoca tiempos de reacción más lentos.

Mover el experimento a un curso de manejo de la vida real aumenta significativamente la validez externa a expensas de la validez interna. Esto se debe a que corre el riesgo de introducir factores extraños y confusos (p. ej., condiciones climáticas o de visibilidad) que afectan el resultado.

Amenazas a la validez externa y cómo contrarrestarlas

Es importante reconocer y contrarrestar las amenazas a la validez externa en un diseño de investigación para un estudio sólido.

Ejemplo de investigación

Un investigador quiere probar la hipótesis de que las personas con diagnósticos clínicos de trastornos mentales pueden beneficiarse de la práctica diaria de mindfulness en tan solo dos meses. Reclutan a personas que han sido diagnosticadas con depresión durante al menos un año, tienen entre 20 y 29 años y viven localmente.

Los participantes reciben una prueba previa y una prueba posterior que miden con qué frecuencia experimentaron ansiedad en la última semana. Durante el estudio, todos los participantes reciben un entrenamiento individual de atención plena y se les pide que practiquen la atención plena diariamente durante 15 minutos por la mañana.

Dado que los niveles de ansiedad disminuyeron entre la prueba previa y posterior, el investigador concluye que todas las poblaciones clínicas pueden beneficiarse de la atención plena.

AmenazaSentidoEjemplo
Sesgo de muestreoLa muestra no es representativa de la población.La muestra incluye sólo a personas con depresión. Tienen características (p. ej., patrones de pensamiento negativos) que pueden hacerlos muy diferentes de otras poblaciones clínicas, como las personas con trastornos de personalidad o esquizofrenia.
HistoriaUn evento no relacionado influye en los resultados.Justo antes de la prueba previa, ocurre un desastre natural en un estado vecino. Como resultado, los puntajes de ansiedad previos a la prueba son más altos de lo que podrían ser de otra manera.
Efecto experimentadorLas características o comportamientos de los experimentadores influyen involuntariamente en los resultados.El formador de las sesiones de mindfulness subrayó sin querer la importancia de este estudio para la financiación del departamento de investigación. Como resultado, los participantes trabajan muy duro para reducir sus niveles de ansiedad durante el estudio.
Efecto HawthorneLa tendencia de los participantes a cambiar su comportamiento simplemente porque saben que están siendo estudiados.Los participantes evitan activamente situaciones que les produzcan ansiedad durante el período del estudio porque son conscientes de su participación en la investigación.
Efecto de pruebaLa administración de una prueba previa o posterior afecta los resultados.Debido a que los participantes se familiarizan con el formato y las preguntas de la prueba previa, están menos ansiosos durante la prueba posterior y recuerdan menos ansiedad en ese momento.
Aptitud-tratamientoLas interacciones entre las características del grupo y las variables individuales juntas influyen en la variable dependiente.Las interacciones entre ciertas características de los participantes con depresión (p. ej., patrones de pensamiento negativos) y los ejercicios de atención plena (p. ej., centrarse en el presente) mejoran los niveles de ansiedad. Los hallazgos no se replican con personas con trastornos de personalidad o esquizofrenia.
Efecto de situaciónFactores como el entorno, la hora del día, la ubicación, las características de los investigadores, etc. limitan la generalización de los hallazgos.El estudio se repite con un cambio; los participantes practican la atención plena por la noche en lugar de por la mañana. Los resultados no muestran ninguna mejora esta vez.

Cómo contrarrestar las amenazas a la validez externa

Hay varias formas de contrarrestar las amenazas a la validez externa:

  • Las replicaciones contrarrestan casi todas las amenazas al mejorar la generalización a otros entornos, poblaciones y condiciones.
  • Los experimentos de campo contrarrestan las pruebas y los efectos de la situación mediante el uso de contextos naturales.
  • El muestreo probabilístico contrarresta el sesgo de selección al asegurarse de que todos en una población tengan las mismas posibilidades de ser seleccionados para una muestra de estudio.
  • La recalibración o reprocesamiento también contrarresta el sesgo de selección utilizando algoritmos para corregir la ponderación de factores (p. ej., edad) dentro de las muestras de estudio.

Preguntas frecuentes sobre la validez externa

¿Qué es la validez externa?

La validez externa de un estudio es la medida en que puede generalizar sus hallazgos a diferentes grupos de personas, situaciones y medidas.

¿Cuál es la diferencia entre validez interna y externa?

  • La validez interna es el grado de confianza de que la relación causal que está probando no está influenciada por otros factores o variables.
  • La validez externa es la medida en que sus resultados pueden generalizarse a otros contextos.
  • La validez de su experimento depende de su diseño experimental.

¿Qué son las amenazas a la validez externa?

  • Hay siete amenazas a la validez externa: el sesgo de selección, la historia, el efecto del experimentador, el efecto Hawthorne, el efecto de la prueba, el tratamiento de la aptitud y el efecto de la situación.

¿Cuáles son los tipos de validez externa?

Los dos tipos de validez externa son la validez de población (si se puede generalizar a otros grupos de personas) y la validez ecológica (si se puede generalizar a otras situaciones y entornos).

Conclusión

La validez externa está relacionada con la generalización. Recuerda que la validez se refiere a la verdad aproximada de proposiciones, inferencias o conclusiones. Entonces, la validez externa se refiere a la verdad aproximada de las conclusiones que implican generalizaciones. Dicho en otros términos, la validez externa es el grado en que las conclusiones de su estudio se mantendrían para otras personas en otros lugares y en otros momentos.

La validez externa ayuda a responder la pregunta: ¿se puede aplicar la investigación al “mundo real”? Si su investigación es aplicable a otros experimentos, escenarios, personas y tiempos, entonces la validez externa es alta. Si la investigación no se puede replicar en otras situaciones, la validez externa es baja. Es importante saber que su investigación es efectiva ( validez interna ) y que es efectiva en otras situaciones.

Fuentes consultadas

  • Bhandari, P. (2020, mayo 8). External validity. Scribbr. https://www.scribbr.com/methodology/external-validity/
  • Deng, J., Dietrich, M. S., Ridner, S. H., Fleischer, A. C., Wells, N., & Murphy, B. A. (2016). Preliminary evaluation of reliability and validity of head and neck external lymphedema and fibrosis assessment criteria. European Journal of Oncology Nursing: The Official Journal of European Oncology Nursing Society, 22, 63–70. https://doi.org/10.1016/j.ejon.2016.02.001