Este documento explica los conceptos de confiabilidad y validez en la medición de variables. Define la confiabilidad como la consistencia de los resultados y la validez como el grado en que un instrumento mide realmente la variable deseada. Describe distintos tipos de validez como la de contenido, criterio y constructo, así como métodos para medir la confiabilidad como el test-retest, formas paralelas, split-halves, alfa de Cronbach y KR-20.
2. MEDICIÓN: ¿En qué consiste?
Medir significa
asignar números,
símbolos o valores
a las propiedades
de objetos o
eventos de acuerdo
con reglas.
La medición es el proceso
que vincula conceptos
abstractos con indicadores
empíricos, este se realiza
mediante un plan explicito y
organizado para clasificar ( y
con frecuencia cuantificar)
los datos disponibles (los
indicadores) en términos del
concepto que el investigador
tiene en mente.
Los instrumentos de
medición son el recurso
que utiliza el investigador
para registrar información
o datos sobre las variables
que tiene en mente. Los
instrumentos de medición
deben estar caracterizados
por su confiabilidad y
validez.
3. VALIDEZ: Definición
La validez es el grado en que un instrumento en verdad mide la
variable que se busca medir. Un instrumento puede ser fiable
pero no válido; pero si es válido ha de ser también fiable.
VALIDEZ
DE
CONTENIDO
DE
CRITERIO
DE
CONSTRUCTO
Componentes
4. VALIDEZ: De Contenido
A través de la validez de contenido se trata de determinar
hasta dónde los ítems de un instrumento son representativos
del dominio o universo de contenido de la propiedad que se
desea medir.
A diferencia de otros tipos de validez, la de contenido no
puede ser expresada cuantitativamente, a través de un
índice o coeficiente; ella es más bien una cuestión de juicio.
por lo general se estima de manera subjetiva o intersubjetiva.
El procedimiento más comúnmente empleado para
determinar este tipo de validez, es el que se conoce con el
nombre de juicios de expertos.
5. VALIDEZ: De Contenido
Procedimiento para aplicar el juicio de expertos:
1. Se seleccionan dos jueces o expertos, por lo menos, a los fines de juzgar, de manera
independiente, la “bondad” de los ítems del instrumento, en términos de la relevancia o
congruencia de los reactivos con el universo de contenido, la claridad en la redacción y la
tendenciosidad o sesgo en la formulación de los ítems.
2. Cada experto recibe suficiente información escrita acerca de: (a) el propósito de la prueba;
(b) conceptualización del universo de contenido; (c) plan de operacionalización o tabla de
especificaciones (en el caso de las pruebas de rendimiento académico).
3. Cada juez recibe un instrumento de validación en el cual se recoge la información de cada
experto. Dicho instrumento normalmente contiene las siguientes categorías de información
por cada ítem: congruencia ítem-dominio, claridad, tendenciosidad y observaciones.
Se recogen y analizan los instrumentos de validación y se toman las decisiones siguientes: (a) los
ítems donde hay un 100 por ciento de coincidencia favorable entre los jueces (los ítems son
congruentes, están escritos claramente y no son tendenciosos) quedan incluido en el instrumento;
(b) los ítems donde hay un 100 por ciento de coincidencia desfavorable entre los jueces, quedan
excluidos del instrumento; y (c) los ítems donde sólo hay coincidencia parcial entre los jueces
deben ser revisados, reformulados, si es necesario, y nuevamente validados.
6. VALIDEZ: De Criterio
Se refiere al grado en que el test correlaciona con variables
ajenas al test (criterios) con lo que se espera por hipótesis que
debe correlacionar de determinado modo. Un criterio es una
variable distinta del test que se toma como referencia, que se
sabe que es un indicador de aquello que el test pretende
medir o que se sabe que debe presentar una relación
determinada con lo que el test pretende medir.
Cuanto más se relacionen los resultados del instrumento de
medición con el criterio, la validez de criterio será mayor.
7. VALIDEZ: De Constructo
Se refiere al grado en que una medición se relaciona de manera
consistente con otras mediciones de acuerdo con hipótesis
derivadas teóricamente y que concierne a los conceptos que se
están midiendo. En consecuencia la validez constructo incluye tres
etapas: Se establece y especifica la relación teórica entre los
conceptos. Se correlacionan ambos conceptos y se analiza
cuidadosamente la correlación. Se interpreta la evidencia empírica
de acuerdo con el nivel en que clarifica la validez de constructo de
una medición en particular.
Por ejemplo, un instrumento para medir la inteligencia debe medir
la inteligencia, y no la memoria, lo cual requiere a) un
entendimiento consensuado y explícito acerca de lo que se entiende
por inteligencia (a diferencia de la memoria).
8. CONFIABILIDAD: Definición
Es la estabilidad o consistencia de los resultados obtenidos. Ésta se
refiere al grado en que la aplicación repetida del instrumento, al
mismo sujeto u objeto, produce iguales resultados.
La determinación de la confiabilidad consiste, pues, en establecer si
las diferencias de resultados se deben a inconsistencias en la medida.
De la revisión de los expertos y de sus recomendaciones, se
procederá a la modificación de los instrumentos, si es necesario.
Antes de la aplicación definitiva de los instrumentos de recolección
de información, debe asegurarse de la validez y confiabilidad de los
instrumentos, realizando una prueba piloto; es decir, aplicando los
instrumentos a un grupo de personas que pertenezcan a un universo
similar al escogido.
9. CONFIABILIDAD: Test - Retest
Medida de estabilidad (confiabilidad por test-retest). En este
procedimiento un mismo instrumento de medición (o ítems o
indicadores) es aplicado dos o más veces a un mismo grupo de
personas, después de un periodo de tiempo. Si la correlación entre
los resultados de las diferentes aplicaciones es altamente positiva,
el instrumento se considera confiable. Se trata de una especie de
diseño panel. Desde luego, el periodo de tiempo entre las
mediciones es un factor a considerar. Si el periodo es largo y la
variable susceptible de cambios, ello puede confundir la
interpretación del coeficiente de confiabilidad obtenido por este
procedimiento. Y si el periodo es corto las personas pueden
recordar cómo contestaron en la primera aplicación del
instrumento, para aparecer como más consistentes de lo que son en
realidad (Bohrnstedt, 1976).
10. CONFIABILIDAD: Test - Retest
Coeficiente de correlación de Pearson:
Podemos definir el coeficiente de correlación de Pearson como un índice
que puede utilizarse para medir el grado de relación de dos variables
siempre y cuando ambas sean cuantitativas.
El valor del índice de correlación varía en el intervalo [-1,1]:
Si r = 1, existe una correlación positiva perfecta.
Si 0 < r < 1, existe una correlación positiva.
Si r = 0, no existe relación lineal.
Si -1 < r < 0, existe una correlación negativa.
Si r = -1, existe una correlación negativa perfecta.
11. CONFIABILIDAD: Formas Paralelas
La confiabilidad de formas paralelas es otra
representación común de confiabilidad en la cual se
administran diferentes formas de la misma prueba al
mismo grupo de personas, para luego correlacionar los
dos conjuntos de puntajes. Generalmente se utiliza
cuando se necesita administrar dos pruebas del mismo
cuestionario dentro del tiempo relativamente corto y así
eliminar la influencia de los efectos de la práctica sobre
los puntajes de los participantes.
12. CONFIABILIDAD: Split - Halves
Método de mitades partidas (Split-Halves). Los procedimientos anteriores
(medida de estabilidad y método de formas alternas), requieren cuando
menos dos administraciones de la medición en el mismo grupo de
individuos. En cambio, el método de mitades-partidas requiere sólo una
aplicación de la medición. Específicamente, el conjunto total de ítems (o
componentes) es dividido en dos mitades y las puntuaciones o resultados de
ambas son comparados. Si el instrumento es confiable, las puntuaciones de
ambas mitades deben estar fuertemente correlacionadas. Un individuo con
baja puntuación en una mitad, tenderá a tener también una baja
puntuación en la otra mitad.
rttn= coeficiente de confiabilidad del instrumento total
rtt = coeficiente de correlación obtenido para las 2 mitades
13. CONFIABILIDAD: Coeficiente Alfa de
Cronbach
Este es un coeficiente de validación del instrumento de recolección de
datos por medio del cual se valora dicho instrumento produciendo
valores de consistencia interna que se miden entre 0 y 1, que
comprobarían si el instrumento que se está evaluando recopila
información defectuosa que llevaría a conclusiones equivocadas o en
el mejor de los casos si se trata de un instrumento fiable que hace
mediciones estables y consistentes.
Para el cálculo de p*, deberá aplicar:
ΣP
NP
P*=
α=
N p*
1+p* (N-1)
En donde N es el número de items y p*
el promediode las correlaciones entre ítems.
En donde, ΣP es la sumatoria de las correlaciones
y NP el número de correlaciones no repetidas
o no excluidas.
14. CONFIABILIDAD: Coeficiente KR-20
Kuder y Richardson (1937) desarrollaron un coeficiente para estimar la confiabilidad de
una medición, su interpretación es la misma que la del coeficiente alfa.
Este es uno de los coeficientes más comunes, orientado hacia la consistencia interna
de una prueba. Usa la correlación promedio entre los ítems de una prueba si éstos
están estandarizados con una desviación estándar de uno; o en la covarianza promedio
entre los ítems de una escala, si los ítems no están estandarizados.
r = Confiabilidad según el coeficiente de Kudner - Richarson (KR-20)
k =Número de ítems
S2T = Varianza de los puntajes obtenidos
x = Resultados de la contabilización del número de aciertos "1".
N =Tamaño de la muestra
15. BIBLIOGAFIA
• Balestrini, M. (2006). Como se elabora el proyecto de investigación. Séptima Edición.
Consultores asociados servicio editorial.
• Behar, D. (2008). Metodología de la Investigación. Primera Edición. Editorial Shalom
• Castillo, A. Confiabilidad: Disponible en:
http://www.slideshare.net/acastillounah/confiabilidad-en-la-elaboracin-de-Instrumentos
• Cálculo de la Confiabilidad: Disponible en:
http://www.tecnicas-de-estudio.org/investigacion/investigacion46.htm
• Delgado, Y. y otros. (2002) Confiabilidad y Validez de los Instrumentos: Disponible en:
http://yamilesmith.blogspot.com/2012/06/confiabilidad-y-validez-de-los.htm
• Hernández, Fernández y Baptista (2001). Metodología de la Investigación. Quinta edición.
Editorial Mc Graw Hill. México
• Marroquín, R. Confiabilidad y Validez de Instrumentos de Investigación. Disponible en:
http://www.une.edu.pe/Titulacion/2013/exposicion/SESION-4-
Confiabilidad%20y%20Validez%20de%20Instrumentos%20de%20investigacion.pdf