jueves, 14 de junio de 2012

MEDIDAS DE ASOCIACIÓN

La correlación es aquello que indicará la fuerza y la dirección lineal que se establece entre dos variables aleatorias, los principales elementos componentes de una correlación serán: la fuerza, el sentido y la forma.

Usaremos un parámetro, llamado coeficiente de correlación que denotaremos con la letra (r), que nos permite valorar si  es fuerte o débil, positiva o negativa. El cálculo es una tarea mecánica, que podemos realizar con una calculadora o un programa informático. Nuestro interés está en saber interpretarlo.

Se clasifica en Correlación Lineal Y Recta De Regresión cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta, si así ocurre diremos que hay correlación lineal y  la recta se denomina recta de regresión.

Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y será cada vez más débil (o menos fuerte) cuando la nube vaya desvaneciéndose con respecto a la recta, cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir.

EJEMPLO:
Una persona se entrena para obtener el carnet de conducir repitiendo un test
de 50 preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos realizados.
Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y negativa (la recta es decreciente).
ilustración 1
En el gráfico que observamos en la ilustración 2  la correlación es bastante fuerte, ya que la recta que hemos dibujado está próxima a los puntos de la nube.

ilustración 2

Los tres procedimientos para el cálculo del coeficiente de correlación de datos no agrupados son las siguientes:

1. Son las dos variables de tipo categórico?. Si la respuesta es afirmativa pero hay mas de dos categorías en la expresión de cada variable, no se puede calcular coeficiente de correlación. Se aplica Chi-cuadrado. Si las variables son ambas categóricas y dicotómicas, se aplica el coeficiente O (Phi). Si una es dicotómica y la otra es ordinal se aplica correlación biserial por rangos. Si una es dicotómica y la otra está medida en una escala de intervalo se aplica la correlación punto biserial.
2. Son las variables ordinales? si la respuesta es afirmativa, corresponde aplicar la correlación por rangos de Spearman. Si una variable es ordinal y la otra dicotómica, se aplica correlación biserial por rangos. Si una es ordinal y la otra intervalor, se aplica correlación por rangos de Spearman.
3. Se encuentran las dos variables medidas en una escala de intervalo?. Si tal es el caso se aplica el coeficiente de correlación de Pearson. Si una variable es de intervalo y la otra ordinal se aplica correlación por rangos de Spearman




No hay comentarios:

Publicar un comentario