Correlación

De Wikipedia
Saltar a navegación Saltar a la gueta

En probabilidá y estadística, la correlación indica la fuerza y la direición d'una relación llineal y proporcionalidad ente dos variables estadístiques. Considérase que dos variables cuantitatives tán correlacionadas cuando los valores d'una d'elles varien sistemáticamente con al respective de los valores homónimos de la otra: si tenemos dos variables (A y B) esiste correlación ente elles si al menguar los valores d'A facer tamién los de B y viceversa. La correlación ente dos variables nun implica, por sigo mesma, nenguna relación de causalidá (Vease cum hoc ergo propter hoc).

Fuerza, sentíu y forma de la correlación[editar | editar la fonte]

La relación ente dos variables cuantitatives queda representada por aciu la llinia de meyor axuste, trazada a partir de la nube de puntos. Los principales componentes elementales d'una llinia d'axuste y, poro, d'una correlación, son la fuerza, el sentíu y la forma:

  • La fuerza estrema según el casu, mide'l grau en que la llinia representa a la nube de puntos: si la nube ye estrecha y allargada, representar por una llinia recta, lo qu'indica que la relación ye fuerte; si la nube de puntos tien un enclín elípticu o circular, la relación ye débil.
  • El sentíu mide la variación de los valores de B con al respective de A: si al crecer los valores d'A facer los de B, la relación ye directa (pindia positiva); si al crecer los valores d'A mengüen los de B, la relación ye inversa (pindia negativa).
  • La forma establez el tipu de llinia que define'l meyor axuste: la llinia recta, la curva monotónica o la curva non monotónica

Coeficientes de correlación[editar | editar la fonte]

Esisten diversos coeficientes que miden el grau de correlación, afechos a la naturaleza de los datos. El más conocíu ye'l coeficiente de correlación de Pearson (introducíu en realidá por Francis Galton), que se llogra estremando la covarianza de dos variables ente'l productu de les sos esviaciones estándar. Otros coeficientes son:

Interpretación xeométrica[editar | editar la fonte]

Daos los valores muestrales de dos variables aleatories y , que pueden ser consideraes como vectores nun espaciu a n dimensiones, pueden construyise los "vectores centraos" como:


y .

El cosenu del ángulu alfa ente estos vectores ye dáu pola fórmula siguiente:


Pos ye'l coeficiente de correlación muestral de Pearson. El coeficiente de correlación ye'l cosenu del ángulu ente dambos vectores centraos:

  • Si r = 1, l'ángulu °, dambos vectores son colineales (paralelos).
  • Si r = 0, l'ángulu °, dambos vectores son ortogonales.
  • Si r =-1, l'ángulu °, dambos vectores son colineales de direición opuestu.

Más xeneralmente: .

De xacíu, dende'l puntu vista xeométricu, nun falamos de correlación llineal: el coeficiente de correlación tien siempres un sentíu, cualesquier sía'l so valor ente -1 y 1. Infórmanos de manera precisa, non tantu sobre'l grau de dependencia ente les variables, sinón sobre la so distancia angular na hiperesfera a n dimensiones.

La Iconografía de les correlaciones ye un métodu d'analís multidimensional que reposa nesta idea. La correlación llineal dase cuando nuna nube de puntos atópense o se distribúin alredor d'una recta.

La fórmula de correlación pa dos series distintes con ciertu desfase "k", ta dada pola fórmula:


Distribución del coeficiente de correlación[editar | editar la fonte]

El coeficiente de correlación muestral o analíticu d'una amuesa ye de fechu una variable aleatoria, eso significa que si repitimos un esperimentu o consideramos distintes amueses van llograse valores distintos y por tantu'l coeficiente de correlación muestral calculáu a partir d'elles va tener valores llixeramente distintos. P'amueses grandes la variación en dichu coeficiente va ser menor que p'amueses pequeñes. R. A. Fisher foi'l primeru en determinar la distribución de probabilidá pal coeficiente de correlación.

Si los dos variables aleatories que trata de rellacionase vienen de una distribución gaussiana bivariante entós el coeficiente de correlación r sigue una distribución de probabilidá dada por:[1][2]


onde:

ye la distribución gamma
ye la función gaussiana hipergeométrica.

Nótese que'l valor esperáu del coeficiente de correlación muestral r ye:


por tanto, r ye estimador sesgado de . Puede llograse un estimador averáu non sesgado resolviendo la ecuación:


pa

Anque, la solución:


ye subóptima. Puede llograse un estimador sesgado con mínima varianza pa grandes valores de n, con sesgu d'orde buscando'l máximu de la espresión:


, i.y.

Nel casu especial de que , la distribución orixinal pue ser reescrita como:


onde ye la función beta.

Referencies[editar | editar la fonte]

  1. Kenney, J. F. and Keeping, Y. S., Mathematics of Statistics, Pt. 2, 2nd ed. Princeton, NJ: Van Nostrand, 1951.
  2. Correlation Coefficient - Bivariate Normal Distribution

Enllaces esternos[editar | editar la fonte]


Correlación