Saltar al conteníu

Diferencies ente revisiones de «Regresión llinial»

De Wikipedia
Contenido eliminado Contenido añadido
Páxina creada con «{{Artículu bonu}} {{otros usos|Función llineal (desambiguación)}} Archivu:Linear regression.svg|350px|thumb|Exemplu d'una regresión llineal con una [[variable dependi…»
(Nun hai diferencies)

Revisión a fecha de 18:42 24 feb 2018

Exemplu d'una regresión llineal con una variable dependiente y una variable independiente.

En estadística la regresión llineal o axuste llineal ye un modelu matemáticu usáu p'averar la relación de dependencia ente una variable dependiente Y, les variables independientes Xi y un términu aleatoriu ε. Esti modelu puede ser espresáu como:

onde:

: variable dependiente, esplicada o tornando.
: variables esplicatives, independientes o regresores.
: parámetros, miden la influencia que les variables esplicatives tienen sobre'l regrediendo.

onde ye la intersección o términu "constante", les son los parámetros respectivos a cada variable independiente, y ye'l númberu de parámetros independientes a tener en cuenta na regresión. La regresión llineal pue ser oldeada cola regresión non llineal.

Hestoria

La primer forma de regresión llineal documentada foi'l métodu de los mínimos cuadraos que foi publicada por Legendre en 1805, Gauss publicó un trabayu onde desenvolvía de manera más fonda'l métodu de los mínimos cuadraos,[1] y n'ónde s'incluyía una versión del teorema de Gauss-Márkov.

El términu regresión utilizar por primer vegada nel estudiu de variables antropométriques: al comparar la estatura de padres y fíos, onde resultó que los fíos que los sos padres teníen una estatura bien cimera al valor mediu, tendíen a igualase a ésti, ente que aquellos que los sos padres yeren bien baxos tendíen a amenorgar la so diferencia al respective de la estatura media; esto ye, "tornaben" al promediu.[2] La constatación empírica d'esta propiedá viose reforzada más tarde cola xustificación teórica d'esi fenómenu.

El términu llineal emplegar pa estremalo del restu de técniques de regresión, qu'empleguen modelos basaos en cualquier clase de función matemática. Los modelos llineales son una esplicación simplificada de la realidá, muncho más axiloses y con un soporte teóricu muncho más estensu per parte de la matemática y la estadística.

Pero bien, como se dixo, puede usase el términu llineal pa estremar modelos basaos en cualquier clase d'aplicación.

El modelu de regresión llineal

El modelu llineal rellaciona la variable dependiente Y con K variables esplícites (k = 1,...K), o cualesquier tresformamientu d'éstes que xeneren un hiperplano de parámetros desconocíos:

(2)

onde ye la perturbación aleatoria que recueye toos aquellos factores de la realidá non controlables o observables y que por tantu acomuñar col azar, y ye la que confier al modelu'l so calter estocástico. Nel casu más senciellu, con una sola variable esplícita, el hiperplano ye una recta:

(3)

El problema de la regresión consiste n'escoyer unos valores determinaos pa los parámetros desconocíos , de cuenta que la ecuación quede dafechu especificada. Pa ello precisa un conxuntu d'observaciones. Nuna observación i-ésima (i= 1,... I) cualesquier, rexístrase'l comportamientu simultáneu de la variable dependiente y les variables esplícites (les perturbaciones aleatories supónense non observables).

(4)

Los valores escoyíos como estimadores de los parámetros , son los coeficientes de regresión ensin que pueda garantizase que coincida n con parámetros reales del procesu xenerador. Por tanto, en

(5)

Los valores son pela so parte estimaciones o erros de la perturbación aleatoria.

Hipótesis del modelu de regresión llineal clásicu

  1. Esperanza matemática nula: . Pa cada valor de X la perturbación va tomar distintos valores de forma aleatoria, pero nun va tomar sistemáticamente valores positivos o negativos, sinón que se supon va tomar dellos valores mayores que cero y otros menores que cero, de tala forma que el so valor esperáu sía cero.
  2. Homocedasticidad: pa tou t. Tolos términos de la perturbación tienen la mesma varianza que ye desconocida. La dispersión de cada en redol al so valor esperáu ye siempres la mesma.
  3. Incorrelación o independencia: pa tou t,s con t distintu de s. Les covarianzas ente les distintes pertubaciones son nules, lo que quier dicir que nun tán correlacionadas. Esto implica que'l valor de la perturbación pa cualquier observación muestral nun vien influyíu polos valor de les perturbaciones correspondientes a otres observaciones muestrales.
  4. Regresores estocásticos.
  5. Independencia llineal. Nun esisten relaciones llineales esactes ente los regresores.
  6. . Suponemos que nun esisten erros de especificación nel modelu, nin erros de midida nes variables esplicatives.
  7. Normalidá de les perturbaciones:

Supuestos del modelu de regresión llineal

Pa poder crear un modelu de regresión llineal ye necesariu que se cumpla colos siguientes supuestos:[3]

  1. Que la relación ente les variables sía llineal.
  2. Que los erros na midida de les variables esplicatives sían independientes ente sigo.
  3. Que los erros tengan varianza constante. (Homocedasticidad)
  4. Que los erros tengan una esperanza matemática igual a cero (los erros d'una mesma magnitú y distintu signu son equiprobables).
  5. Qu'el erru total sía la suma de tolos erros.

Tipos de modelos de regresión llineal

Esisten distintos tipos de regresión llineal que se clasifiquen d'alcuerdu a los sos parámetros:

Regresión llineal simple

Namá se remana una variable independiente, polo que namá cunta con dos parámetros. Son de la forma:[4]

(6)

onde ye l'erru acomuñáu a la midida del valor y siguen los supuestos de cuenta que (media cero, varianza constante ya igual a un y con ).

Dáu'l modelu de regresión simple anterior, si calcula la esperanza (valor esperáu) del valor Y, llógrase:[5]

(7)

Derivando al respective de y ya igualando a cero, llógrase:[5]

(9)

(10)

Llogrando dos ecuaciones denominaes ecuaciones normales que xeneren la siguiente solución pa dambos parámetros:[4]

(11)Fallu al revisar la fórmula (función '\chigre' desconocida): {\displaystyle \hat{\beta_1} = \frac { \sum x \sum y - n \sum xy } { \left ( \sum x \right ) ^ 2 - n \sum x^2 } = \frac{ \sum (x-\chigre{x})(y-\chigre{y} ) }{\sum ( x - \chigre{x})^2 }}

(12)Fallu al revisar la fórmula (función '\chigre' desconocida): {\displaystyle \hat{\beta_0} = \frac { \sum y - \hat{\beta}_1 \sum x } { n } = \chigre{y} - \hat{\beta_1} \chigre{x}}

La interpretación del parámetru mediu ye qu'una medría en Xi d'una unidá, Yi va amontar en

Regresión llineal múltiple

La regresión llineal dexa trabayar con una variable a nivel d'intervalu o razón. De la mesma manera, ye posible analizar la relación ente dos o más variables al traviés d'ecuaciones, lo que se denomina regresión múltiple o regresión llineal múltiple.

Costantemente na práctica de la investigación estadística, atópense variables que de dalguna manera tán rellacionaes ente sigo, polo que ye posible qu'una de les variables puedan rellacionase matemáticamente en función d'otra o otres variables.

Remana delles variables independientes. Cuenta con dellos parámetros. Espresar de la forma:[6]

(13)

onde ye l'erru acomuñáu a la midida del valor y siguen los supuestos de cuenta que (media cero, varianza constante ya igual a un y con ).

Rectes de regresión

Les rectes de regresión son les rectas que meyor s'afaen a la nube de puntos (o tamién llamáu diagrama de dispersión) xenerada por una distribución binomial. Matemáticamente, son posibles dos rectes de máximu axuste:[7]

  • La recta de regresión de Y sobre X:

(14)Fallu al revisar la fórmula (función '\chigre' desconocida): {\displaystyle y = \chigre{y} + \frac{\sigma_{xy}}{\sigma_{x}^2}(x - \chigre{x})}

  • La recta de regresión de X sobre Y:

(15)Fallu al revisar la fórmula (función '\chigre' desconocida): {\displaystyle x = \chigre{x} + \frac{\sigma_{xy}}{\sigma_{y}^2}(y - \chigre{y})}

La correlación ("r") de les rectes va determinar la calidá del axuste. Si r ye cercanu o igual a 1, l'axuste va ser bonu y les predicciones realizaes a partir del modelu llográu van ser bien fiables (el modelu llográu resulta verdaderamente representativu); si r ye cercanu o igual a 0, va tratar d'un axuste malu nel que les predicciones que se realicen a partir del modelu llográu nun van ser fiables (el modelu llográu nun resulta representativu de la realidá). Dambes rectes de regresión se intersecan nun puntu llamáu centru de gravedá de la distribución.

Aplicaciones de la regresión llineal

Llínees d'enclín

Unu llínea d'enclín representa una enclín nuna serie de datos llograos al traviés d'un llargu períodu. Esti tipu de llínees puede dicinos si un conxuntu de datos en particular (como por casu, el PIB, el preciu del petróleu o'l valor de les acciones) aumentaron o decrementado nun determináu períodu.[8] Puede dibuxase una llínea d'enclín a güeyu fácilmente a partir d'un grupu de puntos, pero la so posición y pindia calcular de manera más precisa utilizando técniques estadísticas como les regresiones llineales. Les llínees d'enclín son xeneralmente llínees rectes, anque delles variaciones utilicen polinomios de mayor grau dependiendo de la combadura deseyada na llínea.

Medicina

En medicina, les primeres evidencies rellacionando la mortalidá col fumar tabacu[9] vinieron d'estudios qu'utilizaben la regresión llineal. El investigadores inclúin una gran cantidá de variables nel so analís de regresión nun esfuerzu por esaniciar factores que pudieren producir correlaciones espurias.

Nel casu del tabaquismu, el investigadores incluyeron el tao sociu-económicu p'asegurase que los efectos de mortalidá por tabaquismu nun sían un efectu de la so educación o posición económica. Sicasí, ye imposible incluyir toles variables posibles nun estudiu de regresión.[10][11] Nel exemplu del tabaquismu, un hipotéticu xen podría aumentar la mortalidá y aumentar la propensión a adquirir enfermedaes rellacionaes col consumu de tabacu. Por esta razón, na actualidá les pruebes controlaes aleatories son consideraes muncho más confiables que los analises de regresión.

Informática

Exemplu d'una rutina qu'utiliza una recta de regresión llineal pa proxectar un valor futuru: Códigu escritu en PHP

<?php
//Llicencia: GNU/GPL
$xarray=array(1, 2, 3, 4, 5 );	//Dias
$yarray=array(5, 5, 5, 6.8, 9); //Porcentaxe de ejecucion
$pm=100; //Valor futuru $x2=0;

$y=0;
$x=0;
$xy=0;
$cantidá=count($xarray);
for($i=0;$i<$cantidá;$i++){
      //Tabla de datos
      print ($xarray[$i]." ---- ".$yarray[$i]."<br>");
      //Calculo de terminos
      $x2 += $xarray[$i]*$xarray[$i];
      $y +=  $yarray[$i];
      $x  += $xarray[$i];
      $xy += $xarray[$i]*$yarray[$i];
}
//Coeficiente parcial de regresion
$b=($cantidá*$xy-$x*$y)/($cantidá*$x2-$x*$x);
//Calculo del intercepto $a=($y-$b*$x)/$cantidá;

//Recta tendencial
//y=a+bx
//Proyeccion en dias pa un 100% de la ejecucion:
if ($b!=0) $dias_proxectaos=($pm-$a)/$b;
else $dias_proxectaos=999999; //Infinitos
$dp=round($dias_proxectaos,0);
if($dp<=$pm) 	print $dp."---> Remata antes de los $pm dias <br>";
if($dp >$pm) 	print $dp ."---> ALARMA: Nun remata antes de los $pm dias <br>";
?>

Vease tamién

Referencies

  1. C.F. Gauss. Theoria combinationis observationum erroribus minimis obnoxiae. (1821/1823)
  2. Introduction to linear regression Curvefit.com (n'inglés)
  3. "Analís de regresión llineal", Universidá Complutense de Madrid
  4. 4,0 4,1 "Fórmules", Probabilidá y Estadística. Cs. Básiques. O.D.B. Matemática. Universidá Tecnolóxica Nacional, Facultá Rexonal Bonos Aires. Editorial CEIT-FRBA. (Códigu BM2BT2)
  5. 5,0 5,1 Modelu de regresión llineal simple. EinsteinNet.
  6. Técniques de regresión: Regresión Llineal Múltiple. Pértega Díaz, S., Pita Fernández, S. Unidá d'Epidemioloxía Clínica y Bioestadística. Complexu Hospitalariu de La Coruña (España)
  7. Apunte sobre Rectes de regresión. Ministeriu d'Educación y Ciencia. Gobiernu de España.
  8. Usu de les llínees d'enclín, Paritech (n'inglés)
  9. Doll, R., Wheatley, K., Gray, R. et al. «Mortality in relation to smoking: 40 years' observations on male British doctors .» BMJ 1994;309:901-911 (8 d'ochobre).
  10. "Environmental Tobacco Smoke and Adult Asthma" Division of Pulmonary and Critical Care Medicine, Division of Occupational and Environmental Medicine; Department of Medicine, Institute for Health Policy Studies; and Department of Epidemiology and Biostatistics, Universidá de California, San Francisco, California. (n'inglés)
  11. Regaláu-Pineda, Justino; Alejandro Gómez-Gómez; Javier Ramírez-Acosta; Juan Carlos Vázquez-García. «Efectu del tabaquismu, los síntomes respiratorios y l'asma sobre la espirometría d'adultos de la Ciudá de México.»

Bibliografía

  • Canavos, George C.; Probabilidá y Estadística. Aplicaciones y Métodos. McGraw-Hill. México. ISBN 9684518560.
  • Taramie, Jay L.; Probabilidá y Estadística pa Inxeniería y Ciencies. International Thomson Editores. México. ISBN 9706864571.
  • Walpole, Ronald Y.; Raymond, H.; Myers, Sharon L.; Probabilidá y Estadística pa Inxenieros. Prentice-Hall Hispanoamericana, S.A. México. ISBN 9701702646.

Enllaces esternos