Contraste d'hipótesis

De Wikipedia

Dientro de la inferencia estadística, un contraste d'hipótesis (tamién denomináu test d'hipótesis o prueba de significación) ye un procedimientu pa xulgar si una propiedá que se supón nuna población estadística ye compatible colo reparao nuna muestra de dicha población. Foi empecipiada por Ronald Fisher y encontada darréu por Jerzy Neyman y Karl Pearson.

Por aciu esta teoría, encétase'l problema estadísticu considerando una hipótesis determinada y una hipótesis alternativa , ya inténtase dirimir cuál de los dos ye la hipótesis verdadera, n'aplicando'l problema estadísticu a un ciertu númberu d'esperimentos.

Ta fuertemente acomuñada al conceutu estadísticu de potencia y a los conceutos d'errores de tipu I y II, que definen respeutivamente, la posibilidá de tomar un sucesu falsu como verdaderu, o unu verdaderu como falsu.

Los tipos más importantes son los test centraos, d'hipótesis y alternativa simple, aleatorizados, etc. Dientro de los tests non paramétricos, el más estendíu ye probablemente'l test de la O de Mann-Whitney.

Introducción[editar | editar la fonte]

Si abarruntamos qu'una moneda foi trucada por que se produzan más cares que cruces al llanzala al aire, podríamos realizar 30 llanzamientos, tomando nota del númberu de cares llograes. Si llogramos un valor demasiáu alto, por casu 25 o más, consideraríamos que la resultancia ye pocu compatible cola hipótesis de que la moneda nun ta trucada, y concluyiríamos que les observaciones contradicen dicha hipótesis.

L'aplicación de cálculos probabilísticos dexa determinar a partir de qué valor tenemos de refugar la hipótesis garantizando que la probabilidá de cometer un error ye un valor conocíu a priori. Les hipótesis pueden clasificase en dos grupos, según:

  1. Especifiquen un valor concretu o un intervalu pa los parámetros del modelu.
  2. Determinen el tipu de distribución de probabilidá que xeneró los datos.

Un exemplu del primer grupu ye la hipótesis de que la media d'una variable ye 10, y del segundu que la distribución de probabilidá ye la distribución normal.

Anque la metodoloxía pa realizar el contraste d'hipótesis ye análoga en dambos casos, estremar dambos tipos d'hipótesis ye importante yá que munchos problemes de contraste d'hipótesis al respective de un parámetru son, en realidá, problemes d'estimación, que tienen una respuesta complementaria dando un intervalu d'enfotu (o conxuntu d'intervalos d'enfotu) para dichu parámetru. Sicasí, les hipótesis al respective de la forma de la distribución suélense utilizar pa validar un modelu estadísticu pa un fenómenu aleatoriu que se ta estudiando.

Planteamientu clásicu del contraste d'hipótesis[editar | editar la fonte]

Denominar hipótesis nula a la hipótesis que se desea oldear. El nome de "nula" significa “ensin valor, efeutu o consecuencia”, lo cual suxure que tien d'identificase cola hipótesis de non cambéu (a partir de la opinión actual); non diferencia, non meyora, etc. representa la hipótesis que vamos caltener sacantes que los datos indiquen la so falsedá, y puede entendese, por tanto, nel sentíu de “neutra”. La hipótesis nunca se considera probada, anque pue ser refugada polos datos. Por casu, la hipótesis de que dos poblaciones tienen la mesma media pue ser refugada fácilmente cuando dambes difieren enforma, analizando muestres abondo grandes de dambes poblaciones, pero nun puede ser "demostrada" por aciu muestreo, yá que siempres cabo la posibilidá de que les medies difieran nuna cantidá lo suficientemente pequeña por que nun pueda ser detectada, anque la muestra seya bien grande.

A partir d'una muestra de la población n'estudiu, estrayer un estadísticu (esto ye, un valor que ye función de la muestra) que la so distribución de probabilidá tea rellacionada cola hipótesis n'estudiu y seya conocida. Tómase entós como rexón de refuga al conxuntu de valores que ye más improbable so la hipótesis, esto ye, el conxuntu de valores pal que vamos refugar la hipótesis nula si'l valor del estadísticu reparáu entra dientro d'él.

La probabilidá de que se llogre un valor del estadísticu qu'ente na rexón de refuga entá siendo cierta la hipótesis puede calculase. D'esta manera, puede escoyese dicha rexón de tala forma que la probabilidá de cometer esti error seya abondo pequeña.

Siguiendo col anterior exemplu de la moneda trucada, la muestra de la población ye'l conxuntu de los trenta llanzamientos a realizar, l'estadísticu escoyíu ye'l númberu total de cares llograes, y la rexón de refuga ta constituyida polos númberos totales de cares iguales o superiores a 25. La probabilidá de cometer l'error d'almitir que la moneda ta trucada a pesar de que nun lo ta ye igual a la probabilidá binomial de tener 25 "ésitos" o más nuna serie de 30 ensayos de Bernoulli con probabilidá de "ésitu" 0,5 en cada unu, entós: 0,0002, pos esiste la posibilidá, anque pocu probable, que la muestra déanos más de 25 cares ensin ser la moneda trucada.

Procedimientos de prueba[editar | editar la fonte]

Un procedimientu de prueba ye una regla con base en datos muestrales, pa determinar si refúgase .

Exemplu
Una prueba de : p = 0.10 contra : p < 0.10, podría tar basada nel exame d'una muestra aleatoria de n = 200 oxetos. Representamos con X el númberu d'oxetos defectuosos de la muestra, una variable aleatoria binomial; x representa'l valor reparáu de X. si ye verdadera, Y(X) = np = 200*(0.10) = 20, mientres, podemos esperar menos de 20 oxetos defectuosos si ye verdadera. Un valor de x llixeramente debaxo de 20 nun contradiz de manera contundente a asina que ye razonable refugar solo si x ye considerablemente menor que 20. Un procedimientu de prueba ye refugar si x≤15 y nun refugar d'otra forma. Nesti casu, la rexón de refuga ta formada por x = 0, 1, 2, …, y 15. nun va ser refugada si x= 16, 17,…, 199 o 200.

Un procedimientu de prueba especificar polo siguiente:

  1. Un estadísticu de prueba: una función de los datos muestrales nos cualos básase la decisión de refugar o nun refugar .
  2. Una rexón de refuga, el conxuntu de tolos valores del estadísticu de prueba pa los cualos va ser refugada.

Entós, la hipótesis nula va ser refugada si y solu si'l valor reparáu o calculáu del estadísticu de prueba allugar na rexón de refuga

Nel meyor de los casos podríen desenvolvese procedimientos de prueba pa los cualos nengún tipu d'error ye posible. Pero esto puede algamar solu si una decisión basar nun exame de tola población, lo que cuasi nunca ye práuticu. La dificultá al usar un procedimientu basáu en datos muestrales ye que por cuenta de la variabilidá nel muestreo puede resultar una muestra non representativa.

Un bon procedimientu ye aquel pal cual la probabilidá de cometer cualquier tipu d'error ye pequeña. La eleición d'un valor particular de corte de la rexón de refuga afita les probabilidaes d'error tipo I y II. Estes probabilidaes d'error son representaes por α y β, respeutivamente.

Enfoque actual de los contrastes d'hipótesis[editar | editar la fonte]

L'enfoque actual considera siempres una hipótesis alternativa a la hipótesis nula. De manera esplícita o implícita, la hipótesis nula, a la que se denota davezu por , enfrentar a otra hipótesis que vamos denominar hipótesis alternativa y que se denota . Nos casos nos que nun s'especifica de manera esplícita, podemos considerar que quedó definida implícitamente como “ ye falsa”.

Si por casu deseyamos comprobar la hipótesis de que dos distribuciones tienen la mesma media, tamos implícitamente considerando como hipótesis alternativa “dambes poblaciones tienen distinta media”. Podemos, sicasí considerar casos nos que nun ye la simple negación de . Supongamos por casu qu'abarruntamos que nun xuegu d'azar con un dadu, este ta trucáu pa llograr 6. La nuesa hipótesis nula podría ser “el dadu nun ta trucáu” que vamos intentar oldear, a partir d'una muestra de llanzamientos realizaos, contra la hipótesis alternativa “el dadu foi trucáu a favor del 6”. Cabría realizar otres hipótesis, pero, a los efeutos del estudiu que pretende realizase, nun se consideren relevantes.

Un test d'hipótesis entiéndese, nel enfoque modernu, como una función de la muestra, corrientemente basada nun estadísticu. Supongamos que se tien una muestra d'una población n'estudiu y que se formularon hipótesis sobre un parámetru rellacionáu cola distribución estadística de la población. Supongamos que se dispón d'un estadísticu que la so distribución con al respective de , conozse. Supongamos, tamién, que les hipótesis nula y alternativa tienen la formulación siguiente:


Un contraste, prueba o test pa diches hipótesis sería una función de la muestra de la siguiente forma:


Onde significa que tenemos de refugar la hipótesis nula, (aceptar ) y , que tenemos d'aceptar (o que nun hai evidencia estadística contra ). A denominar rexón de refuga. N'esencia, pa construyir el test deseyáu, basta con escoyer l'estadísticu del contraste y la rexón de refuga .

Escuéyese de tal manera que la probabilidá de que T(X) caya nel so interior seya baxa cuando se da .

Errores nel contraste[editar | editar la fonte]

Una vegada realizáu'l contraste d'hipótesis, optaríase por una de los dos hipótesis, o , y la decisión escoyida va coincidir o non cola qu'en realidá ye cierta. Pueden dase los cuatro casos que s'esponen nel siguiente cuadru:

ye cierta ye cierta
Escoyóse Nun hai error Error de tipu II
Escoyóse Error de tipu I Nun hai error


Si la probabilidá de cometer un error de tipu I ta unívocamente determinada, el so valor suelse denotar pola lletra griega α, y nes mesmes condiciones, se denota pola probabilidá de cometer l'error de tipu II, esto ye:


Nesti casu, denominar Potencia del contraste al valor 1-β, esto ye, a la probabilidá d'escoyer cuando ésta ye cierta ecuación| . ||left}} Cuando ye necesariu diseñar un contraste d'hipótesis, sería deseable faelo de tal manera que les probabilidaes de dambos tipos d'error fueren tan pequeñes como fuera posible. Sicasí, con una muestra de tamañu prefijado, menguar la probabilidá del error de tipu I, α, conduz a amontar la probabilidá del error de tipu II, β.

Usualmente, diséñense los contrastes de tal manera que la probabilidá α sía'l 5% (0,05), anque dacuando úsense'l 10% (0,1) o 1% (0,01) p'adoptar condiciones más relaxaes o más estrictes. El recursu p'aumentar la potencia del contraste, esto ye, menguar β, probabilidá d'error de tipu II, ye aumentar el tamañu muestral, lo que na práutica trai una medría de los costos del estudiu que quier realizase.

Contraste más potente[editar | editar la fonte]

El conceutu de potencia déxanos valorar cual ente dos oldees cola mesma probabilidá d'error de tipu I, α, ye preferible. Si tratar d'oldear dos hipótesis sencielles sobre un parámetru desconocíu, θ, del tipu:


Trátase d'escoyer ente tolos contrastes posibles con α prefijado aquel que tien mayor potencia, esto ye, menor probabilidá β d'incurrir nel error de tipu II.

Nesti casu'l Lema de Neyman-Pearson garantiza la esistencia d'un contraste de máxima potencia y determina cómo construyilo.

Contraste uniformemente más potente[editar | editar la fonte]

Nel casu de que les hipótesis sían compuestes, esto ye, que nun se llinden a especificar un únicu posible valor del parámetru, sinón que sían del tipu:


onde y son conxuntos de dellos posibles valores, les probabilidaes α y β yá nun tán unívocamente determinaes, sinón que van tomar distintos valores según los distintos valores posibles de θ. Nesti casu dizse qu'un contraste tien tamañu α si


esto ye, si la máxima probabilidá de cometer un error de tipu I cuando la hipótesis nula ye cierta ye α. Nestes circunstancies, puede considerase β como una función de θ, yá que pa cada posible valor de θ na hipótesis alternativa tendríase una probabilidá distinta de cometer un error de tipu II. Defínese entós


y, la función de potencia del contraste ye entós


esto ye, la probabilidá de discriminar que la hipótesis alternativa ye cierta pa cada valor posible de θ dientro de los valores posibles d'esta mesma hipótesis.

Dizse qu'un contraste ye uniformemente más potente de tamañu α cuando, pa tou valor ye mayor o igual que'l de cualesquier otru contraste del mesmu tamañu. En resume, tratar d'un contraste que garantiza la máxima potencia pa tolos valores de θ na hipótesis alternativa.

Ye claro que'l casu del contraste uniformemente más potente pa hipótesis compuestes esixe'l cumplimientu de condiciones más esixentes que nel casu del contraste más potente pa hipótesis simples. Por ello, nun esiste un equivalente al Lema de Neyman-Pearson pal casu xeneral.

Sicasí, sí esisten munches condiciones nes que, cumpliéndose determinaes propiedaes de les distribuciones de probabilidá implicaes y pa ciertos tipos d'hipótesis, puede estendese el Lema pa llograr el contraste uniformemente más potente del tamañu que se deseye.

Aplicaciones de los contrastes d'hipótesis[editar | editar la fonte]

Los contrastes d'hipótesis, como la inferencia estadística polo xeneral, son ferramientes d'ampliu usu na ciencia polo xeneral. En particular, la moderna Filosofía de la ciencia desenvuelve'l conceutu de falsabilidad de les teoríes científiques basándose nos conceutos de la inferencia estadística polo xeneral y de los contrastes d'hipótesis. Nesti contestu, cuando se desea optar ente dos posibles teoríes científiques pa un mesmu fenómenu (dos hipótesis) tien de realizase un contraste estadísticu a partir de los datos disponibles sobre'l fenómenu que dexen optar por una o otra.

Les téuniques de contraste d'hipótesis son tamién d'amplia aplicación en munchos otros casos, como ensayos clínicos de nueves melecines, control calidable, encuestes, etcétera.

Test estadísticos[editar | editar la fonte]

Nome Fórmula Notes
align=center| (Población distribuyida normal o n > 30) y σ conocida.

(z ye la distancia dende la media en rellación cola esviación estándar de la media). Pa distribuciones non normales ye posible calcular una proporción mínima d'una población que cai dientro de k desviación estándar pa cualesquier k.

Test-z pa dos muestres Población normal y observaciones independientes con σ1 y σ2 conocíes
Una muestra t-test

(Población normal o n > 30) y desconocida
t-test parejado

(Población normal de diferencies o n > 30) y desconocida o pequeña muestra de tamañu n < 30
Dos muestres combinaes t-test, varianzas iguales


[1]

(Poblaciones normales o n1 + n2 > 40) y observaciones independientes y σ1 = σ2 desconocíu
Dos muestres non combinaes t-test, varianzas desiguales

[1]

(Poblaciones normales o n1 + n2 > 40) y observaciones independientes y σ1 ≠ σ2 dambes desconocíes
Una proporción z-test n .p0 > 10 and n (1 − p0) > 10 y ye una muestra aleatoria simple, vease distribución binomial.
Dos apurras z-test, combinaes por

n1 p1 > 5 y n1(1 − p1) > 5 y n2 p2 > 5 y n2(1 − p2) > 5 y observaciones independientes, vease l'aproximamientu normal de la distribución binomial.
Dos apurras z-test, descombinadas por n1 p1 > 5 y n1(1 − p1) > 5 y n2 p2 > 5 y n2(1 − p2) > 5 y observaciones independientes, vease l'aproximamientu normal de la distribución binomial.
Test de la chi cuadráu pa la varianza Población normal
align=center| df = k - 1 - # parámetros envaloraos, y unu d'ellos tien de tenese.
Test de la F de Snedecor pa dos muestres pa la igualdá de varianzas Poblaciones normales
Cumpla que y refugue H0 pa [2]
Test de la regresión t-test de *Restar 1 por variable dependiente; k ye'l númberu de variables independientes.
Reject H0 for [3]
Polo xeneral, el subíndice 0 indica un valor dau de la hipótesis nula, H0, que tien de ser usada tanto como seya posible na construcción del test estadísticu. ... Definiciones d'otros símbolos:
  • , la probabilidá del erro tipu I (refugando una hipótesis nula cuando ye en realidá cierta)
  • = tamañu de la muestra
  • = tamañu de la muestra 1
  • = tamañu de la muestra 2
  • = media de la muestra
  • = media de la población hipotética
  • = media de la población 1
  • = media de la población 2
  • = esviación de la población
  • = varianza poblacional
  • = Desviación estándar de la muestra
  • = Suma (de númberos k)
  • = Varianza de la muestra
  • = Desviación estándar de la muestra 1
  • = Desviación estándar de la muestra 2
  • = t de Student
  • = Graos de llibertá
  • = Diferencies de les medies de les muestres
  • = Diferencia de les medies poblacionales hipotétiques
  • = Diferencies de les esviaciones estándares
  • = Estadísticu chi-cuadráu |

valign="top" |

  • = x/n = proporción muestra/proporción, nun siendo que se especifique otra manera
  • = proporción de la población hipotética
  • = proporción 1
  • = proporción 2
  • = Diferencia hipotética na proporción
  • = Mínimu de n1 y n2
  • = Estadísticu F

Ver tamién[editar | editar la fonte]

Enllaces esternos[editar | editar la fonte]

Referencies[editar | editar la fonte]

  1. 1,0 1,1 NIST handbook: Two-Sample t-Test for Equal Means
  2. NIST handbook: F-Test for Equality of Two Standard Deviations (Testing standard deviations the same as testing variances)
  3. Steel, R.G.D, and Torrie, J. H., Principles and Procedures of Statistics with Special Reference to the Biological Sciences., McGraw Hill, 1960, page 288.)