Prueba t de Student

De Wikipedia
Saltar a navegación Saltar a la gueta

En estadística, una prueba t de Student, prueba t-Student, o Test-T ye cualesquier prueba na qu'el estadísticu utilizáu tien una distribución t de Student si la hipótesis nula ye cierta. Aplícase cuando la población estudiada sigue una distribución normal pero'l tamañu muestral ye demasiáu pequeñu como por que el estadísticu nel que ta basada la inferencia tea de normal distribuyíu, utilizándose una estimación de la esviación típica en llugar del valor real. Ye utilizáu en analís discriminante.

Historia[editar | editar la fonte]

L'estadísticu t foi introducíu por William Sealy Gosset en 1908, un químicu que trabayaba pa la cervecería Guinness de Dublín. Student yera'l so seudónimu d'escritor.[1][2][3] Gosset fuera contratáu gracies a la política de Claude Guiness de reclutar a los meyores graduaos d'Oxford y Cambridge, y coles mires de aplicar les nueves meyores en bioquímica y estadística al procesu industrial de Guiness.[2] Gosset desenvolvió'l test t como una forma senciella de monitorizar la calidá de la famosa cerveza stout. Publicó'l so test na revista inglesa Biometrika nel añu 1908, pero foi forzáu a utilizar un seudónimu pol so emplegador, pa caltener de callao los procesos industriales que se taben utilizando na producción. Anque ello ye que la identidá de Gosset yera conocida por dellos de los sos compañeros estadísticos.[4]

Usos[editar | editar la fonte]

Ente los usos más frecuentes de les pruebes t atópense:

  • El test de locación pa dos amueses, pol cual compruébase si les medies de dos poblaciones distribuyíes en forma normal son iguales. Toos estos test son usualmente llamaos test t de Student, a pesar de que puramente falando, tal nome namái tendría de ser utilizáu si les variances de los dos poblaciones estudiaes pueden ser asumíes como iguales; la forma de los ensayos que s'utilicen cuando esta asunción dexar de llau suelen ser llamaos dacuando como Prueba t de Welch. Estes pruebes suelen ser comúnmente nomaes como pruebes t desapareadas o de amueses independientes, por cuenta de que tienen la so aplicación más típica cuando les unidaes estadístiques que definen a dambes amueses que tán siendo comparaes non se superponen.[5]
  • El test d'hipótesis nula pol cual demuéstrase que la diferencia ente dos respuestes midíes nes mesmes unidaes estadístiques ye cero. Por casu, supóngase que se mide'l tamañu del tumor d'un paciente con cáncer. Si'l tratamientu resulta efectivu, lo esperable sería que'l tumor de munchos pacientes menguara de tamañu depués de siguir el tratamientu. Esto con frecuencia ye referíu como prueba t de midíes apariaes o repitíes.[5][6]
  • El test pa comprobar si la rimada d'una regresión llineal difier estadísticamente de cero.

Estadísticos T y Z[editar | editar la fonte]

La mayor parte de les pruebes estadístiques t tienen la forma , onde Z y s son funciones de los datos estudiaos. Típicamente, Z diseñar de forma tal que resulte sensible a la hipótesis alternativa (p.ej. que la so magnitú tienda a ser mayor cuando la hipótesis alternativa ye verdadera), ente que s ye un parámetru d'escala que dexa que la distribución de T pueda ser determinada.

Por casu, nuna prueba t d'amuesa única, , onde ye la media muestral de los datos, n ye'l tamañu muestral, y σ ye la desviación estándar de la población de datos; s nuna prueba d'amuesa única ye , onde ye la esviación estándar muestral.

Les asunciones subxacentes nuna prueba t son:

Nuna prueba t específica, estes condiciones son consecuencies de la población que ta siendo estudiada, y de la forma en que los datos fueron muestreados. Por casu, na prueba t de comparanza de medies de dos amueses independientes, tendríamos de realizar les siguientes asunciones:

  • Caúna de los dos poblaciones que tán siendo comparaes sigue una distribución normal. Esto pue ser demostráu utilizando una prueba de normalidá, tales como una prueba Shapiro-Wilk o Kolmogórov-Smirnov, o puede ser determináu gráficamente per mediu d'un gráficu de cuantiles normales Q-Q plot.
  • Si ta utilizándose la definición orixinal de Student sobre la so prueba t, los dos poblaciones a ser comparaes tienen de tener les mesmes varianzas, (esto puédese comprobar utilizando una prueba F d'igualdá de varianzas, una prueba de Levene, una prueba de Bartlett, o una prueba Brown-Forsythe, o envalorala gráficamente per mediu d'un gráficu Q-Q plot). Si los tamaños muestrales de los dos grupos comparaos son iguales, la prueba orixinal de Student ye altamente resistente a la presencia de varianzas desiguales.[7] La Prueba de Welch ye insensible a la igualdá de les varianzas, independientemente de si los tamaños d'amuesa son similares.
  • Los datos usaos pa llevar a cabu la prueba tienen de ser muestreados independientemente pa caúna de los dos poblaciones que se comparen. Esto polo xeneral nun ye posible determinalo a partir de los datos, pero si conozse que los datos fueron muestreados de manera dependiente (por casu si fueron muestreados por grupos), entós la prueba t clásica qu'equí s'analiza, puede conducir a resultancies errónees.

Pruebes t pa dos amueses apariaes y desapareadas[editar | editar la fonte]

Les pruebes-t de dos amueses pa probar la diferencia nes medies pueden ser desapareadas o en pareyes. Les pruebes t pareadas son una forma de bloquéu estadísticu, y tienen un mayor poder estadísticu que les pruebes ensin apariar cuando les unidaes apariaes son similares con al respective de los "factores de ruiu" que son independientes de la pertenencia a los dos grupos que se comparen.[ensin referencies] Nun contestu distintu, les pruebes-t apariaes pueden utilizase p'amenorgar los efectos de los factores de tracamundiu nun estudiu observacional.

Desapareada[editar | editar la fonte]

Les pruebes t desapareadas o d'amueses independientes, utilícense cuando se llogren dos grupos d'amueses aleatories, independientes y hermano distribuyíes a partir de los dos poblaciones a ser comparaes. Por casu, supóngase que tamos evaluando l'efeutu d'un tratamientu médicu, y reclutamos a 100 suxetos pal estudiu. Depués escoyemos aleatoriamente 50 suxetos pal grupu en tratamientu y 50 suxetos pal grupu de control. Nesti casu, llogramos dos amueses independientes y podríamos utilizar la forma desapareada de la prueba t. La eleición aleatoria nun ye esencial nesti casu, si contautamos a 100 persones per teléfonu y llogramos la edá y xéneru de caúna, y depués utilízase una prueba t bimuestral pa ver en que forma la media d'edaes difier por xéneru, esto tamién sería una prueba t d'amueses independientes, a pesar de que los datos son observacionales.

Apariada[editar | editar la fonte]

Les pruebes t d'amueses dependientes o apariaes, consisten típicamente nuna amuesa de pares de valores con similares unidaes estadístiques, o un grupu d'unidaes que fueron evaluaes en dos causes distintos (una prueba t de midíes repetitives). Un exemplu típicu de prueba t pa midíes repetitives sería por casu que los suxetos sían evaluaos antes y dempués d'un tratamientu.

Una prueba 't basada na coincidencia de pares muestrales llograr d'una amuesa desapareada que depués ye utilizada pa formar una amuesa apariada, utilizando pa ello variables adicionales que fueron midíes conxuntamente cola variable d'interés.[8]

La valoración de la coincidencia llevar a cabu por aciu la identificación de pares de valores que consisten nuna observación de caúna de los dos amueses, onde les observaciones del par son similares en términos d'otres variables midíes. Esti enfoque utilízase de cutiu nos estudios observacionales p'amenorgar o esaniciar los efectos de los factores de tracamundiu.

Cálculos[editar | editar la fonte]

Les espresiones esplícites que pueden ser utilizaes pa llograr delles pruebes t danse de siguío. En cada casu, amuésase la fórmula pa una prueba estadística qu'o bien siga esactamente o avere a una distribución t de Student so la hipótesis nula. Amás, danse los apropiaos graos de llibertá en cada casu. Caúna d'estes estadístiques pueden utilizase pa llevar a cabu yá sía un prueba d'una cola o prueba de dos coles.

Una vegada que se determinó un valor t, ye posible atopar un valor p acomuñáu utilizando pa ello una tabla de valores de distribución t de Student. Si'l valor p calulado ye menor a la llende escoyida por significancia estadística (usualmente a niveles de significancia 0,10; 0,05 o 0,01), entós la hipótesis nula refugar en favor de la hipótesis alternativa.

Prueba t p'amuesa única[editar | editar la fonte]

Nesta prueba evalúase la hipótesis nula de que la media de la población estudiada ye igual a un valor especificáu μ0, faise usu del estadísticu:

onde ye la media muestral, s ye la desviación estándar muestral y n ye'l tamañu de l'amuesa. Los graos de llibertá utilizaos nesta prueba corresponder al valor n − 1.

Rimada d'una regresión llineal[editar | editar la fonte]

Supóngase que se ta afaciendo'l modelu:

onde xi, i = 1, ..., n son conocíos, α y β son desconocíos, y εi ye l'error aleatoriu nos residuales que s'atopa de normal distribuyíu, con un valor esperáu 0 y una varianza desconocida σ2, y Yi, i = 1, ..., n son les observaciones.

Deseyar probar la hipótesis nula de que la rimada β ye igual a dalgún valor especificáu β0 (de cutiu toma'l valor 0, y nesi casu la hipótesis ye que x y y nun tán rellacionaos).

sía

Depués

tien una distribución t con n − 2 graos de libertad si la hipótesis nula ye verdadera. L'error estándar de la rimada:

puede ser reescrito en términos de los residuales:

Depués atópase dáu por:

Prueba t pa dos amueses independientes[editar | editar la fonte]

Iguales tamaños muestrales, iguales varianzas[editar | editar la fonte]

Esta prueba utilízase solamente cuando:

  • los dos tamaños muestrales (esto ye, el númberu, n, de participantes en cada grupu) son iguales;
  • puede asumise que los dos distribuciones tienen la mesma varianza.

Les violaciones a estos presupuestos alderíquense más embaxo.

L'estadísticu t a probar si les medies son distintes puede calculase como sigue:

Onde

,

ye la desviación estándar combinada, 1 = grupu unu, 2 = grupu 2. El denominador de t ye l'error estándar de la diferencia ente los dos medies.

Por prueba de significancia, los graos de llibertá d'esta prueba llógrense como 2n − 2 onde n ye'l númberu de participantes en cada grupu.

Distintos tamaños muestrales, iguales varianzas[editar | editar la fonte]

Esta prueba puede utilizase namái si puede asumise que los dos distribuciones tienen la mesma varianza. (Cuando esti presupuestu viólase, mirar más embaxo). L'estadísticu t si les medies son distintes pue ser calculáu como sigue:

Onde

Nótese que les fórmules de riba, son xeneralizaciones del casu que se da cuando dambes amueses tienen igual tamañu (sustituyendo n por n1 y n2).

ye un estimador de la esviación estándar común de dambes amueses: esto defínese asina por que'l so cuadráu sía un estimador ensin sesgu de la varianza común sía o non la media iguales. Nesta fórmula, n = númberu de participantes, 1 = grupu unu, 2 = grupo dos. n − 1 ye'l númberu de graos de llibertá pa cada grupu, y el tamañu muestral total menos dos (esto ye, n1 + n2 − 2) ye'l númberu de graos de llibertá utilizaos pa la prueba de significancia.

Distintos tamaños muestrales, distintos varianzas[editar | editar la fonte]

Esta prueba ye tamién conocida como prueba t de Welch y ye utilizada namái cuando puede asumise que los dos varianzas poblacionales son distintos (los tamaños muestrales pueden o nun ser iguales) y polo tanto tienen de ser envaloraes por separáu. L'estadísticu t a probar cuando les medies poblacionales son distintes pue ser calculáu como sigue:

onde

Equí s2 ye'l estimador ensin sesgu de la varianza de los dos amueses, n = númberu de participantes, 1 = grupu unu, 2 = grupo dos. Nótese que nesti casu, nun ye la varianza combinada. Pal so usu en pruebes de significancia, la distribución d'esti estadísticu ye aprosimao igual a una distribución t ordinaria colos graos de llibertá calculaos según:

Esta ecuación ye llamada la ecuación Welch–Satterthwaite. Nótese que la verdadera distribución d'esti estadísticu de fechu depende (llixeramente) de dos varianzas desconocíes.

Prueba t dependiente p'amueses apariaes[editar | editar la fonte]

Esta prueba utilízase cuando les amueses son dependientes; esto ye, cuando se trata d'una única amuesa que foi evaluada dos veces (amueses repitíes) o cuando los dos amueses fueron empareyaes o apariaes. Este ye un exemplu d'un test de diferencia apariada.

Pa esta ecuación, la diferencia D ente tolos pares tien que ser calculada. Los pares formáronse yá sía con resultancies d'una persona antes y dempués de la evaluación o ente pares de persones empareyaes en grupos de significancia (por casu, tomaos de la mesma familia o grupu d'edá: vease la tabla). La media (XD) y l'esviación estándar (sD) de tales diferencies utilizáronse na ecuación. La constante μ0 ye distintu de cero si deseyar probar si la media de les diferencies ye significativamente distinta de μ0. Los graos de llibertá utilizaos son n − 1.

Exemplu de pares empareyaos
Par Nome Edá Test
1 Juan 35 250
1 Joana 36 340
2 Jaimito 22 460
2 Jesica 21 200
Exemplu d'amueses repitíes
Númberu Nome Test 1 Test 2
1 Miguel 35% 67%
2 Melanie 50% 46%
3 Abeyera 90% 86%
4 Michell 78% 91%

Exemplos desenvueltos[editar | editar la fonte]

Sía A1 denotando un grupu llográu tomando 6 amueses aleatories a partir d'un grupu mayor:

y sía A2 denotando un segundu grupu llográu de manera similar:

Estos podríen ser, por casu, los pesos de torniellos escoyíos d'un montón.

Vamos llevar a cabu la prueba d'hipótesis cuntando como hipótesis nula de que la media de les poblaciones de les cualos tomemos les amueses son iguales.

La diferencia ente los dos medies d'amueses, caúnu denotado por , que apaez nel numberador en tolos enfoques de dos amueses aldericaes enantes, ye

La esviaciones estándar muestrales pa los dos amueses son aprosimao 0,05 y 0,11 respeutivamente. P'amueses tan pequeñes, una prueba d'igualdá ente les varianzas de los dos poblaciones nun ye bien poderosu. Pero yá que los tamaños muestrales son iguales, los dos formes de los dos pruebes t pueden desenvolvese en forma similar nesti exemplu.

Varianzas desiguales[editar | editar la fonte]

Si decide siguise col enfoque pa varianzas desiguales (aldericáu enantes), los resultaos son

y

La resultancia de la prueba estadística ye aprosimao 1,959. El valor p pa la prueba de dos coles da un valor averáu de 0,091 y el valor p pa la prueba d'una cola ye aprosimao 0,045.

Varianzas iguales[editar | editar la fonte]

Si síguese l'enfoque pa varianzas iguales (aldericáu enantes), los resultaos son

y

Una y bones el tamañu de les amueses ye igual (dambes tienen 6 elementos), la resultancia de la prueba estadística ye nuevamente un valor que s'avera a 1.959. Por cuenta de que los graos de llibertá son distintes de la prueba pa varianzas desiguales, los valores P difieren llixeramente de los llograos un pocu más arriba. Equí'l valor p pa la prueba de dos coles ye aprosimao 0,078, y el valor p pa una cola ye aprosimao 0,039. Asina, si hubiera una bona razón pa creer que les varianzas poblacionales son iguales, los resultaos seríen daqué más suxerentes d'una diferencia nos pesos medios de los dos poblaciones de torniellos.

Alternatives a la prueba t pa problemes de locación[editar | editar la fonte]

La prueba t aprove un mecanismu esactu pa evaluar la igualdá ente les medies de dos poblaciones que tengan varianzas iguales, anque'l valor esactu de les mesmes sía desconocíu. El test de Welch ye una prueba aprosimao esacta pal casu en que los datos tienen una distribución normal, pero les varianzas son distintes. P'amueses moderadamente grandes y pruebes d'una cola, l'estadísticu t ye moderadamente robustu a les violaciones de l'asunción de normalidá.[9]

Pa ser esactos tantu les pruebes t como les z rique que les medies de les amueses sigan una distribución normal, y la prueba t adicionalmente rique que la varianza de les amueses siga una distribución Chi-cuadráu (χ2), y que la media muestral y la varianza muestral sían estadísticamente independientes. La normalidá de los valores individuales de los datos nun ye un requisitu por que estes condiciones cumplir. Pol teorema de la llende central, les medies muestrales d'amueses moderadamente grandes tamién averen una distribución normal, inclusive si los datos individuales nun tán de normal distribuyíos. Pa datos non normales, la distribución de la varianza muestral puede esviase sustancialmente d'una distribución χ2. Sicasí, si'l tamañu muestral ye grande, el teorema de Slutsky indica que la distribución de les varianzas muestrales exerz un efeutu bien pequeñu na distribución de la prueba estadística. Si los datos son substancialmente non normales, y el tamañu muestral ye pequeñu, la prueba t puede apurrir resultancies equivocaes.

Cuando l'asunción de normalidá nun se sostien, una alternativa non paramétrica a la prueba t puede ufiertar un meyor poder estadísticu. Por casu, pa dos amueses independientes cuando la distribución de datos ye asimétrica (esto ye, que la distribución ta sesgada) o la distribución tien coles bien grandes, entós el test de suma de posiciones (ranks) de Wilcoxon (conocíu tamién como prueba O de Mann-Whitney) puede tener de trés a cuatro veces mayor poder estadísticu qu'una prueba t.[9][10][11]

La contraparte non paramétrica a la prueba t d'amueses apariaes ye la prueba Wilcoxon de suma de posiciones con signu p'amueses pareadas. Pa un discutiniu sobre cuando faer una eleición ente les alternatives t y non paramétricos, consulte a Sawilowsky.[12]

L'analís de varianza "one-way" xeneraliza la prueba t de dos amueses pa casos onde los datos pertenecen a más que dos grupos.

Pruebes multivariadas[editar | editar la fonte]

Una xeneralización del estadísticu t de Student llamada estadísticu t cuadráu de Hotelling, dexa la comprobación d'hipótesis en múltiples (y de cutiu correlacionadas) midíes de la mesma amuesa. Por casu, un investigador puede presentar un númberu de suxetos a un test de múltiples escales de personalidá (p.ej el de cinco grandes traces de personalidá). Por cuenta de que les midíes d'esti tipu suelen tar bien correlacionadas, nun ye aconseyable llevar a cabu delles pruebes univariadas, una y bones esto supondría desdexar la covarianza ente les midíes y encher la probabilidá de refugar falsamente siquier una hipótesis (error de tipu I). Nesti casu una única prueba múltiple ye preferible pa llevar a cabu les pruebes d'hipótesis. L'estadísticu t de Hosteling sigue una distribución T 2, sicasí na práutica, esta distribución utilízase bien raramente, y sicasí suelse convertir nuna distribución de tipu F.

Prueba T 2 monomuestral[editar | editar la fonte]

Pa una prueba multivariable d'única amuesa, la hipótesis ye que'l vector mediu () ye igual a un vector () dáu. La prueba estadística defínese como:

Onde n ye'l tamañu muestral, ye'l vector de columnes mediu y una matriz de covarianza muestral .

Prueba T 2 bimuestral[editar | editar la fonte]

Pa un test multivariable de dos amueses, la hipótesis ye que los vectores medios (, ) de los dos amueses son iguales. La prueba estadística defínese como:

Implementaciones[editar | editar la fonte]

La mayoría de programar tipu fueya de cálculu y paquetes estadísticos de llinguaxes de programación, tales como QtiPlot, OpenOffice.org Calc, LibreOffice Calc, LISREL, Microsoft Excel, SAS, SPSS, Stata, DAP, gretl, R, Python ([1]), PSPP, Infostat y Minitab, y PRISMA6 inclúin implementaciones del test t de Student.

Llectures adicionales[editar | editar la fonte]

  • Boneau, C. Alan (1960). «The effects of violations of assumptions underlying the t test». Psychological Bulletin 57 (1). doi:10.1037/h0041412 
  • Edgell, Stephen Y., & Noon, Sheila M (1984). «Effect of violation of normality on the t test of the correlation coefficient». Psychological Bulletin 95 (3). doi:10.1037/0033-2909.95.3.576. 

Referencies[editar | editar la fonte]

  1. Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.
  2. 2,0 2,1 O'Connor, John J.; Robertson, Edmund F., «Prueba t de Student» (en inglés), MacTutor History of Mathematics archive, Universidá de Saint Andrews, http://www-history.mcs.st-andrews.ac.uk/Biographies/Gosset.html .
  3. Fisher Box, Joan. «Guinness, Gosset, Fisher, and Small Samples». Statistical Science 2 (1). doi:10.1214/ss/1177013437. 
  4. Raju TN. «William Sealy Gosset and William A. Silverman: two "students" of science». Pediatrics 116 (3). doi:10.1542/peds.2005-1134. PMID 16140715. 
  5. 5,0 5,1 Fadem, Barbara (2008). High-Yield Behavioral Science (High-Yield Series). Hagerstwon, MD: Lippincott Williams & Wilkins. ISBN 0-7817-8258-9.
  6. Zimmerman, Donald W.. «A Note on Interpretation of the Paired-Samples t Test». Journal of Educational and Behavioral Statistics 22 (3). 
  7. Markowski, Carol A; Markowski, Edward P.. «Conditions for the Effectiveness of a Preliminary Test of Variance». The American Statistician 44 (4). doi:10.2307/2684360. 
  8. David, HAI; Gunnink, Jason L. «The Paired t Test Under Artificial Pairing». The American Statistician 51 (1). doi:10.2307/2684684. 
  9. 9,0 9,1 Sawilowsky S., Blair R. C.. «A more realistic look at the robustness and type II error properties of the t test to departures from population normality». Psychological Bulletin 111 (2). doi:10.1037/0033-2909.111.2.352. 
  10. Blair, R. C.; Higgins, J.J.. «A comparison of the power of Wilcoxon’s rank-sum statistic to that of Student’s t statistic under various nonnormal distributions.». Journal of Educational Statistics 5 (4). doi:10.2307/1164905. 
  11. Fay, MP; Proschan, MA. «Wilcoxon-Mann-Whitney or t-test? On assumptions for hypothesis tests and multiple interpretations of decision rules». Statistics Surveys 4. doi:10.1214/09-SS051. PMID 20414472. PMC 2857732. http://www.i-journals.org/ss/viewarticle.php?id=51. 
  12. Sawilowsky S. «Misconceptions leading to choosing the t test over the Wilcoxon Mann-Whitney O test for shift in location parameter». Journal of Modern Applied Statistical Methods 4 (2). 
  • O'Mahony (1986). Sensory Evaluation of Food: Statistical Methods and Procedures. CRC Press, 487. ISBN 0-824-77337-3.
  • Press, William H.; Saul A. Teukolsky, William T. Vetterling, Brian P.
Flannery (1992). Numerical Recipes in C: The Art of Scientific Computing. Cambridge University Press, p. 616. ISBN 0-521-43108-5.

Enllaces esternos[editar | editar la fonte]

Plantía:Wikiversity

Calculadores en llinia[editar | editar la fonte]



Prueba t de Student