Saltar al conteníu

Error estándar

De Wikipedia
Pa un valor dau nuna muestra aleatoria con un error distribuyíu normal, la imaxe de riba representa la proporción de muestres que pueden cayer ente 0,1,2, y 3 desviación estándar percima y per debaxo del valor real.

El error estándar ye la desviación estándar de la distribución muestral d'un estadísticu.[1] El términu refierse tamién a una estimación de la esviación estándar, derivada d'una muestra particular usada pa computar la estimación.

La media muestral ye'l estimador avezáu d'una media poblacional. Sicasí, distintes muestres escoyíes de la mesma población tienden polo xeneral a dar distintos valores de medies muestrales. El error estándar de la media (esto ye, l'error por cuenta de la estimación de la media poblacional a partir de les medies muestrales) ye la esviación estándar de toles posibles muestres (d'un tamañu dau) escoyíos d'esa población. Amás, l'error estándar de la media puede referise a una estimación de la esviación estándar, calculada dende una muestra de datos que ta siendo analizada coles mesmes.

N'aplicaciones práutiques, el verdaderu valor de la esviación estándar (o del error) ye xeneralmente desconocíu. Como resultancia, el términu "error estándar" úsase dacuando pa referise a una estimación d'esta cantidá desconocida. En tales casos ye importante tener claro d'ónde provién, una y bones l'error estándar ye namái una estimación. Desafortunadamente, esto nun ye siempres posible y puede ser meyor usar un aproximamientu qu'evite usar l'error estándar, por casu usando la estimación de máxima verosimilitud o un aproximamientu más formal derivada de los intervalos d'enfotu. Un casu bien conocíu onde pueda usase de forma apropiada pue ser na distribución t de Student p'apurrir un intervalu d'enfotu pa una media envalorada o diferencia de medies. N'otros casos, l'error estándar puede ser usáu p'aprovir una indicación del tamañu de la incertidume, pero'l so usu formal o semi-formal p'apurrir intervalos d'enfotu o test tien de ser evitáu nun siendo que'l tamañu de la muestra seya siquier moderadamente grande. Equí'l conceutu "grande" va depender de les cantidaes particulares que vaigan ser analizaes.

N'analís de regresión, el términu error estándar o error típicu ye tamién usáu como la media de les diferencies ente la estimación por mínimos cuadraos y los valores daos de la muestra[2][3]

Error estándar de la media

[editar | editar la fonte]

L'error estándar de la media (llamáu n'inglés "standard error of the mean" (SEM)) cuantifica[4] les oscilaciones de la media muestral (media llograda nos datos) alredor de la media poblacional (verdaderu valor de la media). El EEM o SEM envalórase xeneralmente estremando la esviación estándar de la población ente'l raigañu cuadráu del tamañu de la muestra (asumiendo independencia estadística de los valores na muestra):

onde

s ye la desviación estándar (esto ye, la estimación basada na muestra de la esviación estándar de la población).
n ye'l tamañu (númberu d'individuos de la muestra)

Esta estimación puede ser comparada cola fórmula de la verdadera esviación estándar de la media de la muestra:

onde

σ ye la verdadera esviación estándar de la población.

Esta fórmula puede algamar dende lo que yá conocemos sobre la varianza de la suma de variables aleatories independientes.[5]

  • Si son observaciones independientes d'una población que tien una media y una esviación estándar , entós la varianza del total ye
  • La varianza de tien de ser
  • Y la esviación estándar de tien de ser .
  • De xacíu, ye la media de la muestra .

Nota: L'error estándar y l'esviación estándar de muestres pequeñes tienden a infravalorar sistemáticamente l'error estándar y l'esviación estándar de la población: l'error estándar de la media ye un parámetru sesgado del error estándar de la población. Con n=2 la infravaloración puede ser del 25%, pero pa n=6 la infravaloración ye namái del 5%.[6]

Supuestos y usu

[editar | editar la fonte]

Si asumir que los datos utilizaos tán distribuyíos pola normal, los cuantiles de la distribución normal, la media de la muestra y l'error estándar pueden ser usaos pa calcular intervalos d'enfotu averaos pa la media. Les siguientes espresiones pueden ser usaes pa calcular les llendes d'enfotu percima y per debaxo del 95%, onde ye igual a la media de la muestra, ye igual al error estándar pa la media de la muestra, y 1,96 ye'l cuantil 0.975 de la distribución normal:

Percima del 95% Llende =
Per debaxo del 95% Llende =

En particular, l'error estándar d'una muestra estadística (como lo ye de la media de la muestra) ye la esviación estándar envalorada del error nel procesu qu'ésta ye xenerada. N'otres pallabres, l'error estándar ye la esviación estándar de la distribución muestral de la muestra estadística. La notación pal error estándar (del inglés) pue ser , (por error estándar de "midida" (measurement) o "media" (mean)), o .

Los errores estándar apurren una midida sobra la incertidume de les midíes de la muestra nun únicu valor que ye usáu de cutiu porque:

  • Si l'error estándar de delles cantidaes individuales ye conocíu entós l'error estándar de dalguna función matemática d'eses cantidaes puede ser fácilmente calculáu en munchos casos:
    • Onde la distribución de probabilidá del valor ye conocida, ésta pue ser usada pa calcular un bonu aproximamientu d'un intervalu d'enfotu exactu.
    • Onde la distribución de probabilidá ye desconocida, rellaciones como la Desigualdá de Chebyshov o la desigualdá de Vysochanskiï–Petunin pueden ser usaes pa calcular unos intervalos d'enfotu conservativos.
  • Como'l tamañu de la muestra tiende a infinitu, el teorema de la llende central garantiza que la distribución de la media muestral ye asintóticamente la distribución normal.

Error estándar de la regresión

[editar | editar la fonte]

L'error estándar de la regresión ye'l valor qu'amuesa la diferencia ente los valores reales y los envaloraos d'una regresión. Ye utilizáu pa valorar si esiste una correlación ente la regresión y los valores midíos. Munchos autores prefieren esti datu a otros como'l coeficiente de correlación llinial, una y bones l'error estándar midir nes mesmes unidaes que los valores que s'estudien. La fórmula[7] sería:

Siendo:

  • los valores envaloraos
  • los valores midíos
  • el tamañu de la muestra

Referencies

[editar | editar la fonte]
  1. Everitt, B.S. (2003) The Cambridge Dictionary of Statistics, CUP. ISBN 0-521-81099-X
  2. Kenney, J. and Keeping, Y.S. (1963) Mathematics of Statistics, van Nostrand, p. 187
  3. Zwillinger D. (1995), Standard Mathematical Tables and Formulae, Chapman&Hall/CRC. ISBN 0-8493-2479-3 p. 626
  4. Abraira, V. «Desviación estándar y error estándar».
  5. T.P. Hutchinson, Essentials of statistical methods in 41 pages
  6. Gurland, J; Tripathi RC (1971). «A simple approximation for unbiased estimation of the standard deviation». American Statistician (American Statistical Association) 25 (4):  páxs. 30–32. doi:10.2307/2682923. 
  7. Departments of Botany and of Statistics University of Wisconsin—Madison. «Estimation and Prediction». Archiváu dende l'orixinal, el 2017-05-17.