Distribución normal

De Wikipedia
Saltar a: navegación, buscar

Plantía:Ficha de distribución de probabilidá

En estadística y probabilidad llámase distribución normal, distribución de Gauss o distribución gaussiana o distribución de Laplace-Gauss, a una de les distribuciones de probabilidá de variable continua que con más frecuencia apaez estadística y teoría de probabilidá.[1]

La gráfica de la so función de densidá tien una forma acampanada y ye simétrica respectu d'un determináu parámetru estadísticu. Esta curva conozse como campana de Gauss y ye el gráficu d'una función gaussiana.[2]

La importancia d'esta distribución anicia en que dexa modelar numberosos fenómenos naturales, sociales y psicolóxicos. [3]Ente que los mecanismos que subyacen a gran parte d'esti tipu de fenómenos son desconocíos, pola enorme cantidá de variables incontrolables que nellos intervienen, l'usu del modelu normal puede xustificase asumiendo que cada observación llógrase como la suma d'unes poques causes independientes.

Ello ye que la estadística descriptiva namái dexa describir un fenómenu, ensin esplicación dalguna. Pa la esplicación causal ye precisu'l diseñu esperimental, d'ende que al usu de la estadística en psicoloxía y socioloxía sía conocíu como métodu correlacional.

La distribución normal tamién ye importante pola so relación cola estimación por mínimos cuadraos, unu de los métodos d'estimación más simples y antiguos.

Dellos exemplos de variables acomuñaes a fenómenos naturales que siguen el modelu de la normal son:

La distribución normal tamién apaez en munches árees de la mesma estadística. Por casu, la distribución muestral de les medies muestrales ye aprosimao normal, cuando la distribución de la población de la cual estrayer l'amuesa nun ye normal.[4] Amás, la distribución normal maximiza la entropía ente toles distribuciones con media y varianza conocíes, lo cual convertir na eleición natural de la distribución subxacente a una llista de datos resumíos en términos de media muestral y varianza. La distribución normal ye la más estendida n'estadística y munchos tests estadísticos tán basaos nuna "normalidá" más o menos xustificada de la variable aleatoria so estudiu.

En probabilidá, la distribución normal apaez como la llende de delles distribuciones de probabilidá continues y discretes.

Hestoria[editar | editar la fonte]

Abraham de Moivre, primero n'afayar la distribución normal

La distribución normal foi presentada per primer vegada por Abraham de Moivre nun artículu del añu 1733,[5] que foi reimpreso na segunda edición de la so The Doctrine of Chances, de 1738, nel contestu de ciertu aproximamientu de la distribución binomial para grandes valores de n. La so resultancia foi ampliáu por Laplace nel so llibru Teoría analítica de les probabilidaes (1812), y na actualidá llámase Teorema de De Moivre-Laplace.

Laplace usó la distribución normal nel analís d'erros d'esperimentos. L'importante métodu de mínimos cuadraos foi introducíu por Legendre en 1805. Gauss, qu'afirmaba usar el métodu dende 1794, xustificar rigorosamente en 1809 asumiendo una distribución normal de los erros. El nome de Gauss acomuñóse a esta distribución porque la usó con mapa cuando analizaba datos astronómicos[6] y dellos autores atribúyen-y un descubrimientu independiente del de De Moivre.[7]Esta atribución del nome de la distribución a una persona distinta del so primer descubridor ye un claru exemplu de la llei de Stigler.

El nome de "campana" vien de Esprit Jouffret qu'usó'l términu "bell surface" (superficie campana) per primer vegada en 1872 pa una distribución normal bivariante de componentes independientes. El nome de "distribución normal" foi otorgáu independientemente por Charles S. Peirce, Francis Galton y Wilhelm Lexis escontra 1875.[ensin referencies] A pesar d'esta terminoloxía, otres distribuciones de probabilidá podríen ser más apropiaes en determinaos contestos; vease'l discutiniu sobre incidencia, más embaxo.

Definición formal[editar | editar la fonte]

La función de distribución de la distribución normal ta definida como sigue:

Poro, la función de distribución de la normal estándar ye:

Esta función de distribución puede espresase en términos d'una función especial llamada función error de la siguiente forma:

.


y la mesma función de distribución puede, poro, espresase asina:

El complementu de la función de distribución de la normal estándar, , se denota con frecuencia , y ye referida, dacuando, como a cencielles función Q, especialmente en testos d'inxeniería.[8][9] Esto representa la cola de probabilidá de la distribución gaussiana. Tamién s'usen dacuando otres definiciones de la función Q, que son toes elles tresformamientos simples de .[10]

La inversa de la función de distribución de la normal estándar (función cuantil) puede espresase en términos de la inversa de la función d'erru:

.


y l'inversa de la función de distribución puede, poro, espresase como:

Esta función cuantil llámase dacuando la función probit. Nun hai una primitiva elemental pa la función probit. Esto nun quier dicir puramente que nun se conoz, sinón que se probó la inesistencia de tal función. Esisten dellos métodos esactos p'averar la función cuantil por aciu la distribución normal (vease función cuantil).

Los valores Φ(x) pueden averase con muncha precisión por distintos métodos, tales como integración numbérica, series de Taylor, series asintóticas y fracciones continues.

Llende inferior y superior estrictos pa la función de distribución[editar | editar la fonte]

Pa grandes valores de x la función de distribución de la normal estándar ye bien próxima a 1 y ta mui cerca de 0. Les llendes elementales

.


en términos de la densidá son útiles.

Usando'l camudo de variable v = o²/2, la llende cimera llógrase como sigue:

De forma similar, usando y la riegla del cociente,

Resolviendo pa apurre la llende inferior.

Funciones generatrices[editar | editar la fonte]

Función generatriz de momentos[editar | editar la fonte]

La función generatriz de momentos defínese como la esperanza de y(tX). Pa una distribución normal, la función generatriz de momentos ye:

como puede comprobase al completar el cuadráu nel esponente.


Función característica[editar | editar la fonte]

La función característica defínese como la esperanza de yitX, onde i ye la unidá imaxinaria. D'esta miente, la función característica llógrase reemplazando t por it na función generatriz de momentos. Pa una distribución normal, la función característica ye[11]

Propiedaes[editar | editar la fonte]

Delles propiedaes de la distribución normal son les siguientes:

  1. Ye simétrica respectu de la so media, ;
    Distribución de probabilidá alredor de la media nuna distribución N(μ, σ2).
  2. La moda y la mediana son dambes iguales a la media, ;
  3. Los punto d'inflexón de la curva dar pa y .
  4. Distribución de probabilidá nuna redolada de la media:
    1. nel intervalu atópase entendida, aprosimao, el 68,26% de la distribución;
    2. nel intervalu atópase, aprosimao, el 95,44% de la distribución;
    3. pela so parte, nel intervalu atópase entendida, aprosimao, el 99,74% de la distribución. Estes propiedaes son de gran utilidá pal establecimientu de intervalo d'enfotu. Per otra parte, el fechu de que prácticamente la totalidá de la distribución atopar a tres desviación típiques de la media xustifica les llendes de les tables emplegaes davezu na normal estándar.
  5. Si y , entós .
  6. Si y son variables aleatories normales independientes, entós:
    • La so suma ta de normal distribuyida con (demostración). Recíprocamente, si dos variables aleatories independientes tienen una suma de normal distribuyida, tienen de ser normales (Teorema de Crámer).
    • La so diferencia ta de normal distribuyida con .
    • Si les varianzas de X y Y son iguales, entós O y V son independientes ente sigo.
    • La diverxencia de Kullback-Leibler,
  7. Si y son variables aleatories independientes de normal distribuyíes, entós:
    • El so productu sigue una distribución con densidá dada por
      onde ye una función de Bessel modificada de segundu tipu.
    • El so cociente sigue una distribución de Cauchy con . D'esta miente la distribución de Cauchy ye un tipu especial de distribución cociente.
  8. Si son variables normales estándar independientes, entós sigue una distribución χ² con n graos de llibertá.
  9. Si son variables normales estándar independientes, entós la media muestral Fallu al revisar la fórmula (función '\chigre' desconocida): {\displaystyle \chigre{X}=(X_1+\cdots+X_n)/n} y la varianza muestral Fallu al revisar la fórmula (función '\chigre' desconocida): {\displaystyle S^2=((X_1-\chigre{X})^2+\cdots+(X_n-\chigre{X})^2)/(n-1)} son independientes. Esta propiedá caracteriza a les distribuciones normales y contribúi a esplicar por qué'l test-F nun ye robustu al respective de la non-normalidá).

Estandarización de variables aleatories normales[editar | editar la fonte]

De resultes de la Propiedá 1; ye posible rellacionar toles variables aleatories normales cola distribución normal estándar.

Si , entós

ye una variable aleatoria normal estándar: ~ .

El tresformamientu d'una distribución X ~ N(μ, σ) nuna N(0, 1) llámase normalización, estandarización o tipificación de la variable X.

Una consecuencia importante d'esto ye que la función de distribución d'una distribución normal ye, poro,

Fallu al revisar la fórmula (error de sintaxis): {\displaystyle \Pr(X \-y x) = \Phi \left( \frac{x-\mu}{\sigma} \right) = \frac{1}{2} \left( 1 + \operatorname{erf} \left( \frac{x-\mu}{\sigma\sqrt{2}} \right) \right) . }

A la inversa, si ye una distribución normal estándar, ~ , entós

ye una variable aleatoria normal tipificada de media y varianza .

La distribución normal estándar ta tabulada (davezu na forma del valor de la función de distribución Φ) y les otres distribuciones normales pueden llograse como tresformamientos simples, como se describe más arriba, de la distribución estándar. D'esta miente pueden usase los valores tabulados de la función de distribución normal estándar p'atopar valores de la función de distribución de cualesquier otra distribución normal.

Momentos[editar | editar la fonte]

Los primeres momentos de la distribución normal son:

Númberu Momentu Momentu central Cumulante
0 1 1
1 0
2
3 0 0
4 0
5 0 0
6 0
7 0 0
8 0

Tolos cumulantes de la distribución normal, más allá del segundu, son cero.


Los momentos centrales d'orde cimeru (2k con μ = 0) vienen daos pola fórmula

El Teorema de la Llende Central[editar | editar la fonte]

Artículu principal: Teorema de la llende central
Gráfica de la función de distribución d'una normal con μ = 12 y σ = 3, averando la función de distribución d'una binomial con n = 48 y p = 1/4.

El Teorema de la llende central establez que so ciertes condiciones (como pueden ser independientes y hermano distribuyíes con varianza finita), la suma d'un gran númberu de variables aleatories distribúyese aprosimao como una normal.

La importancia práctica del Teorema de la llende central ye que la función de distribución de la normal puede usase como aproximamientu de delles otres funciones de distribución. Por casu:

  • Una distribución binomial de parámetros n y p ye aprosimao normal pa grandes valores de n, y p non demasiáu cercanu a 0 o a 1 (dellos llibros encamienten usar esti aproximamientu namái si np y n(1 − p) son dambos, siquier, 5; nesti casu tendría d'aplicase una corrección de continuidá).
    La normal averada tien parámetros μ = np, σ2 = np(1 − p).
  • Una distribución de Poisson con parámetru λ ye aprosimao normal pa grandes valores de λ.
    La distribución normal averada tien parámetros μ = σ2 = λ.

La exactitú d'estos aproximamientos depende del propósitu pal que se precisen y de la tasa de converxencia a la distribución normal. Dase'l casu típicu de que tales aproximamientos son menos precises nes coles de la distribución. El Teorema de Berry-Esséen apurre una llende cimera xeneral del erru d'aproximamientu de la función de distribución.

Divisibilidad infinita[editar | editar la fonte]

Les normales tienen una distribución de probabilidá infinitamente divisible: Pa una distribución normal X de media μ y varianza σ2 ≥ 0, ye posible atopar n variables aleatories independientes {X1,...,Xn} caúna con distribución normal de media μ/n y varianza σ2/n cuidao que la suma X1 + . . . + Xn d'estes n variables aleatories

tenga esta específica distribución normal (pa verificalo, úsese la función característica de convolución y la inducción matemática).

Estabilidá[editar | editar la fonte]

Les distribuciones normales son puramente estables.

Esviación típica ya intervalos d'enfotu[editar | editar la fonte]

Alredor del 68% de los valores d'una distribución normal tán a una distancia σ < 1 (esviación típica) de la media, μ; alredor del 95% de los valores tán a dos desviación típiques de la media y alredor del 99,7% tán a tres desviación típiques de la media. Esto conozse como la "regla 68-95-99,7" o la "riegla empírica".

Pa ser más precisos, la área so la curva campana ente μ − nσ y μ + nσ en términos de la función de distribución normal vien dada por

onde erf ye la función erru. Los valores pa n=1, n=2, ... , n= 6, son... (con 12 decimales)...:

  
1  0,682689492137 
2 0,954499736104
3 0,997300203937
4 0,999936657516
5 0,999999426697
6 0,999999998027

La siguiente tabla apurre la relación inversa de múltiples σ correspondientes a unos pocos valores usaos con frecuencia pa la área so la campana de Gauss. Estos valores son útiles pa determinar intervalo d'enfotu pa los niveles especificaos basaos nuna curva de normal distribuyida (o estimadores asintóticamente normales):

    
0,80  1,28155 
0,90 1,64485
0,95 1,95996
0,98 2,32635
0,99 2,57583
0,995 2,80703
0,998 3,09023
0,999 3,29052
0,9999 3,8906
0,99999 4,4172

onde'l valor a la izquierda de la tabla ye la proporción de valores que van cayer nel intervalu dáu y n ye un múltiplu de la esviación típica que determina l'anchor del intervalu.

Forma familia esponencial[editar | editar la fonte]

La distribución normal tien forma de familia esponencial biparamétrica con dos parámetros naturales, μ y 1/σ2, y estadísticos naturales X y X2. La forma canónica tien como parámetros y y estadísticos suficientes y

Distribución normal complexa[editar | editar la fonte]

Considérese la variable aleatoria complexa gaussiana

.


onde X y Y son variables gaussianas reales ya independientes con igual varianza . La función de distribución de la variable conxunta ye entós

Como , la función de distribución resultante pa la variable gaussiana complexa Z ye

Distribuciones rellacionaes[editar | editar la fonte]

  • ye una distribución de Rayleigh si onde y son dos distribuciones normales independientes.
  • ye una distribución χ² con grado de llibertá si onde pa y son independientes.
  • ye una distribución de Cauchy si pa y son dos distribuciones normales independientes.
  • ye una distribución log-normal si y .
  • Relación con una distribución estable: si entós .
  • Distribución normal truncada. si entós atayando X per debaxo de y percima de va dar llugar a una variable aleatoria de media onde y ye la función de densidá d'una variable normal estándar.
  • Si ye una variable aleatoria de normal distribuyida y , entós tien una distribución normal doblada.

Estadística descriptiva y inferencial[editar | editar la fonte]

Resultaos[editar | editar la fonte]

De la distribución normal derívense munches resultancies, incluyendo rangos de percentiles ("percentiles" o "cuantiles"), curves normales equivalentes, stanines, z-scores, y T-scores. Amás, un númberu de procedimientos d'estadísticos de comportamientu tán basaos na asunción de qu'eses resultancies tán de normal distribuyíos. Por casu, el test de Student y el analís de varianza (ANOVA) (vease más embaxo). La gradación de la curva campana asigna graos relativos basaos nuna distribución normal de resultancies.

Tests de normalidá[editar | editar la fonte]

Artículu principal: Test de normalidá

Los tests de normalidá aplicar a conxuntos de datos pa determinar la so semeyanza con una distribución normal. La hipótesis nula ye, nestos casos, si'l conxuntu de datos ye similar a una distribución normal, polo qu'un P-valor abondo pequeñu indica datos non normales.

Estimación de parámetro[editar | editar la fonte]

Estimación de parámetros de máxima verosimilitud[editar | editar la fonte]

Supóngase que

son independientes y caúna ta de normal distribuyida con media μ y varianza σ 2 > 0. En términos estadísticos los valores reparaos d'estes n variables aleatories constitúin una "amuesa de tamañu n d'una población de normal distribuyida. Deseyar envalorar la media poblacional μ y la esviación típica poblacional σ, basándose nos valores reparaos d'esta amuesa. La función de densidá conxunta d'estes n variables aleatories independientes ye

Como función de μ y σ, la función de verosimilitud basada nes observaciones X1, ..., Xn ye

Fallu al revisar la fórmula (error de sintaxis): {\displaystyle L(\mu,\sigma) = \frac C{\sigma^n} \exp\left(-{\sum_{i=1}^n (X_i-\mu)^2 \over 2\sigma^2}\right), \quad\mu\in\mathbb{R},\ \sigma>0, } .


con dalguna constante C > 0 (de la cual, polo xeneral, dexaríase inclusive que dependiera de X1, ..., Xn, anque sumiera coles derivaes parciales de la función de log-verosimilitud al respective de los parámetros teníos en cuenta, vease más embaxo).

Nel métodu de máxima verosimilitud, los valores de μ y σ que maximizan la función de verosimilitud tómense como estimadores de los parámetros poblacionales μ y σ.

Davezu na maximización d'una función de dos variables, podríen considerase derivaes parciales. Pero equí esplótase'l fechu de que'l valor de μ que maximiza la función de verosimilitud con σ fixu nun depende de σ. Sicasí, atopamos qu'esi valor de μ, entós sustitúyese por μ na función de verosimilitud y finalmente atopamos el valor de σ que maximiza la espresión resultante.

Rescampla que la función de verosimilitud ye una función decreciente de la suma

Asina que se deseya'l valor de μ que embrive esta suma. Sía

la media muestral basada nes n observaciones. Nótese que

Namái l'últimu términu depende de μ y embrívese por

Esta ye la estimación de máxima verosimilitud de μ basada nes n observaciones X1, ..., Xn. Cuando sustituyimos esta estimación por μ na función de verosimilitud, llogramos

.


Convenir en denotar la "log-función de verosimilitud", esto ye, el llogaritmu de la función de verosimilitud, con una minúscula , y tenemos

.


entós

Esta derivada ye positiva, cero o negativa según σ2 tea ente 0 y

esto ye igual a esa cantidá, o mayor qu'esa cantidá. (Si hai solamente una observación, lo que significa que n = 1, o si X1 = ... = Xn, lo cual namái asocede con probabilidad cero, entós por esta fórmula, reflexa'l fechu de que nestos casos la función de verosimilitud ye ilimitada cuando σ escai hasta cero.)

Consecuentemente esta media de cuadraos de borrafes ye'l estimador de máxima verosimilitud de σ2, y el so raigañu cuadráu ye'l estimador de máxima verosimilitud de σ basáu nes n observaciones. Esti estimador ye sesgado, pero tien un menor erru mediu al cuadráu que l'habitual estimador insesgado, que ye n/(n − 1) vegaes esti estimador.

Sorprendente xeneralización[editar | editar la fonte]

La derivada del estimador de máxima verosimilitud de la matriz de covarianza d'una distribución normal multivariante ye despreciable. Arreya'l teorema espectral y la razón pola que puede ser meyor pa ver un esguilar como la traza d'una matriz 1×1 que como un pixín esguilar. Vease estimación de la covarianza de matrices.

Estimación insesgada de parámetros[editar | editar la fonte]

El estimador de máxima verosimilitud de la media poblacional μ, ye un estimador insesgado de la media poblacional.

El estimador de máxima verosimilitud de la varianza ye insesgado si asumimos que la media de la población ye conocida a priori, pero na práctica esto nun asocede. Cuando disponemos d'una amuesa y nun sabemos nada de la media o la varianza de la población de la que s'estrayxo, como s'asumía na derivada de máxima verosimilitud de riba, entós el estimador de máxima verosimilitud de la varianza ye sesgado. Un estimador insesgado de la varianza σ2 ye la cuasi varianza muestral:

que sigue una distribución Gamma cuando les Xi son normales independientes y hermano distribuyíes:

.


con media y varianza

La estimación de máxima verosimilitud de la esviación típica ye'l raigañu cuadráu de la estimación de máxima verosimilitud de la varianza. Sicasí, nin ésta, nin el raigañu cuadráu de la cuasivarianza muestral apurren un estimador insesgado pa la esviación típica (vease estimación insesgada de la esviación típica pa una fórmula particular pa la distribución normal.

Incidencia[editar | editar la fonte]

Les distribuciones aprosimao normales apaecen peruquier, como queda esplicáu pol teorema central de la llende. Cuando nun fenómenu abarrúntase la presencia d'un gran númberu de pequenes causes actuando de forma aditiva ya independiente ye razonable pensar que les observaciones van ser "normales". Hai métodos estadísticos pa probar empíricamente esta asunción, por casu, el test de D'Agostino-Pearson. El test de Kolmogorov-Smirnov, antes llargamente usáu, agora paez tar desaconseyáu.

Hai causes que pueden actuar de forma multiplicativa (más que aditiva). Nesti casu, l'asunción de normalidá nun ta xustificada y ye el llogaritmu de la variable en cuestión el que taría de normal distribuyíu. La distribución de les variables directamente reparaes nesti casu denominar log-normal.

Finalmente, si hai una simple influencia esterna que tien un gran efectu na variable en considerancia, l'asunción de normalidá nun ta tampoco xustificada. Esto ye ciertu inclusive si, cuando la variable esterna caltiense constante, les distribuciones marxinales resultantes son, n'efectu, normales. La distribución completa va ser una superposición de variables normales, que nun ye polo xeneral normal. Ello ta rellacionáu cola teoría d'erros (vease más embaxo).

De siguío amuésense una llista de situaciones que taríen, aprosimao, de normal distribuyíes. Más embaxo puede atopase un discutiniu detalláu de caúna d'elles:

  • En problemes de recuentu, onde'l teorema central de la llende inclúi un aproximamientu de discreta a continua y onde les distribuciones infinitamente divisibles y descomponibles tán arreyaes, tales como:
  • En midíes fisiolóxiques de especímenes biolóxicos:
    • El llogaritmu de les midíes del tamañu de texíos vivos (llargor, altor, superficie de piel, pesu);
    • La llargor d'apéndices inertes (pelo, garres, rabos, dientes) de especímenes biolóxicos na dirección del crecimento;
    • Otres midíes fisiolóxiques podríen tar de normal distribuyíes, anque nun hai razón pa esperalo a priori;
  • Asumir con frecuencia que los erros de midida tán de normal distribuyíos y cualquier esviación de la normalidá considérase una cuestión que tendría d'esplicase;
  • Variables financieres, nel modelu Black-Scholes:
    • Cambeos nel llogaritmu de Cambeos

nel llogaritmu de tases de cambéu, índices de precios, índices d'esistencies de mercáu; estes variables pórtense como l'interés compuestu, non como l'interés simple, por tanto, son multiplicatives;

    • Ente que el modelu Black-Scholes presupon normalidá, en realidá estes variables esiben coles pesaes, como puede trate en crash de les esistencies de mercáu;
    • Otres variables financieres podríen tar de normal distribuyíes, pero nun hai razón pa esperalo a priori;
  • Intensidá de la lluz:
    • La intensidá de la lluz láser ta de normal distribuyida;
    • La lluz térmico tien una distribución de Bose-Einstein n'escales de tiempu bien curtios y una distribución normal en grandes escales de tiempu debíu al teorema central de la llende.

Ye relevante pa la bioloxía y l'economía el fechu de que los sistemes complexos tienden a amosar la llei de potencies más que normal.

Recuentu de fotones[editar | editar la fonte]

La intensidá de la lluz d'una sola fonte varia col tiempu, según les fluctuaciones térmiques que pueden reparase si la lluz analizar a un resolvimientu abondo altu. La mecánica cuántica interpreta les midíes de la intensidá de la lluz como un recuentu de fotones, onde'l camientu natural lleva a usar la distribución de Poisson. Cuando la intensidá de la lluz integrar a lo llargo de grandes periodos de tiempu mayores que'l tiempu de coherencia, l'aproximamientu Poisson - Normal ye apoderada.

Midida d'erros[editar | editar la fonte]

La normalidá ye la asunción central de la teoría matemática d'erros. De forma similar nel axuste de modelos estadísticu, un indicador de la bondá del axuste ye qu'el erru residual (asina ye como se llamen los erros nesta circunstancia) sía independiente y de normal distribuyíu. L'asunción ye que cualquier esviación de la normalidá precisa ser esplicada. Nesi sentíu, en dambos, axuste de modelos y teoría d'erros, la normalidá ye la única observación que nun precisa ser esplicada, sinón que ye esperada. Sicasí, si los datos orixinales nun tán de normal distribuyíos (por casu, si siguen una distribución de Cauchy, entós les borrafes tampoco van tar de normal distribuyíos. Esti fechu ye ignoráu davezu na práctica.

Les midíes repitíes de la mesma cantidá espérase que dexen el pasu a resultancies que tán arrexuntaos en redol a un valor particular. Si toos les fontes principales d'erros tomáronse en cuenta, se asume que l'erru que queda ten de ser la resultancia d'un gran númberu de bien pequenos y aditivos efectos y, poro, normal. Les esviaciones de la normalidá interprétense como indicaciones d'erros sistemáticos que nun fueron tomaos en cuenta. Puede aldericase si esta asunción ye válida.

Una famosa observación atribuyida a Gabriel Lippmann diz:[ensin referencies]

Tol mundu cree na llei normal de los erros: los matemáticos, porque piensen que ye un fechu esperimental; y el esperimentadores, porque suponen que ye un teorema matemáticu

Otra fonte podría ser Henri Poincaré.

Característiques físiques de especímenes biolóxicos[editar | editar la fonte]

Los tamaños de los animales adultos siguen aprosimao una distribución log-normal. La evidencia y esplicación basada en modelos de crecedera foi publicada per primer vegada nel llibru Problemes de crecedera relativa, de 1932, por Julian Huxley.

Les diferencies de tamañu por cuenta de dimorfismos sexuales o otros polimorfismos d'insectos, como la división social de les abeyes n'obreres, zánganos y reines, por casu, fai que la distribución de tamaños esviar escontra la lognormalidad.

L'asunción de que'l tamañu llineal de los especímenes biolóxicos ye normal (más que lognormal) llévanos a una distribución non normal del pesu (cuidao que el pesu o'l volume ye proporcional al cuadráu o'l cubu del llargor y les distribuciones gaussianas namái caltienen los tresformamientos llineales). A la inversa, asumir que'l pesu sigue una distribución normal implica llargores non normales. Esto ye un problema porque, a priori, nun hai razón pola que cualesquier d'elles (llargor, masa corporal o otres) tendría de tar de normal distribuyida. Les distribuciones lognormales, per otru llau, caltener ente potencies, asina que el "problema" esmorezse si asume la lognormalidad.

Per otra parte, hai delles midíes biolóxiques onde s'asume normalidá, tales como la presión sanguínea n'humanos adultos. Esta asunción namái ye posible en dixebrando a homes y muyeres en distintes poblaciones, caúna de les cualos ta de normal distribuyida.

Variables financieres[editar | editar la fonte]

El modelu normal de movimientu d'activos nun inclúi movimientos estremos tales como quiebres financieres.

Yá en 1900 Louis Bachelier propunxo representar los precios de cambéu usando la distribución normal. Esti aproximamientu modificóse dende entós llixeramente. Por causa de la naturaleza multiplicativa del interés compuestu, el indicadores financieros como valores de mercáu y precios de les materies primes esiben un "comportamientu multiplicativu". Como tales, los sos cambeos periódicos (por casu, cambeos añales) nun son normales, sinón lognormales. Esta ye inda la hipótesis más comúnmente aceptada en economía.

Sicasí, en realidá les variables financieres esiben coles pesaes y asina, l'asunción de normalidá infravalora la probabilidá d'eventos estremos como quiebres financieres. Suxuriéronse correcciones a esti modelu per parte de matemáticos como Benoît Mandelbrot, quien reparó que los cambeos nel llogaritmu mientres curtios periodos de tiempu (como un día) avérense bien por distribuciones que nun tienen una varianza finita y, poro, el teorema central de la llende nun puede aplicase. Entá más, la suma de munchos de tales cambeos sigue una distribución de log-Levy.

Distribuciones en tests d'intelixencia[editar | editar la fonte]

Dacuando, la dificultá y númberu d'entrugues nun test d'intelixencia escuéyese de cuenta qu'apurran resultaos de normal distribuyíos. Entá más, les puntuaciones "en crudu" convertir a valores que marquen el cociente intelectual afaciéndoles a la distribución normal. Sía que non trátase d'una resultancia causada deliberadamente pola construcción del test o d'una interpretación de les puntuaciones que suxure normalidá pa la mayoría de la población. Sicasí, la cuestión alrodiu de si la intelixencia en sí ta de normal distribuyida ye más complicada porque se trata d'una variable latente y, poro, nun puede reparase directamente.

Ecuación d'espardimientu[editar | editar la fonte]

La función de densidá de la distribución normal ta estrechamente rellacionada cola ecuación d'espardimientu (homoxénea y isótropa) y, por tanto, tamién cola ecuación de calor. Esta ecuación diferencial parcial describe'l tiempu d'evolución d'una función de densidá baxu espardimientu. En particular, la función de densidá de masa

pa la distribución normal con esperanza 0 y varianza t satisfai la ecuación d'espardimientu:

Si la densidá de masa pa un tiempu t = 0 vien dada pola delta de Dirac, lo cual significa, esencialemente que tola masa ta primeramente concentrada nun puntu, entós la función de densidá de masa nel tiempu t va tener la forma de la función de densidá de la normal, con varianza creciendo linealmente con t. Esta conexón nun ye coincidencia: l'espardimientu deber a un movimientu browniano que queda descritu matemáticamente por un procesu de Wiener, y tal procesu nun tiempu t tamién va resultar normal con varianza creciendo linealmente con t'.

Más xeneralmente, si la densidá de masa inicial vien dada por una función φ(x), entós la densidá de masa nun tiempu t va venir dada pola convolución de φ y una función de densidá normal.

Aplicación de la distribución normal de probabilidá acumulada a agües mensuales en Surinam.[12]


Hidroloxía[editar | editar la fonte]

Na hidroloxía presumir que precipitaciones y descagas de ríos de llarga duración (por casu mensuales o añales) siguen una distribución normal d'alcuerdu al teorema de la llende central. [13]


La imaxe azul ilustra un exemplu del axuste de la distribución normal a datos d'agua mensual d'Ochobre y amuesa los intervalo d'enfotu basaos na distribución binomial.

Usu n'estadística computacional[editar | editar la fonte]

Xeneración de valores pa una variable aleatoria normal[editar | editar la fonte]

Pa simulaciones por ordenador ye útil, n'ocasiones, xenerar valores que podríen siguir una distribución anormal. Hai dellos métodos y el más básicu d'ellos ye invertir la función de distribución de la normal estándar p'asina poder realizar la grafica. Conócense otros métodos más eficientes, unu de los cualos ye la tresformamientu de Box-Muller. Un algoritmu inclusive más rápidu ye'l algoritmu zigurat. Dambos alderíquense más embaxo. Un aproximamientu simple a estos métodos ye programalos como sigue: a cencielles súmense 12 esviaciones uniformes (0,1) y réstense 6 (la metá de 12). Esto ye bastante preséu en munches aplicaciones. La suma d'esos 12 valores sigue la distribución de Irwin-Hall; son escoyíos 12 pa dar a la suma una varianza d'unu, esactamente. Les esviaciones aleatories resultantes tán llindaes al rangu (−6, 6) y tienen una densidá que ye una doceava sección d'un aproximamientu polinomial d'undécimu orde a la distribución normal .[14]

El métodu de Box-Muller diz que, si tienes dos númberos aleatorios O y V uniformemente distribuyíos en [0, 1], (por casu, la salida d'un xenerador de númberos aleatorios), entós X y Y son dos variables aleatories estándar de normal distribuyíes, onde:

Fallu al revisar la fórmula (función '\ensin' desconocida): {\displaystyle Y = \sqrt{- 2 \ln O} \, \ensin(2 \pi V) .}

Esta formulación apaez porque la distribución χ² con dos graos de llibertá (vease la propiedá 4, más arriba) ye una variable aleatoria esponencial fácilmente xenerada (la cual correspuende a la cantidá lnO nestes ecuaciones). Asina, un ángulu escoyíu uniformemente alredor d'un círculu vía la variable aleatoria V y un radiu escoyíu pa ser esponencial tresfórmense entós en coordenaes x y y de normal distribuyíes.

Un métodu muncho más rápido que'l tresformamientu de Box-Muller, pero que sigue siendo esactu ye'l llamáu algoritmu Zigurat, desenvueltu por George Marsaglia. N'alredor del 97% de los casos usa namái dos númberos aleatorios, un enteru aleatoriu y un uniforme aleatoriu, una multiplicación y un test-si . Namái un 3% de los casos onde la combinación d'estos dos cai fora del "corazón del zigurat", un tipu de refuga muestral usando llogaritmos, esponenciales y númberos aleatorios más uniformes tendríen de ser emplegaos.

Hai tamién dalguna investigación sobre la conexón ente la rápida tresformamientu de Hadamard y la distribución normal, en virtú de que'l tresformamientu emplega namái adición y sustracción y pol teorema central de la llende los númberos aleatorios de casi cualquier distribución van ser tresformaos na distribución normal. Nesta visión pueden combinase una serie de tresformamientos de Hadamard con permutaciones aleatories pa devolver conxuntos de datos aleatorios de normal distribuyíos.

Aproximamientos numbéricos de la distribución normal y la so función de distribución[editar | editar la fonte]

La función de distribución normal úsase estensamente en computación científica y estadística. Poro, foi implementada de delles formes.

Abramowitz y Stegun (1964) dan la conocida como "meyor aproximamientu de Hastings" para Φ(x) con x > 0 con un erru absolutu |ε(x)| < 7.5·10−8 (algoritmu 26.2.17):

onde ϕ(x) ye la función de densidá de la distribución normal estándar, : y les constantes son b0 = 0.2316419, b1 = 0.319381530, b2 = −0.356563782, b3 = 1.781477937, b4 = −1.821255978, b5 = 1.330274429.

La Biblioteca Científica GNU calcula valores de la función de distribución normal estándar usando aproximamientos por funciones racionales a cachos. Otru métodu d'aproximamientu usa polinomios de tercer grau n'intervalos.[15] L'artículu sobre'l llinguaxe de programación bc apurre un exemplu de cómo computar la función de distribución en GNU bc.

Pa un discutiniu más detalláu sobre cómo calcular la distribución normal, vease la sección 3.4.1C. de The Art of Computer Programming (L'arte de la programación por ordenador), de Knuth.

Ver tamién[editar | editar la fonte]

Referencies[editar | editar la fonte]

  1. Estadística Básica (en ye). ITM. ISBN 9789589831410.
  2. Orrego. LOGISTICA DE SUMINISTRU (en ye). Ediciones Paraninfu, S.A.. ISBN 9788497329811.
  3. Educación matemática y ciudadanía (en ye). Grao. ISBN 9788499801667.
  4. Ye una consecuencia del Teorema Central de la Llende
  5. Abraham de Moivre, "Approximatio ad Summam Terminorum Binomii (a + b)n in Seriem expansi" (impresu'l 12 de payares de 1733 en Londres pa una edición privada). Esti panfletu se reimprimió en: (1) Richard C. Archibald (1926) “A rare pamphlet of Moivre and some of his discoveries,” Isis, vol. 8, páxines 671-683; (2) Helen M. Walker, “De Moivre on the law of normal probability” en David Eugene Smith, A Source Book in Mathematics [Nueva York, Nueva York: McGraw-Hill, 1929; reimpresión: Nueva York, Nueva York: Dover, 1959], vol. 2, páxines 566-575.; (3) Abraham De Moivre, The Doctrine of Chances (2ª ed.) [Londres: H. Woodfall, 1738; reimpresión: Londres: Cass, 1967], páxines 235-243; (3ª ed.) [Londres: A Millar, 1756; reimpresión: Nueva York, Nueva York: Chelsea, 1967], páxines 243-254; (4) Florence N. David, Games, Gods and Gambling: A History of Probability and Statistical Escurres [Londres: Griffin, 1962], Apéndiz 5, páxines 254-267.
  6. Havil, 2003
  7. Wussing, Hans (marzu de 1998). Lección d'Hestoria de les Matemátiques, 1ª (castellán), Sieglu XXI d'España Editores, S.A., 190. ISBN 84-323-0966-4. «"La distribución normal y les sos aplicaciones a la teoría d'erros acomúñase de cutiu col nome de Gauss, quien la afayó -igual que Laplace- independientemente; sicasí yá fuera estudiada por de Moivre»
  8. La función Q
  9. https://web.archive.org/web/20090325160012/http://www.eng.tau.ac.il/~jo/academic/Q.pdf
  10. Weisstein, Eric W. «Normal Distribution Function» (inglés). MathWorld. Wolfram Research.
  11. M.A. Sanders. «Characteristic function of the univariate normal distribution». Consultáu'l 6 de marzu de 2009.
  12. CumFreq software p'adecuación de distribuciones de probabilidá [1]
  13. Ritzema (ed.), H.P. (1994). Frequency and Regression Analysis. Chapter 6 in: Drainage Principles and Applications, Publication 16, International Institute for Land Reclamation and Improvement (ILRI), Wageningen, The Netherlands, 175–224.
  14. Johnson NL, Kotz S, Balakrishnan N. (1995) Continuous Univariate Distributions Volume 2, Wiley. Equation(26.48)
  15. Andy Salter. «B-Spline curves». Consultáu'l 5 d'avientu de 2008.

Enllaces esternos[editar | editar la fonte]

Axuste por software d'una distribución de probabilidá a un conxuntu de datos[editar | editar la fonte]



Distribución normal