68-95-99.7 regel

I statistikker, 68-95-99.7 reglen, også kendt som de tre-sigma regel eller empirisk regel fastslår, at næsten alle værdier ligger inden for tre standardafvigelser af middelværdien i en normalfordeling.

68,27% af værdierne ligger inden for én standardafvigelse af middelværdien. Tilsvarende 95,45% af værdierne ligger inden for to standardafvigelser fra middelværdien. Næsten alle værdierne ligger inden for tre standardafvigelser fra middelværdien.

I matematisk notation, kan disse kendsgerninger udtrykkes således, hvor x er en observation fra en normalfordelt stokastisk variabel, μ er middelværdien af ​​fordelingen, og σ er dens standardafvigelse:

Afvigelse

Disse numeriske værdier kommer fra den kumulative fordelingsfunktion for normalfordeling. For eksempel, Φ ≈ 0,9772 eller Pr ≈ 0,9772. Bemærk at dette ikke er en symmetrisk interval - det er blot sandsynligheden for, at en observation er mindre end μ + 2σ. At beregne sandsynligheden for, at en observation er inden for to standardafvigelser af middelværdien:

Dette er relateret til konfidensinterval, som anvendes i statistikken: er ca en 95% konfidensinterval, når er gennemsnittet af en prøve.

Anvendelser

Denne regel anvendes ofte til hurtigt at få et groft skøn over sandsynligheden noget, givet sin standardafvigelse hvis populationen antages normalt, således også som en simpel test for outliers, og som en normalitet test.

Husk på, at for at passere fra en prøve til en række standardafvigelser, man beregner afvigelsen, enten fejl eller resterende, og derefter enten anvendelser standardisering, hvis kendes befolkningen parametre, eller studentizing, hvis parametre er ukendte og kun estimeret.

At bruge som en test for outliers eller en normalitet test, man beregner størrelsen af ​​afvigelser i form af standardafvigelser, og sammenligner det til forventede hyppighed. Givet et prøvesæt, beregne studentized residualer og sammenligne disse til den forventede frekvens: punkter, der falder mere end 3 standardafvigelser fra normen er sandsynlige outliers, og hvis der er mange punkter mere end 3 standardafvigelser fra normen, en sandsynligvis har grund til at betvivle antaget normalitet af distributionen. Det holder endnu mere stærkt for flytninger af 4 eller flere standardafvigelser.

Man kan beregne mere præcist, tilnærme antallet af ekstreme bevægelser af en given størrelse eller større ved en Poisson-fordeling, men blot, hvis man har flere 4 standard afvigelse bevæger sig i en prøve af størrelse 1000, den ene har en stærk grund til at overveje disse outliers eller spørgsmålstegn ved antages normalitet af fordelingen.

Højere afvigelser

På grund af de eksponentielle haler af normalfordelingen, odds højere afvigelser falde meget hurtigt. Fra reglerne for normalfordelte data for en daglig begivenhed:

Således for en daglig proces forventes en 6σ begivenhed til at ske mindre end en gang i en million år. Dette giver en simpel normalitet test: hvis en vidner en 6σ i den daglige data og væsentligt færre end 1 million år er gået, så en normalfordeling sandsynligvis ikke giver en god model for størrelsen eller hyppigheden af ​​store afvigelser i denne henseende. I The Black Swan, Nassim Nicholas Taleb giver som eksempel risikomodeller, som sorte mandag styrtet var en 36-Sigma begivenhed: forekomsten af ​​en sådan hændelse bør øjeblikkeligt foreslå en overvejelse af en katastrofal fejl i en model. Imidlertid blev sådanne modeller skabt før der var en korrekt forståelse af stokastisk volatilitet og recitationen af ​​sådanne beregninger, som ingen moderne praktiserende ville tage alvorligt på alle, er noget beslægtet med en stråmand argument. I en sådan diskussion er det vigtigt at være opmærksom på, at der faktisk er noget i gang med at tegne med udskiftningen, der angiver den rækkefølge, som de usandsynlige hændelser skulle forekomme, blot deres relative frekvens, og man skal passe på, når ræsonnement fra sekventiel trækker. Det er en naturlig følge af gambler fejlslutning at foreslå, at bare fordi en sjælden begivenhed er blevet observeret, at sjælden begivenhed ikke var sjældne. Det er observationen af ​​et væld af angiveligt sjældne begivenheder, der underminerer den hypotese, at de faktisk sjældent.

  0   0
Forrige artikel En Youqi
Næste artikel Klan Johnstone

Relaterede Artikler

Kommentarer - 0

Ingen kommentar

Tilføj en kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Tegn tilbage: 3000
captcha