Exact test

I statistikken, en nøjagtig test er en test, hvor alle forudsætninger, hvorpå udledningen af ​​fordelingen af ​​teststørrelsen er baseret på, er opfyldt i modsætning til en omtrentlig test. Dette vil resultere i en signifikanstest, der vil have en falsk afvisninger altid lig med signifikansniveauet af testen. For eksempel en nøjagtig test på signifikansniveau 5% vil i det lange løb afviser sande nulhypoteser nøjagtigt 5% af tiden.

Parametriske tests, såsom dem, der er beskrevet i eksakte statistikker, er eksakte test, når de parametriske antagelser er fuldt opfyldt, men i praksis brugen af ​​udtrykket eksakte test er reserveret til de tests, der ikke hviler på parametriske antagelser - ikke-parametriske tests. Men i praksis de fleste implementeringer af ikke-parametrisk test software brug asymptotical algoritmer til at opnå den betydning værdi, hvilket gør implementeringen af ​​testen ikke-eksakt.

Så når resultatet af en statistisk analyse siges at være en "eksakt test" eller en "eksakt p-værdi", det burde betyde, at testen er defineret uden parametriske antagelser og evalueres uden ved en tilnærmelsesvis algoritmer. I princippet dog kunne det også betyde, at en parametrisk test har været ansat i en situation, hvor alle parametriske antagelser opfyldes fuldt ud, men det er i de fleste tilfælde umuligt at bevise dette fuldstændigt i en virkelig verden situation. Undtagelser, når det er sikkert, at parametriske tests er præcis omfatte test baseret på binomial eller poissonfordelinger. Undertiden permutation testen anvendes som et synonym for eksakte test, men selv om alle permutation test er nøjagtige tests, og ikke alle eksakte test er permutation test.

Definition

Den grundlæggende ligning underliggende permutation tests er

hvor:

og hvor summen spænder over alle udfald y, der har den samme værdi af teststørrelsen opnået for den observerede prøve x, eller en større.

Eksempel: Pearsons chi i anden-test versus en nøjagtig test

Et simpelt eksempel på en lejlighed til at dette koncept kan ses ved at bemærke, Pearsons chi i anden-test er en tilnærmelsesvis test. Antag Pearsons chi-squared test bruges til at fastslå, om en seks-sidet terning er "fair", dvs. giver hver af de seks udfald lige ofte. Hvis terningen kastes n gange, så en "forventer" for at se hvert resultat n / 6 gange. Teststørrelsen er

hvor Xk er antallet af gange resultatet k observeres. Hvis nulhypotesen om "fairness" er sandt, så er sandsynligheden fordeling af teststørrelsen kan foretages så tæt som ønsket på chi i anden-fordeling med 5 frihedsgrader ved at gøre stikprøvestørrelse n stor nok. Men hvis n er lille, så sandsynlighederne baseret på chi-squared fordelinger kan ikke være meget tæt tilnærmelser. At finde den nøjagtige sandsynlighed for, at denne test statistik overstiger en vis værdi, så kræver kombinatorisk opregning af alle resultater af forsøget, der resulterer i en så stor værdi teststørrelsen. Desuden bliver det tvivlsomt, om den samme teststørrelsen burde anvendes. En sandsynlighed-kvotientkriteriet kunne blive foretrukket som værende mere kraftfuld, og teststørrelsen måske ikke være en monoton funktion af ovenstående.

Eksempel: Fishers eksakte test

Fishers eksakte test er præcis fordi fordelingen prøvetagning kendes nøjagtigt. Sammenligne Pearsons chi i anden-test, hvilket ikke er nøjagtig, fordi fordelingen af ​​teststørrelsen er kun korrekt asymptotisk.

  0   0
Forrige artikel Betinget contagionism
Næste artikel Angilo Freeland

Kommentarer - 0

Ingen kommentar

Tilføj en kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Tegn tilbage: 3000
captcha