
Den hypergeometriske fordeling er en statistisk model, der beskriver sandsynligheden for at opnå et vist antal succeser i en stikprøve trukket fra en endelig population uden erstatning. I denne model er populationen opdelt i to forskellige kategorier (succeser og fiaskoer), og stikprøven udvælges uden at erstatte de fjernede elementer.
Den hypergeometriske fordeling er karakteriseret ved tre parametre: populationsstørrelse, antallet af succeser i populationen og stikprøvestørrelsen. Ved hjælp af specifikke formler og ligninger er det muligt at beregne sandsynligheden for at opnå et bestemt antal succeser i den valgte stikprøve.
Denne model anvendes i vid udstrækning inden for forskellige områder, såsom industri, videnskabelig forskning og generel beslutningstagning. Forståelse af den hypergeometriske fordeling og dens praktiske anvendelser er afgørende for statistisk analyse af problemer, der involverer udvælgelse af elementer fra en endelig population.
Beregn den hypergeometriske fordeling på en praktisk og effektiv måde i blot få trin.
For at beregne den hypergeometriske fordeling praktisk og effektivt på blot et par trin, er det vigtigt at følge et par enkle trin. Den hypergeometriske fordeling bruges ofte til at beregne sandsynligheden for at opnå et bestemt antal succeser i en stikprøve uden erstatning.
Først er det nødvendigt at identificere parametrene for den hypergeometriske fordeling: n (stikprøvestørrelse), K (samlet antal succeser i populationen), N (befolkningsstørrelse) og k (antal ønskede succeser i stikprøven).
Brug derefter den hypergeometriske fordelingsformel til at beregne sandsynligheden for at få præcis k succeser i stikprøven, givet ved:
P(X = k) = (K vælg k) * ((NK) vælg (nk)) / (N vælg n)
Hvor "vælg" repræsenterer den binomiale koefficient, som nemt kan beregnes ved hjælp af formler eller specialiseret software.
Til sidst, efter at have beregnet sandsynligheden for hver værdi af k Hvis det ønskes, er det muligt at oprette den komplette fordeling og analysere resultaterne på en praktisk og effektiv måde.
Ved at følge disse enkle trin og bruge de korrekte formler er det muligt at beregne den hypergeometriske fordeling præcist og hurtigt, hvilket letter den statistiske analyse af forskellige scenarier.
Hvornår skal man vælge binomial- og Poisson-fordelingen i specifikke sandsynlighedssituationer.
Når man skal vælge mellem binomial- og Poisson-fordelinger i specifikke sandsynlighedssituationer, er det vigtigt at overveje deres karakteristika. Binomialfordelingen bruges, når vi har at gøre med et eksperiment, der har et fast antal forsøg, hver med kun to mulige udfald (succes eller fiasko). På den anden side er Poisson-fordelingen mere passende, når vi har at gøre med en proces, hvor vi tæller sjældne begivenheder over et kontinuerligt tids- eller ruminterval.
Hvis vi for eksempel er interesserede i at kende sandsynligheden for at få præcis 5 krone i 10 kast med en fair mønt, ville binomialfordelingen være det ideelle valg. Hvis vi er interesserede i sandsynligheden for, at der sker 3 trafikulykker på en given vejstrækning på en dag, ville Poisson-fordelingen være mere passende.
Hypergeometrisk fordeling: formler, ligninger, model
Den hypergeometriske fordeling bruges, når vi er interesserede i sandsynligheden for at opnå et bestemt antal succeser i en stikprøve uden erstatning. Den anvendes i situationer, hvor fjernelsen af ét element påvirker sandsynligheden for succes for de følgende elementer.
Formlen for den hypergeometriske fordeling er givet ved:
P(X = k) = (C(n,k) * C(Nn, nk)) / C(N, n)
Onde:
- P(X = k) er sandsynligheden for at få præcis k succeser i stikprøven
- C(n,k) er antallet af kombinationer af n elementer taget kak
- N er befolkningsstørrelsen
- n er antallet af elementer i stikprøven
- k er antallet af ønskede succeser i stikprøven
Derfor er den hypergeometriske fordeling et nyttigt værktøj til at beregne sandsynligheden for succes i stikprøver uden erstatning, under hensyntagen til interaktionen mellem populationens elementer.
Opdag hvordan man beregner sandsynlighedsfordelingen på en simpel måde.
Opdage måden at beregne sandsynlighedsfordelingen på en simpel måde. hypergeometrisk fordeling er en statistisk model, der beskriver sandsynligheden for at opnå et bestemt antal succeser i en stikprøve uden erstatning. For at beregne sandsynlighedsfordelingen kan du bruge følgende formel:
P(X=k) = (C(k,n) * C(Nk, Nn)) / C(N, n)
Onde:
- X er den stokastiske variabel, der repræsenterer antallet af succeser
- k er antallet af ønskede succeser i stikprøven
- n er det samlede antal succeser i populationen
- N er befolkningsstørrelsen
- C(a, b) repræsenterer antallet af kombinationer af a elementer taget b a a Elementos
Med denne formel kan du nemt beregne sandsynligheden for at opnå et bestemt antal succeser i en stikprøve uden erstatning. Husk, at summen af alle sandsynligheder skal være lig med 1, hvilket betyder, at summen af alle sandsynlighederne for alle mulige antal succeser skal være lig med 1.
Hypergeometrisk fordeling: formler, ligninger, model
A hypergeometrisk fordeling er en diskret statistisk funktion, der er egnet til at beregne sandsynligheden i randomiserede eksperimenter med to mulige resultater. Den nødvendige betingelse for at anvende den er, at der er tale om små populationer, hvor ekstraktionerne ikke erstattes, og sandsynlighederne ikke er konstante.
Derfor, når et element i populationen vælges for at kende resultatet (sandt eller falsk) af en bestemt egenskab, kan det samme element ikke vælges igen.
Det næste valgte element er derfor helt sikkert mere tilbøjeligt til at give et sandt resultat, hvis det foregående element giver et negativt resultat. Det betyder, at sandsynligheden varierer, efterhånden som stikprøveelementerne udvindes.
De vigtigste anvendelser af hypergeometrisk fordeling er: kvalitetskontrol i processer med små populationer og beregning af sandsynligheder i spil.
Hvad angår den matematiske funktion, der definerer den hypergeometriske fordeling, består den af tre parametre, som er:
– Antal elementer i populationen (N)
– Stikprøvestørrelse (m²)
– Antal hændelser i hele populationen med et gunstigt (eller ugunstigt) resultat for den undersøgte karakteristik (n).
Formler og ligninger
Den hypergeometriske fordelingsformel giver sandsynligheden P af at x Der forekommer gunstige tilfælde af en given egenskab. Måden at skrive den matematisk på, afhængigt af de kombinatoriske tal, er:
I det foregående udtryk N , n e m er ex-parametre x selve variablen.
- Den samlede ofring af P er N.
Antallet af positive resultater af en bestemt binær karakter over den samlede population er n.
-Mængden af prøveelementer er m.
I det tilfælde, X er en stokastisk variabel, der antager værdien x e P (x) angiver sandsynligheden for forekomst af x gunstige tilfælde af den undersøgte egenskab.
Vigtige statistiske variabler
Andre statistiske variabler for den hypergeometriske fordeling er:
- Gennemsnit μ = m * n / N
– Varians σ^2 = m * (n/N) * (1-n/N) * (Nm) / (N-1)
– Typisk afvigelse σ, hvilket er kvadratroden af variansen.
Model og egenskaber
For at nå frem til den hypergeometriske fordelingsmodel, starter vi med sandsynligheden for at opnå x gunstige tilfælde i en stikprøve af størrelse m.Denne prøve indeholder elementer, der opfylder den undersøgte egenskab, og elementer, der ikke gør.
Husk det n repræsenterer antallet af gunstige tilfælde i den samlede population af N elementer. Så ville sandsynligheden blive beregnet således:
P(x) = (antal måder at få x antal mislykkede måder) / (antal måder at vælge i alt)
Ved at udtrykke ovenstående i form af kombinatoriske tal opnås følgende sandsynlighedsfordelingsmodel:
Hovedegenskaber ved den hypergeometriske fordeling
De er som følger:
– Stikprøven bør altid være lille, selvom populationen er stor.
– Stikprøveelementerne udtrækkes ét efter ét, uden at de indarbejdes i populationen igen.
– Den egenskab, der skal undersøges, er binær, det vil sige, at den kun kan modtage to værdier: 1 ou 0 , ægte ou falsk .
Ved hvert trin i elementudtrækningen ændres sandsynligheden afhængigt af tidligere resultater.
Approksimation gennem binomialfordelingen
En anden egenskab ved den hypergeometriske fordeling er, at den kan tilnærmes ved hjælp af den binomiale fordeling, kaldet Bi , da befolkningen N være stor og mindst 10 gange større end stikprøven m I dette tilfælde ville det se sådan ud:
P (N, n, m; x) = Bi (m, n/N, x)
Gælder så længe N er stor og N > 10 m
Eksempler
Eksempel 1
Antag, at en maskine producerer skruer, og de akkumulerede data indikerer, at 1% er defekte. I en æske med N = 500 skruer vil antallet af defekter være:
n = 500 * 1/100 = 5
Sandsynligheder gennem den hypergeometriske fordeling
Antag, at vi fra denne boks (dvs. fra denne population) indsamler en stikprøve på m = 60 skruer.
Sandsynligheden for, at ingen bolt (x = 0) i prøven er defekt, er 52,63 %. Dette resultat opnås ved hjælp af den hypergeometriske fordelingsfunktion:
P (500, 5, 60; 0) = 0,5263
Sandsynligheden for, at x = 3 skruer i stikprøven er defekte, er: P(500, 5, 60; 3) = 0,0129.
På den anden side er sandsynligheden for, at x = 4 skruer ud af de 500 i stikprøven er defekte: P (5, 60, 4; 0,0008) = XNUMX.
Endelig er sandsynligheden for, at x = 5 skruer i denne prøve er defekte: P(500, 5, 60; 5) = 0.
Men hvis du vil vide sandsynligheden for, at der er mere end 3 defekte skruer i den prøve, skal du finde den kumulative sandsynlighed ved at lægge:
P(3) + P(4) + P(5) = 0,0129 + 0,0008 + 0 = 0,0137.
Dette eksempel er illustreret i figur 2, opnået ved hjælp af gratis software. geogebra , der er meget anvendt i skoler, institutter og universiteter.
Eksempel 2
Et sæt spanske kort har 40 kort, hvoraf 10 er guld, og de resterende 30 ikke er. Antag, at der trækkes 7 tilfældige kort fra det sæt, som ikke vender tilbage til bunken.
Hvis X er antallet af guldmedaljer i de 7 trukne kort, er sandsynligheden for at have guld i en trækning af 7 kort givet ved den hypergeometriske fordeling P(40,10,7; x).
Lad os se på følgende: For at beregne sandsynligheden for at have 4 guld i en trækning med 7 kort, bruger vi den hypergeometriske fordelingsformel med følgende værdier:
Og resultatet er: 4.57% sandsynlighed.
Men hvis du vil vide sandsynligheden for at få mere end 4 kort, skal du lægge følgende sammen:
P(4) + P(5) + P(6) + P(7) = 5,20%
Løste øvelser
Følgende sæt øvelser har til formål at illustrere og tilegne sig de koncepter, der præsenteres i denne artikel. Det er vigtigt, at læseren forsøger at løse dem på egen hånd, før den ser på løsningen.
Øvelse 1
En kondomfabrik opdagede, at ud af hver 1000 kondomer produceret af en bestemt maskine, var 5 defekte. For at udføre kvalitetskontrol blev 100 kondomer tilfældigt udvalgt, og partiet blev afvist, hvis der blev fundet mindst én eller flere defekter. Svar:
a) Hvad er sandsynligheden for, at et parti på 100 bliver kasseret?
b) Er dette kvalitetskontrolkriterium effektivt?
Opløsning
I dette tilfælde vil der opstå meget store kombinatoriske tal. Beregning er vanskelig, medmindre en passende softwarepakke er tilgængelig.
Men da det er en stor population, og stikprøven er ti gange mindre end den samlede population, kan den hypergeometriske fordelingsapproksimation ved hjælp af binomialfordelingen anvendes:
P (1000,5,100; x) = Bi (100, 5/1000, x) = Bi (100, 0,005, x) = C (100, x) * 0,005 ^ x (1-0,005) ^ (100-x)
I det foregående udtryk, C (100, x) er et kombinatorisk tal. Sandsynligheden for mere end én defekt beregnes som følger:
P(x>=1) = 1 – Bi(0) = 1- 0,6058 = 0,3942
Dette er en fremragende tilnærmelse sammenlignet med den værdi, der opnås ved at anvende den hypergeometriske fordeling: 0,4102
Det kan siges, at med en sandsynlighed på 40% bør et parti på 100 profylaktiske midler kasseres, hvilket ikke er særlig effektivt.
Ved at være lidt mindre krævende i kvalitetskontrolprocessen og kun kassere batch 100, hvis der er to eller flere defekter, ville sandsynligheden for at kassere batchen falde til blot 8 %.
Øvelse 2
En plastikblokmaskine fungerer på en sådan måde, at for hver 10 stykker deformeres et. I en stikprøve på 5 stykker er sandsynligheden, at kun ét stykke vil være defekt.
Opløsning
Befolkning: N = 10
Antal n defekter for hvert N: n = 1
Stikprøvestørrelse: m = 5
P (10, 1, 5; 1) = C (1,1) * C (9,4) / C (10,5) = 1 * 126/252 = 0,5
Derfor er der en 50% chance for, at én blok i en stikprøve på 5 vil være forvrænget.
Øvelse 3
I en gruppe unge kandidater er der 7 kvinder og 6 mænd. Blandt pigerne studerer 4 humaniora og 3 naturvidenskab. Blandt drengene studerer 1 humaniora og 5 naturvidenskab. Beregn følgende:
a) Tilfældigt valg af tre piger: hvad er sandsynligheden for, at de alle vil studere humaniora?
b) Hvis tre deltagere i et vennemøde vælges tilfældigt: Hvad er så sandsynligheden for, at tre af dem, uanset køn, vil studere alle tre eller alle tre humaniora også?
c) Vælg nu to tilfældige venner og kald den stokastiske variabel "antal af dem, der studerer humaniora" x Mellem de to valgte, bestem den gennemsnitlige eller forventede værdi af x og variationen σ^2.
Løsning til
Populationen er det samlede antal piger: N = 7. De, der studerer humaniora, er n = 4 af det samlede antal. Den tilfældige stikprøve af piger vil være m = 3.
I dette tilfælde er sandsynligheden for, at alle tre er humanistiske studerende, givet ved den hypergeometriske funktion:
P(N = 7, n = 4, m = 3, x = 3) = C (4, 3) C (3, 0) / C (7, 3) = 0,1143
Der er 11,4% chance for, at tre tilfældigt udvalgte piger vil studere humaniora.
Løsning b
De værdier, der skal bruges nu, er:
-Befolkning: N = 14
– Mængden, der studerer bogstaver, er: n = 6 og
-Stikprøvestørrelse: m = 3.
-Antal venner, der studerer humaniora: x
Ifølge dette betyder x = 3, at alle tre studerer humaniora, men x = 0 betyder, at ingen studerer humaniora. Sandsynligheden for, at alle tre studerer det samme, er givet ved summen:
P(14, 6, 3, x = 0) + P(14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099
Så har vi en 21% chance for, at tre tilfældigt udvalgte mødedeltagere vil studere det samme.
Løsning c
Her har vi følgende værdier:
N = 14 samlede population af venner, n = 6 samlede antal i populationen, der studerer humaniora, stikprøvestørrelsen er m = 2.
Håbet er:
E(x) = m * (n / N) = 2 * (6/14) = 0,8572
Og variationen:
σ(x)^2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) =
= 2 * (6/14) * (1-6/14) * (14-2) / (14-1) = 2 * (3/7) * (1-3/7) * (12) / (13) = 0,4521
Referencer
- Diskrete sandsynlighedsfordelinger. Hentet fra: biplot.usal.es
- Statistik og sandsynlighed. Hypergeometrisk fordeling. Hentet fra: proyectodescartes.org
- CDPYE-UGR. Hypergeometrisk fordeling Hentet fra: ugr.es
- Geogebra Klassisk Geogebra, sandsynlighedsregning. Hentet fra geogebra.org
- Prøv det nemt. Løste øvelser om hypergeometrisk fordeling. Hentet fra: probafacil.com
- Minitab Hypergeometrisk Fordeling Hentet fra: support.minitab.com
- Universitetet i Vigo. Principale diskrete fordelinger. Hentet fra: anapg.webs.uvigo.es
- Vitutor Statistik og Kombinatorik. Hentet fra: vitutor.net
- Weisstein, Eric W. Hypergeometrisk fordeling. Hentet fra: mathworld.wolfram.com
- Wikipedia Hypergeometrisk fordeling Hentet fra: en.wikipedia.com
