Sådan beregnes X-bar

Sig, at du ved, at en amerikansk kvindes gennemsnitlige højde er tæt på 5 fod, ca. 1,63 m. Sig, at du også fik at vide, at et auditorium, hvor 500 voksne kvinder står, er en perfekt repræsentativ prøve af den amerikanske befolkning. Det vil sige, du kan med rimelighed forvente, at kvindernes gennemsnitlige højde i auditoriet også vil være 5 '4 ".

Hvis du tilfældigt valgte tre personer for at forlade rummet, ville du forvente, at gennemsnittet eller middelværdien af ​​deres højder var nøjagtigt 5 '4 "? Hvorfor eller hvorfor ikke? Hvad hvis du valgte 10 personer i stedet? Eller 100? Sig også, at du gentog eksperimentet med at måle højderne på tre tilfældigt udvalgte kvinder i rummet igen og igen og derefter gennemsnitligt Disse gennemsnit?

Over tid kan du forvente gennemsnittet af disse gennemsnit, som hver kaldes x-bar (x̄) eller den prøve middelværdi, for at nærme befolkningens gennemsnit på 5 '4 ". Og hvis du brugte større prøver, ville du forvente, at denne konvergens af prøveudtagningsmetoderne og den sande (population) betyder at ske hurtigere. Men hvorfor?

instagram story viewer

Befolkningsstatistik

Svarene på ovenstående spørgsmål ligger i den statistiske verden prøveudtagningsfordelinger. Men først er nogle terminologier og definitioner i orden.

Befolkningens gennemsnit er en accepteret, empirisk bestemt værdi, der gælder for den størst mulige gruppe af personer, du studerer. Hvis dit auditorium således indeholder 500 amerikanske kvinder, er hele sættet af amerikanske kvinder den større befolkning, der er underforstået.

s repræsenterer et lignende koncept: En kendt befolkning del, såsom "andelen af ​​hunde over hele verden, der kan løbe over 15 miles i timen, er 0,40 (40 procent)." , kaldet "p-hat", er den gennemsnitlige andel, der findes efter at have taget et antal prøver af samme størrelse (f.eks. 10 hunde) fra befolkningen i det store antal.

For eksempel kan en gruppe på 10 tilfældigt udvalgte hunde have en gennemsnitlig hastighed på 17,8 MPH, den næste 14,3 MPH, den næste 12,8 MPH og så videre, indtil du har analyseret så mange prøver, som du vil.

Prøveudtagningsstatistik

Prøvefordelinger giver dig mulighed for at bestemme, om den pulje, du tager prøver fra, virkelig er repræsentativ for den større befolkning. Dette skyldes, ifølge Central Limit Theorem, som antallet af x-bar (x̄) stiger, en graf over deres gennemsnit og deres fordeling vil ligne den for den sande befolknings gennemsnit. Det vil sige, det vil være en normal (klokkeformet) distribution.

Tilbage til kvinderne i auditoriet: Over tid kan du forvente gennemsnittet af disse gennemsnit, kaldet x-bar (x̄) eller prøven betyder, at nærme befolkningens gennemsnit på 5 '4 "uanset hvor mange datapunkter (n) du inkluderer hver x-bar. Og hvis du bruger større prøver, såsom 100 mennesker eller hunde ad gangen i stedet for 10, forventer du begge begge individuelle x̄ vil være tættere på det sande middel, og at færre forekomster af x̄ skal beregnes i gennemsnit for at komme tættere på dette ægte middelværdi.

Hvis du f.eks. Valgte tre kvinder, ville du ikke blive overrasket, hvis deres gennemsnitlige højde var 5 '9 "eller 5' 1" fordi en enkelt meget høj eller meget kort "outlier" kan kaste et gennemsnit meget, når antallet af datapunkter er lille.

Men hvis du kørte gentagne forsøg med 100 kvinder og så x-bar-værdier på 5 '8.2 ", 5' 7.3" osv., Ville du have grund til at konkludere, at befolkningsprøven på 500 i auditoriet faktisk ikke var en tilfældigt valgt stikprøve af amerikanske kvinder.

X-Bar-lommeregner

Du kan hurtigt finde værdien af ​​x-bar for enhver prøve ved at henvise til en side som den i ressourcerne. For at opsummere disse værdier for at opnå en samplingsfordeling kan du bruge regnearkprogrammer som Microsoft Excel eller Google Sheets, der har forskellige færdigpakkede statistiske værktøjer til anvendelser som disse.

Teachs.ru
  • Del
instagram viewer