Cum se calculează marja de eroare

Eroare. Însăși cuvântul rezonează cu regret și remușcare, cel puțin dacă se întâmplă să fii jucător de baseball, participant la examen sau participant la concurs. Pentru statisticieni, erorile sunt pur și simplu încă un lucru de urmărit ca parte a fișei postului - cu excepția cazului în care, desigur, propriile erori ale statisticianului sunt în cauză.

Termenulmarja de eroareeste comun în limbajul cotidian, inclusiv o mulțime de articole media despre subiecte științifice sau sondaje de opinie. Este o modalitate de a raporta fiabilitatea unei valori (cum ar fi procentul de adulți care favorizează un anumit candidat politic). Se bazează pe o serie de factori, inclusiv dimensiunea eșantionului prelevat și valoarea presupusă a mediei populației a variabilei de interes.

Pentru a înțelege marja de eroare, trebuie să aveți mai întâi cunoștințe practice de statistici de bază, în special conceptul unei distribuții normale. Pe măsură ce citiți, acordați o atenție deosebită diferenței dintre media unui eșantion și media unui număr mare din aceste eșantioane.

instagram story viewer

Statistica populației: elementele de bază

Dacă aveți un eșantion de date, cum ar fi greutățile a 500 de băieți de 15 ani aleși aleatoriu din Suedia, puteți calculați media sau media, împărțind suma ponderilor individuale la numărul de puncte de date (500). Abaterea standard a acestui eșantion este o măsură a răspândirii acestor date despre acea medie, arătând cât de mult au tendința de a se aglomera valorile (cum ar fi greutățile).

  • Ce are cel mai probabil o abatere standard mai mare: greutatea medie în kilograme a băieților suedezi menționați anterior sau totalul anilor de școală pe care i-au absolvit la vârsta de 15 ani?

Teorema limitei centraledin statistici afirmă că, în orice eșantion preluat dintr-o populație cu o valoare pentru o anumită variabilă care este distribuită în mod normal în jurul unei medii, atunci mediaa mijloacelor​ ​de probeluată din acea populație se va apropia de media populației pe măsură ce numărul eșantionului înseamnă medii crește spre infinit.

În eșantionul de statistici, media și abaterea standard sunt reprezentate de x than și s, care sunt statistici adevărate, mai degrabă decâtμși σ, care sunt de faptparametriiși nu poate fi cunoscută cu 100% siguranță. Următorul exemplu ilustrează diferența, care intră în joc atunci când se calculează marjele de eroare.

Dacă ați prelevat în mod repetat înălțimile a 100 de femei selectate aleatoriu într-o țară mare unde înălțimea medie a unei femei adulte este de 64,25 inci, cu o abaterea standard de 2 inci, puteți colecta valori succesive x̄ de 63,7, 64,9, 64,5 și așa mai departe, cu abateri standard s de 1,7, 2,3, 2,2 inci și ca. In fiecare caz,μ șiσ rămân neschimbate la 64,25 și respectiv 2 inci.

\ text {Population mean} = \ mu \ newline \ text {Deviația standard a populației} = \ sigma \ newline \ text {Varianța populației} = \ sigma ^ 2 \ newline \ text {Sample mean} = \ bar {x} \ newline \ text {Sample standard deviation} = s \ newline \ text {Sample variance} = s ^ 2

Ce este un interval de încredere?

Dacă ai alege o singură persoană la întâmplare și i-ai da un test de știință generală cu 20 de întrebări, ar fi o prostie să folosești rezultatul ca medie pentru orice populație mai mare de testatori. Cu toate acestea, dacă se cunoaște scorul mediu al populației pentru acest test, atunci puterea statisticilor poate fi folosită determinați încrederea pe care o puteți avea că o serie de valori (în acest caz scoruri) vor conține acea persoană singură Scor.

Ainterval de încredereeste un interval de valori care corespunde procentului așteptat de astfel de intervale care vor conține valoarea dacă se creează aleator un număr mare de astfel de intervale, utilizând aceleași dimensiuni ale eșantionului din aceleași dimensiuni mai mari populației. Este intotdeaunanistecu siguranță dacă un anumit interval de încredere mai mic de 100% conține de fapt valoarea reală a parametrului; de cele mai multe ori, se folosește un interval de încredere de 95%.

Exemplu: Să presupunem că participantul la test a obținut un scor de 22/25 (88%) și că scorul mediu al populației este de 53%, cu o abatere standard de ± 10%. Există o modalitate de a cunoaște acest scor în legătură cu media în termeni percentili și care este marja de eroare implicată?

Ce sunt valorile critice?

Valorile critice se bazează pe date distribuite în mod normal, ceea ce este discutat aici până acum. Acestea sunt date care sunt distribuite simetric în jurul unei medii centrale, cum ar fi înălțimea și greutatea. Alte variabile ale populației, cum ar fi vârsta, nu prezintă distribuții normale.

Valorile critice sunt utilizate pentru a determina intervalele de încredere. Acestea se bazează pe principiul că mijloacele populației sunt de fapt estimări foarte, foarte fiabile, asamblate dintr-un număr practic nelimitat de eșantioane. Sunt notate cuz, și aveți nevoie de o diagramă ca cea din Resurse pentru a lucra cu ele deoarece intervalul de încredere ales de dvs. determină valoarea acestora.

Un motiv pentru care ai nevoiez-valori (sauz-score) este de a determina marja de eroare a unei probe medii sau a unei medii populaționale. Aceste calcule sunt tratate în moduri oarecum diferite.

Eroare standard vs. Deviație standard

Abaterea standard a unui eșantion diferă pentru fiecare eșantion; eroarea standard a mediei unui număr de eșantioane depinde de deviația standard a populației σ și este dată de expresia:

\ text {Standard error} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline

Marja formulei de eroare

Pentru a continua discuția de mai sus despre scorurile z, acestea sunt derivate din intervalul de încredere ales. Pentru a utiliza tabelul asociat, convertiți procentul intervalului de încredere într-o zecimală, scădeți acest lucru cantitatea de la 1.0 și împărțiți rezultatul la două (deoarece intervalul de încredere este simetric față de Rău).

Cantitatea (1 - CI), unde CI este intervalul de încredere exprimat în notație zecimală, se numeștenivel de semnificațieși este notat cu α. De exemplu, când CI = 95% = 0,95,α​ = 1.0 − 0.05 = 0.05.

Odată ce aveți această valoare, veți găsi unde apare pe tabelul scorului z și veți determina valoareaz-score notând valorile pentru rândul și coloana relevante. De exemplu, cândα= 0,05, vă referiți la valoarea 0,05 / 2 = 0,025 de pe tabel, numităZ(α/2), vezi că este asociat cu unz-score de -1,9 (valoarea rândului) minus încă 0,06 (valoarea coloanei) pentru a da unz-scor de -1.96.

Marja de calcul a erorilor

Acum, sunteți gata să efectuați o marjă de calcul al erorilor. După cum sa menționat, acestea se fac diferit în funcție de ceea ce găsiți exact marja de eroare.

Formula pentru marja de eroare pentru un eșantion mediu este:

E = Z _ {(α / 2)} × s

și că pentru marja de eroare a unei populații media este:

E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {eroare standard}

Exemplu: Să presupunem că știți că numărul de emisiuni online pe care oamenii din orașul dvs. îl urmăresc în mod normal pe an este distribuit în mod normal cu o abatere standard a populației σ de 3,2 emisiuni. A fost prelevat un eșantion aleatoriu de 29 de localnici, iar media eșantionului este de 14,6 spectacole / an. Folosind un interval de încredere de 90%, care este marja de eroare?

Vedeți că veți utiliza a doua dintre cele două ecuații de mai sus pentru a rezolva această problemă, deoarece σ este dat. Mai întâi, calculați eroarea standard σ / √n:

\ frac {3.6} {\ sqrt {29}} = 0.67

Acum, folosiți valoarea luiZ(α/2) pentruα= 0.10. Localizând valoarea 0,050 pe masă, vedeți că aceasta corespunde unei valori dezîntre -1,64 și -1,65, deci puteți utiliza -1,645. Pentru marja de eroareE, Asta da:

E = (-1,645) (0,67) = -1,10

Rețineți că ați fi putut începe pe pozitivz-score latura tabelului și a găsit valoarea corespunzătoare 0,90 în loc de 0,10, deoarece acesta reprezintă punctul critic corespunzător din partea opusă (dreapta) a graficului. Acest lucru ar fi datE= 1,10, ceea ce are sens, deoarece eroarea este aceeași pe fiecare parte a mediei.

În concluzie, numărul de emisiuni pe an de către eșantionul a 29 de vecini este de 14,6 ± 1,10 emisiuni pe an.

Teachs.ru
  • Acțiune
instagram viewer