كيفية حساب هامش الخطأ

خطأ. يتردد صدى الكلمة ذاتها مع الأسف والندم ، على الأقل إذا كنت لاعب بيسبول أو خاضعًا للاختبار أو مشاركًا في مسابقة. بالنسبة للإحصائيين ، فإن الأخطاء هي مجرد شيء آخر يجب تتبعه كجزء من الوصف الوظيفي - ما لم تكن أخطاء الإحصائي هي نفسها بالطبع.

على المدىهامش الخطأشائع في اللغة اليومية ، بما في ذلك الكثير من المقالات الإعلامية حول الموضوعات العلمية أو استطلاعات الرأي. إنها طريقة للإبلاغ عن مصداقية القيمة (مثل النسبة المئوية للبالغين الذين يفضلون مرشحًا سياسيًا معينًا). يعتمد على عدد من العوامل ، بما في ذلك حجم العينة المأخوذة والقيمة المفترضة للمتوسط ​​السكاني لمتغير الاهتمام.

لفهم هامش الخطأ ، يجب أن يكون لديك أولاً معرفة عملية بالإحصاءات الأساسية ، ولا سيما مفهوم التوزيع الطبيعي. أثناء قراءتك ، انتبه بشكل خاص للفرق بين متوسط ​​العينة ومتوسط ​​عدد كبير من هذه الوسائل النموذجية.

إحصاءات السكان: الأساسيات

إذا كانت لديك عينة من البيانات ، مثل أوزان 500 فتى يبلغون من العمر 15 عامًا تم اختيارهم عشوائيًا في السويد ، فيمكنك احسب المتوسط ​​أو المتوسط ​​بقسمة مجموع الأوزان الفردية على عدد نقاط البيانات (500). الانحراف المعياري لهذه العينة هو مقياس لانتشار تلك البيانات حول هذا المتوسط ​​، ويوضح مدى اتساع القيم (مثل الأوزان) في التجمع.

instagram story viewer

  • ما الذي يحتمل أن يكون له انحراف معياري أكبر: متوسط ​​الوزن بالجنيه للأولاد السويديين المذكورين أعلاه ، أم إجمالي سنوات الدراسة التي أكملوها في سن 15؟

النظرية الحد المركزيتشير الإحصائيات إلى أنه في أي عينة مأخوذة من مجتمع ذي قيمة لمتغير معين يتم توزيعه عادةً حول متوسط ​​، ثم المتوسطمن الوسائل​ ​من العيناتالمأخوذة من هذه المجموعة السكانية ستقترب من المتوسط ​​السكاني حيث أن عدد العينة يعني أن المتوسطات تنمو نحو اللانهاية.

في إحصائيات العينة ، يتم تمثيل المتوسط ​​والانحراف المعياري بواسطة x و s ، وهما إحصائيات صحيحة ، وليسμو σ ، والتي هي في الواقعالمعلماتولا يمكن معرفتها بيقين 100٪. يوضح المثال التالي الاختلاف الذي يلعب دوره عند حساب هوامش الخطأ.

إذا قمت بأخذ عينات بشكل متكرر من ارتفاعات 100 امرأة تم اختيارها عشوائيًا في بلد كبير حيث يبلغ متوسط ​​ارتفاع المرأة البالغة 64.25 بوصة ، مع الانحراف المعياري 2 بوصة ، يمكنك جمع قيم x̄ المتتالية 63.7 و 64.9 و 64.5 وما إلى ذلك ، مع الانحرافات المعيارية s 1.7 و 2.3 و 2.2 بوصة و مثل. في كل حالة،μ وσ تبقى دون تغيير عند 64.25 و 2 بوصة على التوالي.

\ text {معدل السكان} = \ mu \ newline \ text {الانحراف المعياري للسكان} = \ sigma \ newline \ text {تباين السكان} = \ sigma ^ 2 \ newline \ text {نموذج المتوسط} = \ bar {x} \ newline \ text {نموذج الانحراف المعياري} = s \ newline \ text {نموذج التباين} = ق ^ 2

ما هي فترة الثقة؟

إذا اخترت شخصًا واحدًا بشكل عشوائي وأعطيته اختبارًا علميًا عامًا مكونًا من 20 سؤالًا ، فسيكون من الحماقة استخدام النتيجة كمتوسط ​​لأي مجموعة أكبر من المتقدمين للاختبار. ومع ذلك ، إذا كان متوسط ​​عدد السكان لهذا الاختبار معروفًا ، فيمكن عندئذٍ استخدام قوة الإحصاء تحديد الثقة التي يمكنك الحصول عليها من أن مجموعة من القيم (الدرجات في هذه الحالة) ستحتوي على قيم ذلك الشخص الفردي نتيجة.

أفاصل الثقةهو نطاق من القيم يتوافق مع النسبة المئوية المتوقعة لهذه الفواصل الزمنية التي ستحتوي على القيمة إذا تم إنشاء عدد كبير من هذه الفواصل الزمنية بشكل عشوائي ، باستخدام نفس أحجام العينات من نفس الحجم الأكبر تعداد السكان. هناك دائمابعضغير مؤكد حول ما إذا كانت فترة ثقة معينة أقل من 100 في المائة تحتوي بالفعل على القيمة الحقيقية للمعامل ؛ في معظم الأحيان ، يتم استخدام فاصل ثقة بنسبة 95 بالمائة.

مثال: افترض أن مقدم الاختبار قد حصل على 22/25 (88 بالمائة) ، وأن متوسط ​​عدد السكان هو 53 بالمائة مع انحراف معياري قدره ± 10 بالمائة. هل هناك طريقة لمعرفة أن هذه الدرجة تتعلق بالمتوسط ​​بالمصطلحات المئوية ، وما هو هامش الخطأ المتضمن؟

ما هي القيم الحرجة؟

تستند القيم الحرجة إلى البيانات الموزعة بشكل طبيعي ، وهو النوع الذي تمت مناقشته هنا حتى الآن. هذه هي البيانات التي يتم توزيعها بشكل متماثل حول وسط مركزي ، مثل الطول والوزن يميل إلى أن يكون. المتغيرات السكانية الأخرى ، مثل العمر ، لا تظهر التوزيعات العادية.

يتم استخدام القيم الحرجة لتحديد فترات الثقة. تستند هذه على مبدأ أن الوسائل السكانية هي في الواقع تقديرات موثوقة للغاية ومجمعة معًا من عدد غير محدود عمليًا من العينات. يتم الإشارة إليها من قبلض، وتحتاج إلى مخطط مثل المخطط الموجود في الموارد للعمل معهم لأن فترة الثقة التي اخترتها تحدد قيمتها.

سبب واحد تحتاجهض-قيم (أوض- الدرجات) هو تحديد هامش الخطأ لمتوسط ​​العينة أو المتوسط ​​السكاني. يتم التعامل مع هذه الحسابات بطرق مختلفة إلى حد ما.

خطأ قياسي مقابل. الانحراف المعياري

يختلف الانحراف المعياري للعينة لكل عينة ؛ يعتمد الخطأ المعياري لمتوسط ​​عدد من العينات على الانحراف المعياري للمجتمع ويعطى بالتعبير:

\ text {خطأ قياسي} = \ dfrac {\ sigma} {\ sqrt {n}} \ سطر جديد

صيغة هامش الخطأ

لمواصلة المناقشة أعلاه حول z-scores ، يتم اشتقاقها من فاصل الثقة المختار. لاستخدام الجدول المرتبط ، قم بتحويل النسبة المئوية لفاصل الثقة إلى رقم عشري ، اطرح هذا الكمية من 1.0 ، وقسم النتيجة على اثنين (لأن فاصل الثقة متماثل حول يعني).

تسمى الكمية (1 - CI) ، حيث CI هي فاصل الثقة المعبر عنه بالتدوين العشري ، بـمستوى الدلالة او الاهميهويشار إليه بواسطة α. على سبيل المثال ، عندما يكون CI = 95٪ = 0.95 ،α​ = 1.0 − 0.05 = 0.05.

بمجرد الحصول على هذه القيمة ، يمكنك العثور على مكان ظهورها على جدول z -score وتحديدض- سجل من خلال ملاحظة القيم الخاصة بالصف والعمود ذي الصلة. على سبيل المثال ، متىα= 0.05 ، فأنت تشير إلى القيمة 0.05 / 2 = 0.025 على الجدول ، المسماةض(α/2)، انظر إلى أنه مرتبط بـض- نتيجة −1.9 (قيمة الصف) مطروحًا منها 0.06 أخرى (قيمة العمود) لإعطاء قيمةض-نتيجة −1.96.

حسابات هامش الخطأ

الآن ، أنت مستعد لإجراء بعض حسابات هامش الخطأ. كما لوحظ ، يتم إجراء ذلك بشكل مختلف اعتمادًا على ما تجد بالضبط هامش الخطأ له.

معادلة هامش الخطأ لمتوسط ​​العينة هي:

E = Z _ {(α / 2)} × ث

وهذا بالنسبة لهامش الخطأ الخاص بالمجتمع هو:

E = Z _ {(α / 2)} × \ فارك {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ نص {خطأ معياري}

مثال: افترض أنك تعلم أن عدد العروض عبر الإنترنت للأشخاص في مدينتك في مشاهدة حفلاتهم السنوية يتم توزيعه عادةً بانحراف معياري سكاني σ يبلغ 3.2 عرضًا. تم أخذ عينة عشوائية من 29 من سكان المدينة ، وكان متوسط ​​العينة 14.6 عرض / سنة. باستخدام فاصل ثقة 90٪ ، ما هو هامش الخطأ؟

ترى أنك ستستخدم المعادلتين الثانية من المعادلتين السابقتين لحل هذه المسألة ، نظرًا لأن σ معطاة. أولاً ، احسب الخطأ القياسي σ /ن:

\ frac {3.6} {\ sqrt {29}} = 0.67

الآن ، يمكنك استخدام قيمةض(α/2) لα= 0.10. عند تحديد القيمة 0.050 في الجدول ، ستلاحظ أن هذا يتوافق مع قيمةضبين −1.64 و −1.65 ، لذا يمكنك استخدام −1.645. لهامش الخطأه، هذا يعطي:

E = (−1.645) (0.67) = −1.10

لاحظ أنه كان من الممكن أن تبدأ الأمور الإيجابيةض- جانب الدرجات من الجدول ووجد القيمة المقابلة لـ 0.90 بدلاً من 0.10 ، حيث يمثل هذا النقطة الحرجة المقابلة على الجانب الآخر (الأيمن) من الرسم البياني. هذا من شأنه أن يعطيه= 1.10 ، وهو أمر منطقي لأن الخطأ هو نفسه على جانبي المتوسط.

باختصار ، إذن ، فإن عدد العروض المنغمسة سنويًا بواسطة عينة من 29 من جيرانك هو 14.6 ± 1.10 عرضًا سنويًا.

Teachs.ru
  • يشارك
instagram viewer