Presentation is loading. Please wait.

Presentation is loading. Please wait.

Data Analysis and Interpretation

Similar presentations


Presentation on theme: "Data Analysis and Interpretation"— Presentation transcript:

1 Data Analysis and Interpretation
المحاضرة التاسعة الفصل الثاني عشر تحليل البيانات وشرحها Data Analysis and Interpretation

2 خطوات تحليل البيانات أولاً : تجهيز البيانات للتحليل:
مراجعة البيانات معالجة الأسئلة التي تركت دون إجابة الترميز التصنيف إدخال البيانات إلى الحاسب ثانياً : تحليل البيانات التعرف على البيانات اختبار جودة البيانات اختبار الفروض

3 1- مراجعة البيانات يفضل أن تراجع البيانات في اليوم الذي جمعت فيه لإمكانية الاتصال بمن جمعت منهم البيانات في حال ظهور حاجة لذلك . يفضل كتابة البيانات المراجعة بلون مختلف عن الذي كتبت فيه البيانات الأصلية . من الواجب الاحتفاظ بالبيانات الأصلية لإمكانية الرجوع لها.

4 2- معالجة الأسئلة التي تركت دون إجابة
قد لا يجيب المبحوثين عن كل أسئلة الاستقصاء نتيجة لعدم فهم السؤال، أو عدم معرفة الإجابة أو عدم الرغبة في ذلك. إذا ترك جزء كبير من الاستقصاء دون إجابة (25% فأكثر) ، يتم إسقاط هذا الاستقصاء. من المفضل ذكر عدد الاستقصاءات غير المفيدة والتي تم التخلص منها في التقرير النهائي . إذا كان عدد الأسئلة المتروكة قليل على الباحث اتخاذ قرار بشأن ذلك

5 طرق معالجة الأسئلة المتروكة
إعطاء الإجابات الخالية القيمة المتوسطة في المقياس. توجيه الكمبيوتر لإهمال الإجابات الخالية، وعدم احتسابها عند التحليل. استبدالها بقيمة المتوسط الحسابي لإجابة أفراد العينة على كل متغير من تلك المتغيرات. استبدالها بالمتوسط الحسابي لإجابة صاحب الاستبيان نفسه على كل الأسئلة التي تقيس هذا المتغير (الذي توجد فيه القيمة المفقودة). أشهر الطرق لمعالجة الأسئلة المتروكة : استبدال الأسئلة المتروكة بالقيمة المتوسطة على المقياس (3 على المقياس الخماسي ) . إهمال الأسئلة المتروكة أثناء التحليل خاصة عندما يكون حجم العينة كبيراً ، لأن ذلك يعطي مستوى صلاحية أكبر .

6 3- الترميز coding إعطاء ترميز معين لمتغيرات الاستبانة (أرقام) بحسب فئات كل متغير. 4- التصنيف categorization: يجب وضع خطة لتصنيف متغيرات البحث. يجب تجميع المتغيرات التي تقيس ظاهر معينة معاً قبل إدخال البيانات إلى الكمبيوتر. تغيير اتجاهات بعض الأسئلة التي تمت صياغتها في صورة نفي (العبارات السلبية والعبارات الايجابية). 5- إدخال البيانات الى الحاسب

7 المحاضرة العاشرة اختبار الفرضيات Hypothesis Testing الاختبارات المعلمية واللامعلمية Parametric and Non-Parametric Tests 7

8 اختبار الفرضيات Hypothesis Testing
يهدف اختبار الفرضية إحصائيا إلى اتخاذ قرار حول ما إذا كانت الفرضية الصفرية Null Hypothesis مقبولة أم مرفوضة ويتم ذلك باستخدام دالة اختبار إحصائية مناسبة. . وقبول الفرضية الصفرية لا يعني بالضرورة أنها صحيحة وإنما لا يوجد أدلة كافية من بيانات العينة لرفضها، كما أن رفضها لا يعني بالضرورة أنها خاطئة بل يعني أن الإحصائي المحسوب من العينة كان بعيدا عن المعلمة المناظرة له في المجتمع لدرجة أن احتمال أن تكون قيمته متطرفة بهذا البعد عندما تكون الفرضية الصفرية صحيحة أمر نادر الحدوث مما يدفعنا إلى رفض هذه الفرضية الصفرية. 8

9 اختبار الفرضيات Hypothesis Testing
يهدف اختبار الفرضية إحصائيا إلى اتخاذ قرار حول ما إذا كانت الفرضية الصفرية Null Hypothesis مقبولة أم مرفوضة ويتم ذلك باستخدام دالة اختبار إحصائية مناسبة. يوجد نوعان من الفرضيات يستخدمان في اختبار الفرضيات وهما الفرضية الصفرية أو العدمية (Null Hypothesis) ويرمز لها: H0: (المتهم برئ) والفرضية البديلة (alternative Hypothesis ) ويرمز لها: H1: (المتهم مذنب) إدانة المتهم تعني رفض (H0) أي أن هناك دليل كافي على أن المتهم مذنب، أما عدم رفض الفرضية (H0) فيعني انه لا يوجد دليل كافي لإدانة المتهم. وهنا نلاحظ أننا لم نقل بأننا قبلنا الفرضية الصفرية لان هذا يعني أن النتائج أثبتت أن المتهم برئ. 9

10 بناء على ما سبق تكون الفرضيات كالتالي:
الفرضية الصفرية Null Hypothesis (H0): تتضمن القيمة المفترضة لمعلمة المجتمع. يجب أن تتضمن إشارة التساوي (=). الاختبار يجري للفرضية الصفرية مباشرة. نتيجة الاختبار هي رفض الفرضية الصفرية أو عدم القدرة على رفضها. الفرضية البديلة alternative Hypothesis (H1): يرمز لها (H1 or Ha) وهي النقيض المنطقي للفرضية الصفرية ويكون لها ثلاث حالات : H1:≠ H1: < H1: > 10

11 كيفية تحديد كلاً من (H0 و H1)
لتحديد الفرضية الصفرية والفرضية البديلة باستخدام الرموز تمهيدا لإجراء الاختبار الإحصائي ينبغي الالتزام بالخطوات التالية: حدد الفرضية أو الادعاء المراد اختباره وذلك باستخدام الرموز. حدد باستخدام الرموز الفرضية المقابلة التي ينبغي أن تكون صحيحة إذا ما كانت الفرضية الأصلية أو الادعاء المراد اختباره في الخطوة سابقة خاطئ. بناء على الخطوتين السابقتين اجعل الفرضية التي لا تتضمن إشارة التساوي (=) هي الفرضية البديلة والتي ينبغي أن تتضمن احد الإشارات التالية (≠ ، <، >). اجعل الفرضية التي تتضمن إشارة التساوي هي الفرضية الصفرية 11

12 أمثلة على كيفية تحديد كلاً من (H0 و H1)
نسبة مبيعات الشركة في السوق المحلية أكبر من 0.5 متوسط أرباح المصارف العاملة في فلسطين لا يتجاوز 3 مليون دولار في عام 2008. الانحراف المعياري لودائع العملاء في المصارف الوطنية يساوي 20 مليون دولار. 12

13 1- نسبة مبيعات الشركة في السوق المحلية أكبر من 0.5
الفرضية أو الادعاء المراد اختباره بالرموز هو: (P > 0.5) حسب الخطوة الثانية إذا كانت الفرضية السابقة خاطئة فان الفرضية التالية ستكون صحيحة (النقيض المنطقي لها) وباستخدام الرموز ستكون كما يلي: ( p ≤ 0.5). حسب الخطوة الثالثة فان الفرضية التي لا تتضمن إشارة التساوي ستكون الفرضية البديلة والفرضية التي تتضمن إشارة التساوي ستكون الفرضية الصفرية كما يلي: H0: p ≤ 0.5 H1: P > 0.5 13

14 النقيض المنطقي للفرضية السابقة هو: ( μ > 3).
2- متوسط أرباح المصارف العاملة في فلسطين لا يتجاوز 3 مليون دولار في عام 2008. الفرضية أو الادعاء المراد اختباره في البحث هنا باستخدام الرموز هو: ( μ ≤ 3). النقيض المنطقي للفرضية السابقة هو: ( μ > 3). الفرضية التي تتضمن إشارة التساوي هي الفرضية الصفرية: ( μ ≤ 3) H0: والفرضية التي لا تتضمن إشارة التساوي هي الفرضية البديلة: ( μ > 3) H1: 14

15 النقيض المنطقي للفرضية السابقة هو: (σ ≠ 20 ).
3- الانحراف المعياري لودائع العملاء في المصارف الوطنية يساوي 20 مليون دولار. الفرضية أو الادعاء المراد اختباره في البحث هنا باستخدام الرموز هو: (σ = 20). النقيض المنطقي للفرضية السابقة هو: (σ ≠ 20 ). الفرضية التي تتضمن إشارة التساوي هي الفرضية الصفرية: (σ = 20) H0: والفرضية التي لا تتضمن إشارة التساوي هي الفرضية البديلة: (σ ≠ 20 ) H1: 15

16 احصاءة الاختبار (Test Statistic)
1– إذا كانت القيمة المحسوبة اكبر من القيمة الجدولية يتم رفض الفرضية الصفرية. 2- إذا كانت القيمة المحسوبة اقل من القيمة الجدولية يتم قبول الفرضية الصفرية. 16

17 مفهوم مستوى المعنوية the level of significance
يمكن توضيح مستوى المعنوية من خلال المثال التالي: شركة تنتج نوع معين من السيارات ادعت أن سياراتها توفر كثيرا في كمية الوقود وان متوسط المسافة التي تقطعها السيارة حوالي 60 ميل لكل جالون بنزين بانحراف معياري 10ميل لكل جالون. وقام الباحثون باختبار جميع السيارات المنتجة حيث وجدوا أن متوسط المسافة بلغ 61 ميل/جالون هل هذا الفرق معنوي (حقيقي) مقارنة بالمتوسط الذي حددته الشركة ؟ الإجابة نعم بالطبع. لماذا: لان الفرق مبني على الإحصاء الشامل لجميع السيارات ولا يوجد أخطاء معاينة يمكن أن يعزى لها هذا الفرق، وهذا يشير بشكل واضح أن متوسط المجتمع تغير من 60 ميل إلى 61 ميل. 17

18 المعنوية الإحصائية والمعنوية العملية practical & statistical significance
هل هذا الفرق معنوي من الناحية العملية (practical significance) ؟ إذا قرر خبراء السيارات أن ميل واحد فرق المسافة ليس له أهمية حقيقية نقول أن هذا الفرق ذات معنوية إحصائية ولكن غير معنوي من الناحية العملية. 18

19 الجواب: الأمر غير واضح ولا نستطيع التقرير لان لدينا احتمالين وهما:
ماذا لو أخذنا عينة عشوائية 25 سيارة من السيارات التي أنتجتها الشركة ووجدنا متوسط المسافة = 64 ميل|جالون هل هذا الفرق معنوي إحصائيا ؟ الجواب: الأمر غير واضح ولا نستطيع التقرير لان لدينا احتمالين وهما: أن الفرق معنوي إذا كان هناك سبب جوهري للاعتقاد بان متوسط المجتمع تغير لأعلى من 60 ميل | جالون. أن الفرق غير معنوي وان هذا الفرق يعزى لأخطاء المعاينة العشوائية (random sampling error). إذن مهمة الباحث هنا هي معرفة ما إذا كان هذا الفرق معنوي أم انه فرق ناجم عن أخطاء المعاينة ليس أكثر. وانجاز هذه المهمة يتم من خلال خطوات اختبار الفرضيات. 19

20 ومفهوم مستوى المعنوية (the level of significance): مرتبط بمفهوم الخطأ من النوع الأول والخطأ من النوع الثاني كما يلي: 1- الخطأ من النوع الأول (a type I error) : يحدث عند رفض الفرضية الصفرية وهي في الحقيقة صحيحة (إدانة الشخص وهو بريء). 2- الخطأ من النوع الثاني (a type II error): يحدث عند قبول الفرضية الصفرية وهي في الحقيقة خاطئة (تبرئة المتهم وهو في الحقيقة مذنب) . الجدول التالي يوضح النوعين من الخطأ 20

21 ويرمز للخطأ من النوع الأول (الفا α): وتمثل القيمة القصوى لاحتمال ارتكاب هذا الخطأ وهي نفسها التي يشار إليها بمستوى الدلالة الإحصائية (the level of significance) وتعني كلمة (الدلالة) أن الفرق بين القيمة النظرية لمعلمة المجتمع والقيمة المحسوبة للإحصائي المناظر من العينة فرق حقيقي وكبير بحيث لا يعزى لأخطاء المعاينة العشوائية. القرار الفرضية الصفرية صحيحة الفرضية الصفرية خاطئة القرار رفض خطأ من النوع الأول (significance level probability = α) القرار صائب (power of test probability = 1- β) القرار قبول (power of test probability = 1-α) خطأ من النوع الثاني (power of test probability = β) 21

22 أما الخطأ من النوع الثاني فيرمز له بالرمز (بيتا β):
وقيمة مستوى الدلالة يحددها الباحث ولكن الشائع في الدراسات الاجتماعية أن تأخذ القيم (0.01، 0.05) ويعني مستوى الدلالة (α= 0.05) انه إذا تكررت التجربة لعدد كبير جدا من المرات فمن المحتمل أن نرفض الفرضية الصفرية وهي في الواقع صحيحة خمس مرات من كل 100 مرة أي أن احتمال الوقوع في خطأ استنتاجنا هذا هو 5% وان استنتاجنا يكون سليما بثقة 95%. أما الخطأ من النوع الثاني فيرمز له بالرمز (بيتا β): وهي عبارة عن القيمة القصوى لاحتمال ارتكابه. وهذا الاحتمال لا يحدده الباحث بل يتم حسابه ويعتمد على خمسة عوامل وهي: القيمة الحقيقية لمعلمة المجتمع. قيمة (α) المختارة نوع الاختبار (ذات ذيلين أو ذيل واحد). الانحراف المعياري للعينة. حجم العينة. 22

23 والعلاقة بين النوعين من الخطأ (α، β) علاقة عكسية مع الأخذ بعين الاعتبار ما يلي:
لأي قيمة معينة محددة لألفا (α) فان زيادة حجم العينة يؤدي إلى نقصان الخطأ من النوع الثاني (β). عند ثبات حجم العينة عند مستوى معين فان تخفيض قيمة (α) يؤدي إلى زيادة قيمة (β) والعكس صحيح. تخفيض كلا النوعين من الخطأ يمكن أن يتم من خلال زيادة حجم العينة. بالإضافة إلى تطبيق إجراءات سليمة للمعاينة واستخدام طرق صحيحة ودقيقة لجمع البيانات لان ذلك يقلل من أخطاء البيانات والأخطاء العشوائية. 23

24 قوة الاختبار Power Of The Test:
قوة الاختبار هي عبارة عن قدرة الاختبار على رفض الفرضية الصفرية عندما تكون في الحقيقة خاطئة وتساوي: power of test = (1 – β) والخطأ من النوع الأول (إدانة المتهم وهو برئ) أكثر خطورة من الخطأ من النوع الثاني (تبرئة المذنب) . وبناءً على ما سبق بيانه من المصطلحات المستخدمة في اختبار الفرضيات يمكننا الآن حصر خطوات اختبار الفرضيات كما يلي: 24

25 خطوات اختبار الفرضيات:
يتم اختبار الفرضية الصفرية بإتباع عدة خطوات كما يلي: 1- تحديد الفرضية الصفرية والبديلة. 2- اختيار الاختبار الإحصائي الملائم (appropriate statistical test): ويوجد العديد من الاختبارات الإحصائية ولكن اختيار الاختبار المناسب يتم بناء على عدة معايير بحسب طبيعة البحث من هذه المعايير مثلاً: طبيعة سحب العينة (عشوائي أو غير عشوائي) طبيعة المجتمع (يتبع التوزيع الطبيعي أو لا) نوع القياس (اسمي، رتبي، فتري، نسبي) 3- تحديد مستوى الدلالة الإحصائية المناسب بحسب مدى المخاطرة النسبية للخطأين (الأول والثاني) بالنسبة للباحث. 25

26 4- حساب قيمة دالة الاختبار الإحصائي لاختبار الفرضية الصفرية بعد جمع البيانات من عينة الدراسة . وبافتراض أن هذه الفرضية صحيحة يحدد احتمال الحصول على فرق بين القيمة المشاهدة للمعلمة من خلال العينة والقيمة المفروضة لها من خلال الفرضية الصفرية، ويتم حساب هذا الاحتمال من خلال خصائص توزيع المعاينة النظري لدالة الاختبار الإحصائية المستخدمة. تحديد القيم الحرجة (critical test value): والتي بناء عليها يتم تحديد منطقة الرفض (region of rejection) ومنطقة القبول (region of acceptance) للفرضية الصفرية . 5- اتخاذ القرار: من خلال مقارنة القيمة المحسوبة (calculated value) من دالة الاختبار الإحصائي مع القيمة الجدولية أو الحرجة (critical value) عند مستوى الدلالة المحدد مسبقا. فإذا كانت القيمة المحسوبة اكبر من القيمة الجدولية يتم رفض الفرضية الصفرية أما إذا كانت اقل فيتم قبولها كما سبقت الإشارة إليه. مع الأخذ بعين الاعتبار هل الاختبار من طرف واحد أو من طرفين بحسب الفرضية البديلة (H1). 26

27 Two-tailed test: اختبار ذات الذيلين أو الطرفين
منطقة الرفض rejection region أو المنطقة الحرجة critical region: هي تلك المنطقة الذي إذا وقعت فيها قيمة دالة الاختبار الإحصائي فانه يتم رفض الفرضية الصفرية. القيم الحرجة Critical Value: يتم تحديدها بناء على قيمة (α) وعلى نوع توزيع المعاينة لدالة الاختبار (the sampling distribution) وهي التي تحدد كلاً من منطقة رفض الفرضية الصفرية ومنطقة قبولها. كما سبقت الإشارة إليه فان الفرضية البديلة لها ثلاث حالات (≠ ، <، >). وبحسب هذه الحالات هناك ثلاث أنواع اختبارات وهي: Two-tailed test: اختبار ذات الذيلين أو الطرفين Right (upper) -tailed test: اختبار ذات الذيل الأعلى أو الأيمن Left (lower) -tailed test: اختبار ذات الذيل الأسفل أو الأيسر والأشكال التالية توضح كيفية تحديد هذه الاختبارات: 27

28 28

29 29

30 30

31 تفسير قيمة p-value يمكن تفسير قيمة (p-value or sig-value) كما يلي:
إذا كانت قيمة (p-value < 0.01) فان هناك دليل كاسح على صحة الفرضية البديلة وخطأ الفرضية الصفرية وهنا يقال أن النتيجة معنوية بدرجة مرتفعة ( highly significance). إذا كانت قيمة ( < p-value < 0.05) فان هناك دليل قوي على صحة الفرضية البديلة وخطأ الفرضية الصفرية وهنا يقال أن النتيجة معنوية (significance). إذا كانت قيمة ( < p-value < 0.10) فان هناك دليل ضعيف على صحة الفرضية البديلة وخطأ الفرضية الصفرية وهنا يقال أن النتيجة غير معنوية (insignificance). إذا كانت قيمة (p-value > 0.10) فانه لا يوجد دليل على صحة الفرضية البديلة وخطأ الفرضية الصفرية. 31

32 مثال حدد نوع الاختبار في الحالات التالية من حيث كونه: (right – tailed test، left – tailed test، two– tailed test) ثم اوجد قيمة (p-value) ومن ثم حدد استنتاجك حول اختبار الفرضية الصفرية (H0). استخدم مستوى الدلالة ( 0.05 = α) لاختبار الادعاء بأن نسبة التالف في الإنتاج اكبر من 25% (P > 0.25). وقد بينت نتائج عينة أخذت من الإنتاج أن احصاءة الاختبار (1.18(Z = . استخدم مستوى الدلالة ( 0.05 = α) لاختبار الادعاء بأن نسبة التالف في الإنتاج لا يساوي 25% (P ≠ 0.25). وقد بينت نتائج عينة أخذت من الإنتاج أن احصاءة الاختبار (2.34(Z = . 32

33 حل الحالة الأولى: استخدم مستوى الدلالة ( 0
حل الحالة الأولى: استخدم مستوى الدلالة ( 0.05 = α) لاختبار الادعاء بأن نسبة التالف في الإنتاج اكبر من 25% (P > 0.25). وقد بينت نتائج عينة أخذت من الإنتاج أن احصاءة الاختبار (1.18(Z = . حيث أن الفرضية (P > 0.25) تعتبر فرضية بديلة إذن الاختبار هنا هو اختبار الذيل الأعلى أو الأيمن (right – tailed test). ووفقاً للشكل السابق (7-6) فان قيمة (p-value) تساوي المساحة التي على يمين قيمة احصاءة الاختبار (1.18(Z = ، وهذه المساحة نستطيع استخراجها من جدول التوزيع الطبيعي المعياري والتي تساوي (0.1190). وبناء عليه نقارن هذه القيمة بقيمة مستوى الدلالة ( 0.05 = α) نلاحظ أنها اكبر منها وبالتالي لا نستطيع رفض الفرضية الصفرية. 33

34 حل الحالة الثانية: استخدم مستوى الدلالة ( 0
حل الحالة الثانية: استخدم مستوى الدلالة ( 0.05 = α) لاختبار الادعاء بأن نسبة التالف في الإنتاج لا يساوي 25% (P ≠ 0.25). وقد بينت نتائج عينة أخذت من الإنتاج أن احصاءة الاختبار (2.34(Z = . حيث أن الفرضية (P ≠ 0.25) تعتبر فرضية بديلة إذن الاختبار هنا هو اختبار الذيلين (two– tailed test). وحيث ان قيمة احصاءة الاختبار (2.34(Z = تقع على يمين المركز (متوسط التوزيع) ووفقاً للشكل السابق (7-6) فان قيمة (p-value) تساوي ضعف المساحة التي على يمين قيمة z، وهذه المساحة نستطيع استخراجها من جدول التوزيع الطبيعي المعياري والتي تساوي (0.0096). وبناء عليه فان قيمة (p-value) تساوي ( = x) نقارن هذه القيمة بقيمة مستوى الدلالة ( 0.05 = α) نلاحظ أنها اقل منها وبالتالي نرفض الفرضية الصفرية. 34

35 صيغة نتيجة اختبار الفرضية الصفرية
هناك عدة صياغات تستخدم في البحوث والرسائل لنتائج اختبار الفرضيات الصفرية من هذه الصياغات: (نقبل الفرضية الصفرية: accept the null hypothesis) (لا نستطيع إثبات الفرضية الصفرية: we are not proving the null hypothesis). (بيانات العينة لا تعطي دليل كافي وقوي لرفض الفرضية الصفرية: the sample evidence is not strong enough to warrant rejection ) 35

36 الاستدلال الإحصائي للعينات (مستويات اختبار الفرضيات)
الاستدلال الإحصائي للعينات (مستويات اختبار الفرضيات) لوصف مجتمع (عينة) واحدة لمقارنة مجتمعين لمقارنة أكثر من مجتمعين لتحليل العلاقة بين متغيرين لتحليل العلاقة بين أكثر من متغيرين 36

37 أولا: الاختبارات المعلمية Parametric Tests
الاختبارات حول: عينة واحدة وعينتين وأكثر من عينتين 37

38 مقارنة الطرق المعلمية بالطرق غير المعلمية
الأساليب الإحصائية الاستدلالية تصنف إلى اختبارات بارامترية parametric tests واختبارات لامعلمية nonparametric tests. والاختبارات المعلمية: هي تلك الأساليب التي تتطلب الاستيفاء بافتراضات أو شروط معينة حول المجتمع الذي تسحب منه عينة البحث واهم هذه الشروط هي: شرط اعتدالية التوزيع normality وشرط تجانس التباين. الاختبارات اللامعلمية: فهي لا تضع أية افتراضات حول المجتمع الذي تسحب من العينة. فيما يلي جدول يوضح مقارنة الطرق المعلمية بالطرق اللامعلمية: 38

39 8 الرقم الطرق المعلمية parametric tests الطرق اللامعلمية
nonparametric tests 1 تصلح للعينات الكبيرة بشكل اساسي تصلح للعينات الكبيرة والصغيرة (مثلا اذا كان حجم العينة 6 او اقل فلا بديل عن استخدام الاختبارات اللامعلمية 2 يشترط توفر معلومات عن توزيع المجتمع لا يشترط افتراضات او معلومات حول توزيع المجتمع 3 تستخدم في التوزيعات المقيدة بالاعتدالية تستخدم في حالة التوزيعات الحرة غير المقيدة 4 تناسب البيانات الفترية interval والنسبية ratio تناسب البيانات الاسمية nominal والرتبية ordinal كما يمكن استخدامها في حالة البيانات الفترية والنسبية 5 تشترط تجانس التباين في المجتمعات التي تسحب منها العينات لا تشترط تجانس التباين 7 تعتبر أكثر قوة في رفض الفرضية الصفرية عندما تكون خاطئة عند توافر الشروط المطلوبة للاختبارات المعلمية تعتبر اقل قوة وتزداد قوة الاختبار اللامعلمي بزيادة حجم العينة 8 تستخدم جميع المعلومات في العينة لا تستخدم جميع المعلومات في العينة حيث أن الدرجات الخام يتم تحويلها إلى رتب ranks أو إشارات signs 39

40 اختبار الفرضيات المتعلقة بمجتمع واحد
إن الفرضية الصفرية في هذه الحالة هي عبارة عن تقدير لمعلمة المجتمع، ومن ثم يتم اختبار هذه الفرضية من خلال مقارنة الاحصاءة المناظرة للمعلمة والتي يتم حسابها من العينة، وهنا يطرح تساؤل حول مدى تمثيل العينة للمجتمع المسحوبة منه أي مدى انتماء العينة للمجتمع الذي سحبت منه العينة، ومن المعروف أن إحصائي العينة ليس بالضرورة أن يساوي معلمة المجتمع حيث انه إحصائيا قد يكون هناك فرق بين الإحصائي والمعلمة سواء بالزيادة أو النقصان وهذا الفرق يمكن تجاهله إحصائيا إذا كان فرقا ظاهريا وليس حقيقيا أو جوهريا وبالتالي ليس له خطورة على مدى تمثيل العينة للمجتمع. وفي هذه الحالة يمكن اعتبار متوسط العينة لا يختلف إحصائيا عن متوسط المجتمع وان العينة المسحوبة فعلا تمثل المجتمع وفي هذه الحالة نعتبر (µ= x). وفي بعض الحالات لا يمكن أن نتجاهل هذا الفرق ونعتبره فرق حقيقي أو جوهري (معنوي) ومسالة تحديد ما إذا كان الفرق معنوي أو غير معنوي ليست متروكة للتقدير الشخصي للباحث ولكن تبنى اعتمادا على الخصائص الأساسية للتوزيع العيني للمتوسطات 40

41 مثال1 عملي بالتطبيق على SPSS
البيانات التالية (ملف رقم 1) تمثل درجات عينة من 20 طالب في مساق الإحصاء بكلية التجارة بالجامعة الإسلامية والمطلوب هو اختبار ما إذا كان متوسط درجات الطلاب تساوي 65 درجة أم لا عند مستوى دلالة (α= 0.05). H0: µ = 65 H1: µ ≠ 65 النتيجة حيث أن قيمة sig المحسوبة (0.02) >0.05 إذن فهي معنوية إحصائيا ونستنتج رفض الفرضية الصفرية بان المتوسط يساوي 65 درجة. 41

42 42

43 اختبار الفرضيات حول الفرق بين وسطين hypothesis testing regarding the difference between two means
هناك الكثير من المواقف التي نرغب فيها بإجراء مقارنة بين مجتمعين. مثلا المقارنة بين أداء الذكور وأداء الإناث. هناك نوعين من البيانات في هذه الحالة: وهما البيانات المستقلة independent والبيانات المرتبطة أو غير المستقلة dependent حيث أن لكل منهما أسلوبه الخاص في التحليل الإحصائي. 43

44 أداء مجموعة من الذكور وأداء مجموعة من الإناث.
أولاً: اختبار الفرضيات حول الفرق بين وسطين لعينتين مستقلتين two independent samples t-test يقصد بالبيانات المستقلة تلك البيانات التي لا يوجد فيما بينها ارتباط ومن الأمثلة على ذلك: أداء مجموعة من الذكور وأداء مجموعة من الإناث. حجم الإنتاج في الفرع الأول وحجم الإنتاج في الفرع الثاني لمؤسسة صناعية. وبالتالي فان وسط العينة الأولى في المثالين السابقين (وسط الذكور، ووسط حجم الإنتاج في الفرع الأول) مستقل عن وسط العينة الثانية (وسط الإناث، ووسط الانتهاج في الفرع الثاني). والفرضيات تكون على الشكل التالي: Ho: μ1= μ2 H1: μ1≠μ2 or, H1: μ1< μ2 or, H1: μ1> μ2 و 44

45 وعندما تكون الفرضية الصفرية صحيحة فان توزيع المعاينة لفروق الأوساط يتخذ شكل توزيع t بدرجات حرية (n1+n2 -2) حيث أن: n1 تمثل حجم العينة الأولى و (n2) حجم العينة الثانية. ويكون وسط التوزيع مساويا صفر. وبالتالي فان اختبار t هو الاختبار المناسب ويستند هذا الاختبار إلى توفر عدد من الافتراضات وهي: 1- التوزيع الطبيعي Normality: وهذا الافتراض يفترض أن العينة الأولى عينة عشوائية مسحوبة من المجتمع الأول يتبع التوزيع الطبيعي بوسط وانحراف معياري: N(µ1, σ1)، كذلك العينة الثانية عينة عشوائية مسحوبة من المجتمع الثاني يتبع التوزيع الطبيعي بوسط وانحراف معياري كما يلي: N(µ2, σ2). 2- تجانس التباين في المجتمعين homogeneity: هذا الافتراض يفترض تساوي التباين في كلا المجتمعين أي أن: σ22 =σ21 3- الاستقلالية independence: وهذا الافتراض يفترض أن مشاهدات العينة الأولى قد تم الحصول عليها عشوائيا من المجتمع الأول بشكل مستقل عن مشاهدات العينة الثانية المسحوبة من المجتمع الثاني. 45

46 مثال2 عملي بالتطبيق على SPSS
البيانات المرفقة في ملف 2 تمثل درجات مجموعتين من الطلبة في مساق الإحصاء الأولى مكونة من 59 طالب والثانية مكونة من 28 طالبة. هل تعتقد بوجود فرق معنوي بين مستوى الطلبة في المجموعتين عند مستوى دلالة (0.05) ؟. Ho: μ1= μ2 H1: μ1≠μ2 النتيجة حيث أن قيمة sig المحسوبة للفرق بين الوسطين (0.767) <0.05 إذن فهي غير معنوية إحصائيا ونستنتج عدم رفض الفرضية الصفرية بان متوسط درجات الطلاب يساوي متوسط درجات الطالبات. 46

47 47

48 ثانياً: اختبار الفرضيات حول الفرق بين وسطين للعينات المرتبطة two paired sample t-test
يقصد بالبيانات المرتبطة: تلك التي يوجد فيما بينها ارتباط وينشأ هذا الارتباط عندما يجرى الاختبار على المجموعة نفسها مرتين كاختبار قبلي واختبار بعدي أي أن البيانات تكون على شكل أزواج وبالتالي لابد أن يتساوى حجم العينتين أي أن: n1=n2 في العينات المرتبطة. 48

49 مثال3 عملي بالتطبيق على SPSS
البيانات المرفقة في الملف 3 تمثل نتائج تجربة أجريت على 20 شخص لاختبار مدى فعالية نظام غذائي خاص لتخفيف الوزن حيث تم قياس أوزان هؤلاء الأشخاص قبل البدء بتطبيق هذا النظام وقياس أوزانهم بعد مرور 3 شهور من بدء تطبيق النظام. هل تستطيع أن تستنتج أن نظام الغذاء كان فعالاً في تخفيف الوزن عند مستوى دلالة (0.05)؟. Ho: μbefore = μafter H1: μbefore > μafter من خلال النتائج يتضح أن قيمة (p-value or sig) تساوي sig/2 في هذه الحالة وتساوي صفر وهي اقل من (0.05) وبالتالي نرفض الفرضية الصفرية ونستنتج أن النظام الغذائي كان فعالاً. 49

50 50

51 تحليل التباين Analysis Of VAriance ANOVA
تحليل التباين الأحادي يركز على دراسة تأثير عامل واحد له عدة مستويات وعند كل مستوى تكرر التجربة عدد من المرات. مثال: اختبار ما إذا كان هناك فروق بين ثلاثة أساليب للإنتاج ويكون المطلوب هو معرفة ما إذا كانت هذه الأساليب الثلاثة لها تأثيرات متساوية على حجم الإنتاج أم لا. وبالتالي فالانحراف الكلي المشاهد ينقسم لمركبتين: الأولى ناتجة عن تأثير العامل (factor or treatment) (أسلوب الإنتاج) الثانية ناتجة عن الخطأ التجريبي. 51

52 مثال4 عملي بالتطبيق على SPSS
ملف البيانات 4 عبارة عن درجات مجموعة من الطلبة تم تدريسهم مساق الرياضيات بثلاثة طرق مختلفة وهي: M1، M2، M3، هل هناك فرق بين الطرق التدريس الثلاثة في تحصيل الطلاب ؟ عند مستوى دلالة (0.05) H0: μ1= μ2= μ3 H1: At least one mean is different من خلال النتائج يلاحظ أن قيمة F معنوية إحصائيا (sig = 0.014) وهي اقل من 0.05 وبالتالي نرفض الفرضية الصفرية ولمعرفة أي طرق التدريس التي كانت أفضل يتم استخدام اختبار بنفروني او شيفيه من post-hoc كما يلي: يلاحظ أن الفرق كان بين الطريقة الثانية والثالثة حيث أن قيمة Sig بلغت وهي معنوية ويتضح أن الطريقة الثالثة في التدريس هي الأفضل (وضح لماذا ) 52

53 53

54 54


Download ppt "Data Analysis and Interpretation"

Similar presentations


Ads by Google