Presentation is loading. Please wait.

Presentation is loading. Please wait.

Data Analysis Introduction To Online Education BIT

Similar presentations


Presentation on theme: "Data Analysis Introduction To Online Education BIT"— Presentation transcript:

1 Data Analysis Introduction To Online Education BIT

2 يتم تحصيل المعلومات بعدة طرق: من الاستطلاعات والاستمارات، ومن المخططات ومن التجارب، أو من سلسلة من عمليات القياس. ويتم تحليل المعطيات بمجرد الإنتهاء من تجميعها، حيث يصبح بالإمكان جدولة هذه المعطيات الكمية وتلخيصها، وتحويلها إلى مخططات، كما يمكن تصنيف المعطيات النوعية ومراجعتها للتوصل إلى نقاط مشتركة.

3 المراحل الأساسية في تحليل المعطيات:
تحضير البيانات للتحليل. تحليل البيانات الأولية (التقنيات). العلاقات المتبادلة بين المتحولات وتقاطع فئاتها(Correlation and CrossTabs). التحليل الاحصائي واختيار الأنسب.

4 تحضير المعطيات للتحليل:
يجب اتباع منهجية علمية في التحليل وفق التسلسل التالي: المراجعة الترميز التصنيف التصحيح الاحصائي التفسير

5 مراجعة الاستمارات: تهدف مراجعة الاستمارات تنظيف البيانات إلى:
تصحيح الأخطاء (خطأ المستجوب - نسيان) استبعاد الاستمارات المشكوك في جدية المعلومات الواردة فيها (عدم تعاون المستجوب) استبعاد الاستمارات التي تكون فيها الإجابات متناقضة (عدم الانسجام) تنقيح المعلومات والتأكد من صحتها التأكد من وضوح الإجابات الخاصة بالأسئلة المفتوحة

6 الترميز Coding: تهدف عملية ترميز المعلومات (الأجوبة) إلى تسهيل عملية تصنيف الإجابات مما يساعد على تفريغها في جداول احصائية، حيث يتم وضع رمز بجانب كل اجابة. مثال: في أسئلة من نمط صح/خطأ يتم ترميز الإجابة صح بالرمز 1 والإجابة خطأ بالرمز 0 . ويتم ترميز المعايير الكمية مثلاً العمر : Age.

7 التصنيف Classification:
بعد عملية الترميز يجب تصنيف المعلومات وتحويلها ما أمكن لأرقام ووضعها في مجموعات نوعية وإحصاء عدد أفراد كل مجموعة ونسبتهم... ويمكننا التمييز بين نوعين من المعطيات: المعطيات الكمية المعطيات النوعية

8 1. المعطيات الكمية: هي قياسات لظواهرمعينة ويتم تمثيل هذه المعطيات بعدة مقادير رقمية.
مثال: أطوال البشر،عدد الكتب على كل من رفوف المكتبة. ويقسم هذا النوع من المعطيات إلى: - معطيات منفصلة: حيث يمكن تهيئتها بشكل دقيق كما يمكن إيجادها بالعد. مثال ذلك: عدد الأطفال في عائلة ما؛ - معطيات مستمرة: والتي يمكن التوصل إليها بالقياس ولا يمكن تهيئتها بشكل دقيق. مثال ذلك: الزمن الذي يستغرقه القيام بمهمة ما.

9 في شركة نقل جوي نريد دراسة اعمار المسافرين
النسبة العدد التفريغ فئة العمر 7% 7 ||||||| أقل من 18 سنة 18% 18 ||||| ||||| ||||| ||| من 19 إلى 30 20% 20 ||||| ||||| ||||| ||||| من 31 إلى 40 25% 25 ||||| ||||| ||||| ||||| ||||| من 41 إلى 50 30% 30 ||||| ||||| ||||| ||||| ||||| ||||| 51 فأكثر 100% 100 المجموع مثال تطبيقي: في شركة نقل جوي نريد دراسة اعمار المسافرين وبفرض وجود 100 استمارة يمكن استخدام الجدول المرافق لتفريغ المعلومات الخاصة بسؤال العمر:

10 2. المعطيات النوعية: تعبر عن وجود صفة معينة يشترك بها بعض مفردات العينة وهي معطيات غير رقمية تقيس واصفات مختلفة. مثال: الوضع العائلي(متزوج، عازب،...)، المستوى التعليمي (ابتدائية ، اعدادية،...).

11 النسبة العدد التفريغ المستوى التعليمي 5% 5 ||||| ابتدائية 7% 7 ||||| || اعدادية 33% 33 ||||| ||||| ||||| ||||| ||||| ||||| ||| ثانوية 25% 25 ||||| ||||| ||||| ||||| ||||| معهد 30% 30 ||||| ||||| ||||| ||||| ||||| ||||| جامعة 100% 100 المجموع مثال تطبيقي: في شركة نقل جوي نريد أن نعرف المستوى التعليمي للمسافرين من خلال سؤال مغلق من خمسة خيارات : ابتدائية – اعدادية – ثانوية –معهد – جامعة وبفرض وجود 100 استمارة يمكن استخدام الجدول المرافق لتفريغ المعلومات الخاصة بهذا السؤال:

12 تصحيح البيانات احصائيا:
اجراء عمليات التثقيل لاعطاء اجابة ما أهمية أكثر من غيرها، تجميع أو تعديل المتغيرات، المعايرة، اعادة تشكيل بعض المتحولات وخاصة المقاييس الوصفية. مثال: هل من الضروري الاحتفاظ بالدخل الشهري كأرقام فردية أم يفضل تجميعها في مجالات أو فئات: أقل من 5000 ل.س ، بين 5 و 10 آلاف، بين 10 و15 ألف ، أكبر من 15 ألف.

13 تفسير المعلومات Interpretation:
يقوم الباحث من خلال تحليل الأجوبة باستخلاص المعلومات المتعلقة بالوضع المدروس(الأسباب وطرق المعالجة) ووضع التوصيات التي يقدم الباحث من خلالها الترجمة العملية لنتائج الاستبيان أي ما يبنى على هذه النتائج من استنتاجات تأخذ شكل مقترحات لاتخاذ قرارات وإجراءات مستقبلية . ويجب أن ترتبط هذه الاستنتاجات بشكل واضح بما تنص عليه الأهداف الرئيسية من إجراء المسح الاستبياني.

14 تقنيات تحليل البيانات الأولية:
بعد تفريغ الإجابات كمؤشرات رقمية مختلفة على شكل أعداد ونسب مئوية وقيم قياس ودرجات وغيرها، يمكن عرض هذه النتائج باستخدام أدوات مختلفة تأتي التخطيطات البيانية كأفضلها لتليها الجداول ثم النصوص. أما أفضل طريقة لتنسيق العرض فتتم بالاقتصار على عرض نص كل سؤال من أسئلة الاستبيان ومن ثم الاستعاضة عن احتمالات الأجوبة التي كانت موجودة تحته في الاستبيان بنتائج تلك الأجوبة. ومن أهم تقنيات التحليل: الرسوم البيانية Histogram. الإحصائيات الوصفية. مقارنة متوسطات لعينات مختارة أو نسب مئوية.

15 أمثلة على عرض نتائج بعض أنماط الأسئلة
النمط أحادي الإجابة: حدد أي نوع من الاتصال تستخدم: النمط متعدد الإجابة: حدد أهداف استخدامك للإنترنت:

16 النمط ذو الإجابة الرقمية المفتوحة:
كم أنفقت على الاتصال في الشهر الماضي؟

17 النمط ذو الإجابة النصّية المفتوحة:
اشرح باختصار مشاكل الاتصال التي تواجهك؟ النمط ذو الإجابة التقديرية: كيف تقيم هذه الخدمة:

18 النمط ذو الإجابة التوافقية:
إلى أي حد تؤيد كل من الاقتراحات التالية؟

19 الاحصائيات الوصفية: تتضمن الدراسة الوصفية استخدام المؤشرات الاحصائية الرقمية: النزعة المركزية التشتت كما تتضمن شكل التوزيع الاحصائي ومقاربة التوزيع الطبيعي.

20 النزعة المركزية: سنستخدم العينة التالية في الأمثلة
32،43،23،13،12 الوسيط: يتم حسابه بترتيب العينة تصاعديا ثم إذا كان عدد عناصر العينة n فرديا فهوM=X(n+1)/2 و إذا كان n زوجياً فهو2 /M=(Xn/2+X1+n/2) وفي العينة السابقة M=23 المتوسط الحسابي: مجموع عناصر العينة على عددها. مثال: لدينا العينة: 12و13و23و43و Average=( ) /5= المنوال : القيمة الأكثر تكراراً . في العينة التالية : 24،23,9,15،97,23،7,3،7،23 المنوال هو 23

21 مثال العينة: 15و21و17و4و13و33 المدى= 33- 4= 29 التشتت:
المدى: W=|max – min| مثال العينة:  15و21و17و4و13و33 المدى= 33- 4= 29 الربيعات: Q1 القيمة التي يقع 25% من الملاحظات أقل منها Q2 القيمة التي يقع 50% من الملاحظات أقل منها Q3 القيمة التي يقع 75% من الملاحظات أقل منها الانحراف المعياري: هو الجذر التربيعي للتشتت. التشتت:2 /n S2=sum (Xi-Average) حيث n عدد عناصر العينة و i تأخذ القيم بين 1 و n.

22 العلاقات المتبادلة بين المتحولات:
باعتبار أن جميع المعايير كمية نقوم بدراسة مؤشرات الترابط الخطي بين كل متحولين وهو ما ندعوه مصفوفة الترابط الخطي بين المعايير Correlation Matrix ولنستطيع الحكم على متحولين أنهما مترابطين خطيا يجب أن تكون قيمة معامل الترابط R قريبة من الواحد بالقيمة المطلقة فإن كانت الاشارة موجبة فإن المتحولين يتغيران بنفس الاتجاه(تناسب طردي) أما إذا كانت سالبة فإن المتحولين يتغيران باتجاهين متعاكسين(تناسب عكسي) وقيمة R هي التي تعكس مدى الترابط هل هو قوي أو ضعيف أو معدوم.

23 الدراسة الاحصائية نميز في الدراسة الاحصائية لتوصيف وتحليل البيانات ثلاث حالات: 1- دراسة متحول احصائي وحيد مثال: دراسة أعمارالمشاركين في دورة تدريبية من حيث توزعها الاحتمالي، مؤشرات النزعة المركزية(المتوسط،الوسيط،..)، مؤشرات التبعثر(الانحراف المعياري، المدى،..) أو دراسة المتحول بحسب فئات معينة ومقارنتها.

24 الدراسة الاحصائية 2. دراسة متحولين بنفس الوقت: و بشكل الخاص الترابط الممكن وجوده بينهما، مثلاً دراسة العلاقة بين العمر والدخل من حيث التقاطع بين فئات الأول وفئات الثاني وقوة الارتباط(الخطي أو غير الخطي) بينهما، ويمكن تمثيل العلاقة بيانياً على محورين (تمثيل على مستوي). 3. دراسة عدة متحولات بنفس الوقت: وغالباً ما تتم دراسته ضمن اطار ما يدعى بتخفيض عدد المعطيات Data Reduction لأن تمثيل العلاقة بين عدد كبير من المتحولات على مستوي سيؤدي لحصول تشوهات لذا يجب البحث عن أبعاد جديدة تلخص أكبر كمية من المعلومات وذلك طبعاً في حالات وجود ارتباطات بين المتحولات الأصلية.

25 تخفيض عدد المعطيات Data Reduction:
تصعب الإحاطة بالعدد الكبير من المتحولات المدروسة لذلك نلجأ لتخفيضها إلى عدد أقل يشرح أكبر كمية ممكنة من المعلومات المتوفرة في البيانات الخام.

26 بعض أهم التوابع الاحصائية المستخدمة:
MIN القيمة الصغرى MAX القيمة العظمى Average المتوسط الحسابي Correlation الترابط الذاتي standard deviation الانحراف المعياري

27 أدوات التحليل تتألف مرحلة التحليل من عدد من الخطوات:
التخطيط لمشروع تحليل المعطيات؛ تجميع المعطيات؛ تحليل المعطيات. هناك طيف واسع من البرمجيات التي تساعد في عملية تحليل المعطيات، وفيما يلي عرض موجز لبعض من هذه البرمجيات: الجداول الرقمية في برنامج Microsoft Excel SPSS برنامج

28 استخدام الجداول الرقمية في عمليات التحليل الإحصائية
يعتبر برنامج Microsoft Excel أحد أكثر برامج الجداول الرقمية استخداماً، وأحد ميزاته الهامة هو توافره على معظم الحواسيب الشخصية. إلا أنه يجب أن تأخذوا بعين الاعتبار أن الجداول الرقمية محدودة في مجال التحليل الإحصائي. فمثلاً, هناك نقص في بعض العمليات، كالرسوم الصندوقية, والرسوم البيانية النسيجية الحقيقية، والإحصائيات التي ليس لها معاملات.

29 فيما يلي عرض موجز لميزات التحليل الإحصائية الأساسية التي يتمتع بها برنامج :Excel التعامل مع المعطيات - المخططات البيانية - التوابع - البرمجيات المساعدة - الدعم البرمجي

30 التعامل مع المعطيات إن السبب الرئيسي لاستخدام Excel في الأعمال الإحصائية هو سهولة إدخال المعطيات وتعديلها فيه، بل ويمكن جلب المعطيات بسهولة من التطبيقات والبرامج الأخرى. هذا، ويعتبر Excelجيداً في التعامل مع قوائم المعطيات, فمثلاً، يمكن عرض نتائج مسح معين على شكل جداول يمكنها إظهار عددياً، والإحصائيات الملخصة للمعطيات، كالمتوسط, والحد الأدنى, والحد الأعلى، والانحراف المعياري. ويمكن استخدام أدوات الفرز لعرض المعطيات التي تحقق معايير محددة. إضافة، يمكن استخدام عدة وريقات عمل مع بعضها البعض ضمن مصنفات Excel, مما يمكّن من توليد جداول رقمية ثلاثية الأبعاد. بالإمكان تخزين عدة مجموعات من المعطيات في وريقات منفصلة في نفس مصنف العمل, بالإضافة إلى المخططات والجداول.

31 التعامل مع المعطيات (تتمة)
من الميزات الأخرى الجداول المحورية، أو Pivot Table، وهناك الأدوات المساعدة في توليد المخططات التي تساعد في توليد جداول الإحصائيات الملخصة والمخططات, والتي تقسم حسب العوامل المختلفة ذات الصلة, والتي يمكنها أن تشكل أساس التقارير النصية. يمكن تجربة المعطيات الزمنية وخطوط التوجيه بيانياً مع التوابع الخطية, والتوابع كثيرة الحدود, والتوابع اللوغاريتمية, والتوابع الأسّية، والتوابع متغيرة المعدل.

32 المخططات البيانية يتمتع Excel باحتواءه على مجال واسع من المخططات, على أنه لا يمكن تنفيذ بعض المخططات الإحصائية، كالرسوم الصندوقية. يمكن رسم الرسوم البيانية النسيجية فقط على الفترات متساوية الصفوف، وتتوضع حدود الصفوف عند النقاط الوسطى، إلا أنه يتوافر خيار الرسم البياني الخطي لوصل النقاط ببعضها بمنحنيات ناعمة. ترتبط المعطيات والمخططات ببعضها البعض، مما يساعد على تغيير المخططات بشكل ديناميكي عند حدوث أي تغيير في المعطيات الأصلية.

33 التوابع تتوافر في Excel العديد من التوابع الإحصائية، وتتضمن مجموعة التوابع هذه جميع توابع الإحصاءات الوصفية وبعض التوابع الأقل استعمالاً، وهناك توابع خاصة للقيام بعمليات التحليل الإنكفائية، على أن استخدام بعضها قد يكون صعباً. ليس هناك من حاجة لتذكر اسماء وصيغ هذه التوابع، فأداة المساعدة الخاصة بالتوابع تقوم بطلب مختلف المعاملات، وتقوم بعد ذلك بتنفيذ التابع المطلوب على الخلايا التي تم انتقاؤها.

34 البرمجيات المساعدة يتضمن برنامج Excel عدد كبير من البرمجيات المساعدة، ويمكن استخدام بعض هذه الأدوات لتحليل المعطيات، مثل Analysis Toolpak, Report Manager و Solver، إلا أن هناك بعض النقاط السلبية في هذه البرمجيات المساعدة. إن إثنتين من أهم فوائد الجداول الرقمية هما: القدرة على فحص الخلية ومعرفة الصيغة التي ولدتها، وتحديث الخلايا والمخططات بشكل آلي عند حدوث أي تغيير في المعطيات. وعند استخدام البرمجيات المساعدة, تبقى الفوائد والميزات متوافرة، إلا أن هذا الاستخدام يؤدي إلى توليد خرج لايستند إلى الصيغ، وبالتالي لا يتوافر أي دليل أو مؤشر حول كيفية حسابه.

35 الدعم البرمجي تساعد أداة التعليمات Help على البحث عن موضوع معين، فإذا لم يتم حل المشكلة بوساطة هذه الأداة، فإن المزيد من التعليمات المساعدة يتوافر في قاعدة المعرفة, والتي هي بمثابة قاعدة معطيات ضخمة تحوي ملاحظات مفيدة. تعد هذه الأداة مفيدة للغاية، ويمكن الوصول إليها والحصول على المعلومات منها على موقع Microsoft على الويب.

36 التحليل الاحصائي في Excel
يمكن استخدام Analysis ToolPak لانجاز عمليات التحليل في اكسل و أهمها حساب مصفوفة الترابط الخطي Correlation Matrix وأيضاً يمكن تطبيق عدد كبير جدا من التوابع الاحصائية المعروفة باستخدام اكسل.

37 Opening the ToolPak, Excel’s data analysis add-in
go to ‘Tools’ -> ‘Add-Ins’ choose ‘Analysis ToolPak’ and click ‘OK’

38 ‘Tools’اذهب إلى قائمة ثم ‘Data Analysis’ ثم اختر Correlation

39 Correlation analysis this window allows you to
define the variables you want to correlate you will correlate all your census variables to get a full correlation matrix the ‘Input Range:’ box defines the columns in the spreadsheet you want to run the correlation on. click in this box and then with the mouse select all the columns of census data check the ‘Labels in First Row’ box as well. make sure the ‘New Worksheet Ply:’ option is checked and call it ‘correlation’ and then click on ‘OK’

40 Correlation analysis هل A,B مرتبطان خطيا

41 يمكن جعل اكسل يعطيك أفضل منحني يمر
بين مجموعة نقاط مبعثرة لانجاز ذلك اختر النقاط على المخطط اضغط بالزر اليميني للفأرة و اختر ‘Add Trendline’ ثم type ثم linear ثم ok .

42

43 برنامج SPSS يعتبر برنامج SPSS برنامجاً خاصاً لتحليل المعطيات يستخدم الوحدات البرمجية فيه، على أنه مكلف بعض الشيء، حيث يتوجب شراء كل وحدة بمفردها. هناك وحدات برمجية لكل مراحل عملية المعالجة: - التخطيط للمشروع؛ - تجميع المعطيات؛ - الدخول إلى المعطيات؛ - تحضير المعطيات وإدارتها؛ - تحليل المعطيات؛ - إصدار التقارير ونشرها.

44 تستخدم كل مرحلة من مراحل عملية المعالجة وحدات برمجية من SPSS مضافة ومتكاملة مع بعضها البعض. وفيما يلي ملخص عن الوحدات المستخدمة في مرحلة التحليل:

45 إعداد التقرير النهائي:
يجب على التقرير النهائي أن يتسم بالدقة والوضوح حسب التسلسل التالي: الصفحة الأولى: عنوان الدراسة وتاريخ انجازها واسماء المساهمين فيها الفهرس المقدمة: عرض المشكلة وأهداف الدراسة ملخص عن التقريروخاصة عن النتائج عرض منهجية البحث(جمع المعلومات ومعالجتها وتحليلها) عرض نتائج الدراسة استنتاجات ومقترحات ملحقات كما يجب التنويه إلى أن جودة الدراسة لا تقاس بحجمها وبأن الجداول والرسومات البيانية تعتبر طريقة سريعة وفعالة في عرض المعلومات والأفكار.


Download ppt "Data Analysis Introduction To Online Education BIT"

Similar presentations


Ads by Google