Presentation is loading. Please wait.

Presentation is loading. Please wait.

جامعة الملك سعود – المملكة العربية السعودية

Similar presentations


Presentation on theme: "جامعة الملك سعود – المملكة العربية السعودية"— Presentation transcript:

1 جامعة الملك سعود – المملكة العربية السعودية
تحويل البيانات جامعة الملك سعود – المملكة العربية السعودية

2 التحويلات Transformations
قبل معالجة البيانات احصائيا يجب التأكد من بعض خصائص البيانات حتى يمكن اختيار الأسلوب المناسب للتعامل معها. من المعروف ان التحليل الاحصائى للبيانات يعتمد اساسا على مجموعة من الاختبارات الاحصائية، ويمكن بصفه عامه تقسيم هذه الاختبارات الى نوعين أساسيين هما: الاختبارات المعلميةParametric Tests الاختبارات اللامعلميه Non-Parametric Tests حيث يفضل التعامل مع الاختبارات المعلميه اذا كانت شروطها مستوفاه لأنها أقوى. فمن أحد الشروط الهامه التى تعتمد عليها أغلب الاختبارات المعلميه هى أن تكون البيانات لها التوزيع الطبيعىNormal Distribution . اذا لم يتحقق هذا الشرط فبتطبيق الاختبارات المعلمية تكون النتائج خاطئة وغير مجديه وكثيرا من مستخدمى الحزمة لا يلتفتون لهذا الفرض مما يؤدى لنتائج وتفسيرات خاطئة. اذا لم يتحقق هذا الفرض فيمكن أن نلجأ لأحدى الطريقتين: تحويل البيانات التى لا تتوزع طبيعيا لبيانات طبيعية عن طريقة قائمة Transform استخدام اختبار لا يعتمد على هذا الشرط باستبدال الاختبار المعلمى باحد الاختبارات اللامعلمية.

3 ايضا من اسباب استخدام قائمة Transform هو ان التعامل مع البيانات اللفظيه يكون صعب ومكلف فيمكن التغلب على ذلك بتكويد (ترميز) البيانات عن طريق قائمة Transform لذا فاننا سوف نتعامل فى هذا الدرس مع القائمة Transform لما لها من أهمية. قائمة Transform سوف نهتم فى هذا الدرس بكيفية اجراء بعض العمليات وذلك باستخدام قائمة Transform وتللك العمليات هى: انشاء متغير جديد الترميز احلال ( استبدال) القيم المفقوده بقيم اخرى ترتيب الحالات انشاء سلسله زمنيه عد الحالات التى تحتوى على قيم معينه

4 3-1 انشاء متغيرات جديده Create New variables
يمكن انشاء متغيرات جديده باستخدام المتغيرات الموجوده فى الملف النشط عن طريق بفتح الملفdata4.sav من قائمة Transform نختار Compute

5 3- تظهر شاشة جديده بعنوان Compute Variable: تنقسم الى عدة اجزاء هى
اسم المتغير الجديد مستطيل التعبير الرياضى 3- تظهر شاشة جديده بعنوان Compute Variable: تنقسم الى عدة اجزاء هى اسم المتغير الجديد مستطيل التعبير الرياضى المستخدم لحساب قيمة المتغير الجديد الآله الحاسبة مستطيل الدوال الاله الحاسبه مستطيل الدوال المتغيرات الموجودة بالملف الشرط اللازم توافره لاجراء العمليه

6 (أ) إنشاء متغير جديد بدون قيد
اذا اردنا حساب الدخل السنوى لجميع الأشخاص فى الملف data4.sav نكتب اسم المتغير الجديد وليكن incomey ونضغط على Type and Label ونحدد النوع ونكتب income in year فى خانة Label ونختار continue ثم ننقل المتغير income فى خانة Numeric expression وباستخدام الآله الحاسبة نضرب المتغير فى الرقم12 وهو عدد شهور السنة ثم نضغط Ok سوف نعود للملف data4.sav وقد اضاف متغير جديدincomey يحتوى على قيم income السنويه

7 الدخل الشهرى الدخل السنوى

8 (ب) إنشاء متغير جديد باستخدام شرط
اذا اردنا حساب الدخل السنوى لجميع الأشخاص فى الملفdata4.sav والذين لديهم أقل من طفلين ننفذ نفس الخطوات السابقة مع اختلاف اننا سوف نكتب اسم المتغير الجديد وليكن incomey2 وسوف نحدد الشرط الذى ينطبق على الحالات التى سينفذ عليها التعبير الحسابى بالضغط على خانة If

9 سوف تظهر شاشة جديده بعنوان Compute variable: If Cases نجد أن include all cases هى المحدده فنختارInclude if Case satisfies condition ثم نحدد الشرط ونظغط Continue

10 نعود للشاشه السابقه ثم نضعط Ok فنعود للملف data4.sav

11 لاحظ تلك الأعمده

12 فيمكن استخدام الأمر Compute لتنفيذ كثيرا من العمليات وبنفس الطريقة السابقة.

13 3-2 الترميز Recode (أ) دمج بيانات كثيرة لمتغير مستمر
فى كثير من الاحيان قد نحتاج الى عمليه التكويد ( الترميز) وذلك بتعديل قيم البيانات وتغيرها من بيانات لفظيه الى بيانات كميه بغرض تسهيل التعامل معها وبذلك نخصص مساحة اقل لتخزينها فى ذاكرة الحاسب المؤقته. واحيانا يتم تكويد البيانات الرقميه المستمره لسهوله عرضها والتعامل معها ويمكن تكويد البيانات فى الحالات التاليه: (أ) دمج بيانات كثيرة لمتغير مستمر اذا كان لدينا درجات 70 طالب فى احد المواد كالاتى: 0, 25, 5, 40, 17, 29, 14, 38, 15, 10, 11, 35, 13, 18, 9, 34, 16, 19, 21, 7, 13, 11, 34, 35, 23, 18, 16, 18, 24, 22, 14, 24, 13, 16, 25, 25, 19, 20 23, 26, 27, 28, 30, 13, 17, 15, 25, 26, 27, 21, 26, 29, 31, 32, 30, 32, 31, 34, 9, 8,7, 8, 23,6, 5, 2, 5, 12, 15, 17. ونريد تلخيص هذه البيانات فى جدول تكرارى مكون من اربعة فئات0- , 10- , 20- , فتسمى عمليه جدوله البيانات المستمرة بالتكويد.

14 بوضع البيانات فى ملف data5.sav باسم المتغير X
من قائمة Transform نحتار Recode يظهر اختيارين هما (i) Into the same Variables: وهى استبدال القيم الحالية بالقيم الجديده بعد التكويد (ii) Into Different Variables: وهى وضع القيم الجديده تحت متغير جديد والحفاظ على المتغير الأصلى بالنقر على الاختيار الثانىinto different Variables سوف تظهر شاشة جديدة بعنوان Recode into Different Variables وننقل المتغير X

15 4. نحدد اسم المتغير الجديد فى خانة Output Variable ونحدد label ان وجد ثم نضغط علىChange

16 5. ثم نضغط على Old and New Values فتظهر الشاشة التالية الاختيار الأول Values تستخدم اذا اردنا تكويد متغير لفظى الاختيار الثانى Range تستخدم اذا اردنا تكويد متغير عددى مستمر 6. فباختيار Range يتم تنشيط خانتى Range فى قائمة Old Value 7. فنكتب بداية ونهاية الفتره (المدى) 8. فى قائمة New Value نختار Value ونكتب بها مركز الفئة ( منتصف الفترة) ثم نختار Add لكى تستبدل القيم التى تقع فى هذه الفترة بمركز الفترة. 9. ثم نكرر هذه العملية لكل الفئات (الفترات) الموجودة

17 10. ثم نختار Continue نعود للشاشة السابقة (لاحظ الاختيارIf ) 11
10. ثم نختار Continue نعود للشاشة السابقة (لاحظ الاختيارIf ) 11. نضغط علىChange لتنفيذ عملية التكويد 12. ثم نختار Ok فنعود للملف data5.sav وقد تم إنشأ متغير جديد يحتوى على مراكز الفئات التى يقع فيها العنصر المقابل للمتغير الأصلى

18 (ب) تكويد متغير لفظى الى متغير رقمى
بفتح الملف data2.sav ونرغب فى تكويد النوع gender الى الرقمين 0, 1 حيث 0 تعنى female وايضا 1 تعنى male من قائمة Transform نختارRecode ثم نختار into Different Variable ثم ننقل المتغير gender ونكتب فى خانةOutput Variable الأسم الجديد وليكن gender1

19 6. ونكتب فى خانة New Value القيمة 0 ثم نضغط Add وهكذا مع Male
5. ثم نضغط على Old and New Value من قائمة Old Value نختار Value ثم نكتب Female 6. ونكتب فى خانة New Value القيمة 0 ثم نضغط Add وهكذا مع Male 7. ثم نختار Continue 8. نعود للشاشة السابقة نختارChange ثم نضغطOk نعود للملف data2.sav وينشا متغير جديد gender1 محتواه 0,1

20 (ج) التكويد الاتوماتيكى
1- بفتح الملف data4.sav 2- من قائمة Transform نختار Automatic Recode 3- تظهر شاشة جديدة نحدد فيها المتغير المراد تكويده وليكن Gender واسم المتغير الجديدgender1 4- ثم نضغط Add new Variable لكى يضيف المتغير gender1 لملف البيانات data4.sav ويحدد قيمه 5- ثم نضغط على Ok

21 6- سوف يعود للملفdata4.sav وقد قام بتكويد البيانات تبعا للنوع حيث الرقم 1 يناظر female والرقم 2 يناظر Male

22 3-3 استبدال القيم المفقوده بقيم اخرى Replacing Missing Values
عند التعامل مع القيم المفقوده احصائيا عن طريق حزمة SPSS سوف تتعامل معها على انها غير موجوده ولن تؤخذ فى الاعتبار عند العرض والتحليل. فأحيانا نرغب فى وضع قيما تقديريه للقيم المفقودة وبذلك تؤخذ فى الاعتبار عند المعالجة الاحصائية. وتوجد عدة طرق احصائية تستخدم لتحديد القيم المفقوده واستبدالها عن طريق وسط العينه أو وسط القيم المجاوره وسيط العينة أو وسيط القيم المجاوره الاستكمال الخطى حيث تستخدم القيم القبليه والبعديه للقيم المفقوده فى تقدير القيم المفقوده استخدام معادلة الخط للعينه فى تقدير القيم المفقوده اذا كان لدينا ملف data4.sav ويحتوى متغير الدخل على قيم مفقودة وهى القيم المحصورة بين ونريد استبدالها

23

24 (أ) استبدال القيم المفقوده بقيمة محدده ( وليكن 400)
من قائمة Transform نختار Recode نختار Into Same Variable ننقل المتغير الى قائمة Variable نضغط على Old and New Values فى مربع Old Value نختارSystem – or user missing فى مربع New Value نكتب القيمة المراد التى تستبدل بها القيم المفقوده نضغط Add ثم Continue ثم نختار Ok

25 لقد تم استبدال جميع القيم التى تقع فى الفترة 1000-2000 والتى تعتبر قيم مفقوده بالقيمة 400

26 (ب) استبدال القيم المفقوده باستخدام بعض الدوال الاحصائيه
من قائمة Transform نختارReplacing Missing Values تظهر شاشه جديده نحدد الطريقة التى ستستبدل بها القيم المفقوده من Method وليكن Series Mean ثم ننقل المتغير Income نحدد اسم المتغير الجديد وليكن Income_m نختار Change ثم Ok المتغيرات العدد فقط العمليات المتاحه

27 سوف نعود للملف data4.sav وقد اضاف متغير جديد بالعنوان الذى حددناه income_m واستبدل جميع القيم المفقودة والموجودة فى المدى بمتوسط العينة

28 3-4 الترتيب Ranking فى كثير من طرق العرض والتحليل الاحصائى قد نرغب فى التعامل مع الرتب الخاصة بالمتغير وليست قيم المتغير. فاذا كان لدينا ملفdata4.sav ونريد رتب كلا من الدخل وعدد الاطفال.

29 من قائمة Transform نختار Rank Cases
ننقل المتغيرات المراد ترتيبها الى قائمة Variable(s) نحدد نوع الترتيب تصاعدى او تنازلى من قائمةAssign Rank 1 to ونحدد طبيعية الترتيب من الاختيار Rank Types نحدد نوع العمليه التى تستخدم عند تساوى قيمتين من الاختيار Ties ثم نختار Ok

30

31

32 3-5 انشاء سلسلة Create Time Series
يمكن لحزمة SPSS انشاء متغير جديد وتحديد قيم لهذا المتغير عن طريق الأمر Function الموجود فى الأمر الفرعى Create Time Series وذلك بطريقه يحددها المستخدم. 1- بفتح الملف data4.sav

33 2- من قائمة Transform نختار Create Time Series
4- يمكن تقسيم الشاشة لعدة اجزاء الدوالFunction التى يمكن استخدامها مع السلاسل الزمنيه المتغيرات الموجوده فى الملف النشط اسم المتغير الجديدName مستطيل New Variables ويحدد به العمليه التى ستجرى على المتغير الحالى للحصول على المتغير الجديد

34 اذا كنا نريد حساب المجاميع التراكمية للدخل سنتبع التالى:
نختار من الدوالFunction الداله Cumulative Sum ننقل المتغيرincome الى قائمة New Variables نكتب اسم المتغير الذى ستظهر به النتائج Cum_income فى خانة Name ثم نضغط Change نضغطOk

35

36 القيم المفقودة لم تدخل ضمن العملية التى تم اجرائها على المتغير Income لكن لو اعدنا ما تم لكن باختيار المتغير income_m سوف تدخل جميع القيم ضمن العمليه بسبب عمليه استبدال القيم المفقودة بوسط العينة سابقا.

37 3-6 حصر الحالات Count فى بعض الاحيان قد نرغب فى حصر (تعين عدد) الحالات التى تساوى قيمة معينة أو التى تقع فى مدى معين أو غير ذلك لذا سوف نستخدم الاختيار Count من قائمةTransform بفتح الملفdata4.sav من قائمة Transform نختار Count تظهر شاشة جديدة بعنوانCount Occurrences of Values within Cases

38 ننقل المتغير المراد تنفيذ عملية العد عليه فى خانة Variables ونكتب الاسم المتغير الذى سيحتوى القيم الجديد للحالات وهى 1 او 0 حيث 1 تعنى ان الحاله تعد معنا و0 تعنى ان الحاله لا تعد معنا نختار Define Values تظهر شاشة بعنوان Count Values within cases: Values to Count تحتوى على عدة خيارات

39 Value: تستخدم لعد الحالات التى تحتوى على قيم مساويه لقيمة معينه
Range: تستخدم لعد الحالات التى تقع فى مدى معين Range: Lowest through تستخدم لعد الحالات التى تحتوى على قيم اقل من قيمة معينه Range: through highest تستخدم لعد الحالات التى تحتوى على قيم ااكبر من قيمة معينه وغير ذلك من الاختيارات الاخرى.

40 نختار المدى وليكن 200-400 ثم نختار Add
نختار Continue نعود للشاشه السابقه فنحدد Label الخاص بالمتغير الجديد ثم نضغط Ok سوف نعود للملف data4.sav

41 ونلاحظ ان الحالات التى تقع فى المدى المحدد سوف يقابلها القيمة 1 فى المتغير الجديد numb_incom والحالات الى لا تقع فى هذا المدى يقابلها الرقم صفر وبعد عدد الخانات التى تحتوى الواحد او ايجاد مجموع عناصر المتغيرnumb_incom نحصل على عدد الحالات فى المتغير income_m والتى تقع فى المدى من 200 الى 400


Download ppt "جامعة الملك سعود – المملكة العربية السعودية"

Similar presentations


Ads by Google