Presentation is loading. Please wait.

Presentation is loading. Please wait.

FCE3900 PENYELIDIKAN PENDIDIKAN ALAT UKUR PENYELIDIKAN

Similar presentations


Presentation on theme: "FCE3900 PENYELIDIKAN PENDIDIKAN ALAT UKUR PENYELIDIKAN"— Presentation transcript:

1 FCE3900 PENYELIDIKAN PENDIDIKAN ALAT UKUR PENYELIDIKAN
Minggu 11

2 OBJEKTIF Memahami maksud alat pengukuran dalam penyelidikan.
Menggunakan alat pengukuran dalam penyelidikan pendidikan.

3 Jenis Alat Ukur atau Instrumen Kajian
Ujian mengukur prestasi maksimum Skala/Inventori mengukur pemeringkatan ciri-ciri subjek (contoh: Minnesota Multiphasic Personality Inventory, Myers-Briggs Type Indicator) Soal Selidik mendapatkan maklumat daripada N yang besar Lain-lain teknik sosiometrik & teknik projektif (contoh: Thematic Apperception Test, Roscharch Inkblot Test)

4 Ujian Satu set rangsangan (soalan atau kenyataan) untuk mendapatkan respons subjek berasaskan pemarkahan. Bagi mengukur penguasaan pelajar dalam sesuatu mata pelajaran, bidang, kemahiran, kecerdasan atau bakat. Tahap penguasaan pelajar dikuantifikasikan dengan memberi markah kepada jawapan yang diberi.

5 Ujian

6 Jenis-jenis Ujian Ujian Pencapaian. Ujian Kecerdasan (mental, emosi & rohani). Ujian Prestasi. Ujian Kecekapan. Ujian Bakat. Ujian Personaliti, Sikap dan Minat.

7 Ujian Pencapaian Mengukur secara khusus sejauh mana pelajar menguasai isi sesuatu mata pelajaran yang diajar Mempersoalkan apa yang pelajar telah belajar Penguasaan isi mata pelajaran berlaku dalam sesuatu tempoh sama ada selepas sesuatu sesi pelajaran, satu minggu, setengah semester atau sepanjang semester. Boleh digunakan untuk menilai keberkesanan pengajaran guru. Ada ujian binaan guru dan ujian piawai

8 Merancang Ujian Pencapaian:
Mengenal pasti objektif. Menentukan kandungan ujian. Menentukan jenis item (subjektif / objektif). Menentukan bilangan item. Menentukan paras kesukaran.

9 Ujian Kecerdasan Mengukur kebolehan pelajar menyesuaikan diri dengan persekitaran. Kecerdasan melibatkan proses menakul persekitaran bagi menyelesaikan masalah. Memberi tumpuan kepada prestasi umum pelajar. Jenis: Kecerdasan mental, kecerdasan emosi dan kecedasan rohani.

10 Ujian Prestasi Menghendaki pelajar melakukan aktiviti yang diperlukan
ujian kertas pensil digunakan untuk mengelak berlakunya tekaan, dan untuk memberi penekanan terhadap fakta Memberi rangsangan kepada pelajar untuk memperkenal dan mengembangkan aktiviti pemikiran dan taakulan berasaskan kurikulum yang diajar Teknik folio, rakaman Contoh: prestasi dalam kursus tertentu

11 Ujian Kecekapan Mengukur kemahiran dan kecekapan dalam melakukan sesuatu tugas yang dipelajari Contoh: kecekapan melukis, melakar reka bentuk bangunan, kecekapan memasak, kecekapan berlari, dan sebagainya.

12 Ujian Bakat Digunakan untuk membuat telahan tentang kebolehan pelajar belajar pada masa hadapan Bakat merujuk kepada apa yang pelajar boleh belajar Contoh: Ujian Bakat Bermain Bola Sepak, & Ujian Bakat Seni

13 Ujian Personaliti Digunakan bagi memahami tingkah laku pelajar khususnya sikap dan motivasi mereka Mengukur kewujudan keadaan atau trait dalaman seseorang (introvert/ekstrovert) Ujian sikap: mengukur kepercayaan yang mendorong pelajar memberikan gerak balas terhadap sesuatu rangsangan Ujian minat: mengukur kecenderungan seseorang pelajar melakukan sesuatu perkara atau terhadap sesuatu bidang.

14 Skala atau Inventori

15 Skala atau Inventori Untuk mengukur pemboleh ubah kualitatif yang berbentuk gagasan seperti ciri tingkah laku, minat, sikap, dan personaliti yang dapat diukur secara kuantitatif. Digunakan dalam ujian personaliti, ujian sikap, dan persepsi.

16 Soal Selidik

17 Soal Selidik Digunakan bagi mendapatkan maklumat umum tentang fakta, kepercayaan, kehendak, status sosio ekonomi, latar belakang pelajar, pendapatan atau tahap pendidikan. Terdiri daripada jenis jawapan dibina, dan jawapan dipilih. Soal Selidik boleh dipos atau diberi secara langsung kepada subjek.

18 Ciri-ciri soal selidik yang baik:
Berasaskan kepada objektif dan definisi operasi. Disemak dengan pengalaman & sorotan berkaitan. Tentukan kesesuaian soalan atau pernyataan. Soalan tidak prejudis. Nyatakan soalan atau pilihan jawapan dengan jelas. Jawapan ikhlas. Soalan tidak memesong/memaksa subjek. Tempoh menjawab minimum. Disusun secara psikologi : mudah ke susah.

19 Soal Selidik Pos Digunakan untuk bilangan subjek yang ramai dan pelbagai. Penyelidik perlu memastikan pulangan tinggi dengan cara: Nyatakan kepentingan soal selidik kepada subjek. Sertakan surat pengenalan (tujuan dan nilai penyelidikan) dan surat sokongan (pihak berwibawa). Sertakan sampul jawapan bersetem yang dan beralamat sendiri. Pastikan kesesuaian masa menjawab. Soalan dan maklumat diperlukan mudah, jelas dan ringkas. Format menarik. Lakukan usaha memastikan pulangan tinggi dengan minimumkan kesukaran subjek menjawab, menghantarkan surat ingatan, soal selidik gantian, dan surat penghargaan dan maklum balas jika perlu.

20 Temu Bual

21 Temubual Melibatkan penyelidik dan subjek hadir sama. Kaedah tertua.
Soalan dibina untuk merangsang maklumat. Kekuatan: + kerjasama, interaksi secara langsung dan aktif. + Mudah suai, mengikut situasi subjek. + Hubungan lebih erat, jawapan lebih tepat. Kelemahan: Memerlukan masa, tenaga dan kos yang tinggi. Dipengaruhi oleh personaliti subjek dan penyelidik. Pengaruh faktor luaran; keletihan, kebosanan, membuang masa, kebolehan merekod, kurang pengetahuan tentang kajian, sikap dsb.

22 Pemerhatian

23 Pemerhatian Memerhati tingkah laku berdasarkan pemboleh ubah yang dikenal pasti seperti masa berbeza akan menyebabkan tingkah laku berbeza. Perlu dikenalpasti tingkah laku secara ekslusif (tidak ada pertindanan tingkah laku) dan extensive (kenal pasti kemungkinan kejadian semua tingkah laku). Peranan penyelidik sebagai pemerhati. Aktiviti penyelidik adalah melihat, mendengar dan merekod. Penyelidikan bernilai tinggi jika dilakukan secara objektif.

24 Jenis Pemerhatian Pemerhatian turut serta
Penyelidik berada dalam unit sosial subjek dan bergaul dengan subjek tetapi tidak mempengaruhi subjek. Penyelidik dan subjek lebih mengenali. Masalah yang timbul adalah reaksi subjek; Jawapan tepat jika subjek bereaksi positif. Jawapan kurang tepat jika subjek bereaksi negatif. Sukar mencatatkan tingkah laku: Isu penerimaan dan penolakan subjek, isu perasaan seperti simpati, hilang keobjektifan ketika merekod maklumat.

25 Pemerhatian tidak turut serta:
Penyelidik berada di luar unit sosial yang dicerap. Penyelidik tidak mencampuri tingkah laku subjek. Maklumat lebih dipercayai kerana kurang dipengaruhi oleh reaksi subjek, perasaan dan simpati penyelidik. Kesan sampingan berlaku jika subjek dan unit sosial sedar akan kehadiran penyelidikan sebagai pemerhati.

26 Pembinaan Instrumen

27 Prinsip Pembinaan Instrumen Kajian
Berpandukan objektif penyelidikan. Berasaskan definisi operasi pemboleh ubah. Tentukan sama ada jawapan dibina dan atau dipilih. Tentukan kesesuaian bilangan. Tentukan kesesuaian aras kesukaran. Tentukan kesesuaian aras diskriminasi. Tentukan kesesuaian kebolehpercayaan. Mudah tadbir. Mudah tafsir.

28 Soal Selidik Digunakan bagi mendapatkan maklumat.
Ciri-ciri soal selidik yang baik: Berasaskan kepada objektif dan definisi operasi. Disemak dengan pengalaman dan sorotan berkaitan. Tentukan kesesuaian soalan atau pernyataan. Soalan tidak prejudis. Nyatakan soalan atau pilihan jawapan dengan jelas. Pilihan jawapan saling ekslusif dan habisan. Jawapan ikhlas. Soalan tidak memesong atau memaksa subjek. Tempoh menjawab minimum. Disusun secara psikologi : mudah ke susah.

29 Langkah Membentuk Instrumen Kajian
Senaraikan pembolehubah yang ingin dikaji dan rujuk teori dan model berkaitan dengan pembolehubah yang dikaji. Bina Jadual Penentuan Indeks Pengukuran. Jalankan ujian-pra. Rujuk pakar dalam bidang berkenaan. Jalankan ujian atau kajian rintis (pilot test/study).

30 Jadual Penentuan Indeks Pengukuran
Jenis instrumen : Soal Selidik Jenis Item : aneka Pilihan Pembolehubah : Pemikiran Kreatif Bil. Sub-Indeks (Pemikiran kreatif) Bil. Item 1. Keaslian 7 2. Kelancaran 6 3. Penghuraian Jumlah item

31 KESAHAN (VALIDITY)

32 Sejauh mana alat mengukur apa yang ia sepatutnya ukur
Validity refers to the degree in which our test or other measuring device is truly measuring what we intended it to measure. KESAHAN (VALIDITY) Sejauh mana alat mengukur apa yang ia sepatutnya ukur

33 Kesahan bermaksud kebolehan ujian mengukur apa yang sepatutnya diukur, Youngman & Eggleston, 1982; Sax & Newton, 1997) Kesahan sesuatu alat pengukuran merujuk kepada sejauh manakah alat yang digunakan mengukur data yang dikehendaki untuk mencapai objektif kajian (Mohd Majid Konting, 1990) Kesahan ialah sejauhmanakah dapatan kajian atau data yang dikumpul dapat memberikan penjelasan yang bermakna kepada kajian yang dilakukan (Ary et. al (2005)

34 Kesahan sesuatu alat pengukuran merujuk kepada sejauh manakah alat yang digunakan mengukur data yang dikehendaki untuk mencapai objektif kajian (Mohd Majid Konting, 1990) Kesahan ialah sejauhmanakah dapatan kajian atau data yang dikumpul dapat memberikan penjelasan yang bermakna kepada kajian yang dilakukan (Ary et. al (2005)

35 Content validation is usually carried out by experts
Based on Internal Structure Construct (determination of the significance, meaning, purpose, and use of the scores) Kesahan Gagasan Tiga Aspek Kesahan Based on Relations to Other Variables Based on content Kesahan Kriteria Kesahan Kandungan Criterion-referenced (scores are a predictor of an outcome or criterion they are expected to predict) Content (representative of all possible questions that could be asked) Concurrent Evidence Predictive Evidence Content validation is usually carried out by experts

36 Menurut Fraenkel & Wallen (1996) kesahan boleh dibuktikan melalui beberapa kaedah seperti kesahan isi kandungan (content validity), kesahan telahan (predictive validity), kesahan serentak (concurrent validity) dan kesahan gagasan (construct validity)

37 Evidence Based on Content
Kesahan Kandungan (Content Validity) Sejauh mana alat merangkumi kandungan sesuatu bidang. Matlamat utama ialah untuk memastikan semua isi dan kandungan bidang yang diukur menggambarkan bidang tersebut. Berdasarkan kepada skop dan objektif dan kandungan sesuatu bidang yang dikaji. Pendapat pakar atau penilai luar diperlukan bagi menilai kesesuaian butiran bagi domain yang dipilih.

38 Content validity… …is concerned with a test’s ability to include or represent all of the content of a particular construct. The question “1 + 1 = ___” may be a valid basic addition question. Would it represent all of the content that makes up the study of mathematics? It may be included on a scale of intelligence, but does it represent all of intelligence? The answer to these questions is obviously no. To develop a valid test of intelligence, not only must there be questions on math, but also questions on verbal reasoning, analytical ability, and every other aspect of the construct we call intelligence. There is no easy way to determine content validity aside from expert opinion.

39 Content validity… Do the items appear to represent the thing you are trying to measure? Does the set of items underrepresented the construct’s content (i.e., have you excluded any important content areas or topics?) Do any of the items represent something other than what you are trying to measure (i.e., have you included any irrelevant items?)

40 Content validity… Sebelum sesuatu instrumen itu dikatakan mempunyai kesahan kandungan, lima syarat ini perlu dipenuhi: Bidang kandungan mestilah dinyatakan dalam bentuk tingkah laku yang secara umum diterima maknanya. Bidang mestilah dihuraikan dengan jelas. Bidang mestilah relevan dengan tujuan penggunaan ujian. Hakim-hakim yang berkelayakan mestilah bersetuju bahawa bidang telah disampel secara mencukupi.

41 Kesahan Gagasan (Construct Validity)
Evidence Based on Internal Structure Kesahan Gagasan (Construct Validity) To measure several components or dimensions of a construct. Use Factor Analysis to analyzes correlations among test items and tells you the number of factors present. Its tell you whether the test is unidimensional or multidimensional. Unidimensional – all the item measure are single construct. Multidimensional – different set of item tap different construct or different component of a broader construct.

42 …… Internal Structure Factor analysis tell you how many dimensions or factors your test items represent. Also can obtain a measure of test homogeneity (i.e., the degree to which the different items measure the same construct or trait) Use coefficient alpha (Alpha Cronbach) for the test of homogeneity. If the alpha is low (e.g., <.70) for the test, then some items might be measuring different constructs or some items might be bad. Examine the items that are contributing to your low coefficient alpha and consider eliminating or revising them.

43 Based on Relations to Other Variables
Kesahan Kriteria (Criterion Validity) Obtained by relating your test scores to a relevant criterion. A criterion is the standard or benchmark that you want to predict accurately on the basis of scores from your test. Sejauh mana kaitan antara alat dengan kriteria luaran yang berkecuali (sama ada item mengukur kriteria yang hendak diukur). Ditentukan dengan analisis korelasi antara dua set markah. Calculate correlation coefficients for the study of validity – validity coefficients.

44 Concurrent Validity Concurrent Validity refers to a measurement device’s ability to vary directly with a measure of the same construct or indirectly with a measure of an opposite construct. It allows you to show that your test is valid by comparing it with an already valid test. Administering the focal test and criterion test at approximately the same point in time (i.e., concurrently) and then correlating the two set of scores. If the two sets of scores highly correlated, you have concurrent evidence. e.g. A new test of adult intelligence, for example, would have concurrent validity if it had a high positive correlation with the Wechsler Adult Intelligence Scale since the Wechsler is an accepted measure of the construct we call intelligence. An obvious concern relates to the validity of the test against which you are comparing your test. Some assumptions must be made because there are many who argue the Wechsler scales, for example, are not good measures of intelligence.

45 Predictive Validity Obtain predictive evidence of validity by measuring your participants at one point in time on your test and then, at a future time, measuring them on the criterion measure. Take more time and effort than concurrent evidence, but it can provide superior evidence that your test does what you want it to do. In order for a test to be a valid screening device for some future behavior, it must have predictive validity. The SAT is used by college screening committees as one way to predict college grades. The GMAT is used to predict success in business school. And the LSAT is used as a means to predict law school performance. The main concern with these, and many other predictive measures is predictive validity because without it, they would be worthless

46 KEBOLEH PERCAYAAN (RELIABILITY)
Reliability is synonymous with the consistency of a test, survey, observation, or other measuring device. Imagine stepping on your bathroom scale and weighing 140 pounds only to find that your weight on the same scale changes to 180 pounds an hour later and 100 pounds an hour after that. Base on the inconsistency of this scale, any research relying on it would certainly be unreliable. Consider an important study on a new diet program that relies on your inconsistent or unreliable bathroom scale as the main way to collect information regarding weight change. Would you consider their results accurate? KEBOLEH PERCAYAAN (RELIABILITY)

47 Kebolehpercayaan Sejauh mana instrumen mengukur dengan tekal apa yang hendak diukur. Scores from measuring variables that are stable and consistent

48 Types of Reliability Test-retest Reliability
Internal Consistency Reliability Equivalent Forms Reliability

49 Test-Retest Reliability
Merujuk kepada ketekalan atau stabiliti markah ujian jika dilakukan pada masa yang berbeza. Contoh: Ujian diberikan kepada 100 individu untuk satu masa dan diulangi pada masa berlainan. Dua set markah ini dikorelasikan. Sekiranya individu memperoleh markah tertinggi dalam ujian 1 juga memperolehi markah tertinggi dalam ujian 2, begitu juga individu yang mendapat markah terendah dalam ujian 1 juga mendapat markah terendah dalam ujian, maka dikatakan mempunyai korelasi yang tinggi. Oleh itu soalan ujian tersebut mempunyai kebolehpercayaan yang tinggi.

50 Equivalent Forms Reliability
Refers to the consistency of a group of individual’s scores on two equivalent forms of a test designed to measure the same characteristic. Menggunakan satu alat yang dibina dan satu lagi yang piawai. Ditadbir ke atas subjek yang sama dan pada masa yang sama atau masa yang lain. Equivalent form means that two tests are constructed so that they are identical in every way except for the specific items asked on the test. This means that they have the same number of items, the items are the same difficulty level, the item measure the same construct, and the test is administered, scored, and interpreted in the same way. The two set of scores are than correlated. If this reliability coefficient to be very high and positive, that is the individuals who do well on the first form of the test should also do well on the second form, and individuals who performed poorly on the first form of the test should perform poorly on the second test.

51 Internal Consistency Reliability
Internal consistency refers to how consistently the items on a test measure a single construct or concept. The test-retest methods of assessing reliability are general methods that can be used with just about any test. Internal consistency measures are convenient and are very popular with researchers because they require one group of individuals to take the test one time. Two indexes of internal consistency: Split half reliability Coefficient alpha

52 Split-half reliability
Splitting a test into two equivalent halves and then assessing the consistency of the scores across the two halves of the test. Divide the test into halves and correlate the scores from the two halves. Compute the correlation between scores on the two halves of the test using Spearman-Brown formula. The low correlation indicates that the test was unreliable, a high correlation indicates that the test was reliable.

53 Coefficient alpha Lee Cronbach 1951) developed coefficient alpha.. Alpha Cronbach Coefficient alpha tells you the degree to which the items are interrelated. Rule of thumb: At a minimum, greater than or equal to .07 for research purposes and somewhat greater than that value (e.g. ≥ .09) for clinical testing purposes.

54 Validity and reliability

55 Sekiranya pekali kebolehpercayaan rendah???

56 Meningkatkan Kebolehpercayaan
Pernyataan item mestilah jelas dan tepat. Arahan mestilah jelas dan ringkas. Item hendaklah bentuk sejenis. Situasi dan masa pengukuran hendaklah piawai, serupa dan terkawal. Elakkan gangguan ke atas subjek. Elakkan kebimbangan subjek dengan memberi jaminan keselamatan dan kerahsiaan ke atas maklumat yang diberi.

57 Fasa terakhir tinjauan sebelum pengumpulan data bermula.
Ujian Rintis Matlamatnya adalah untuk mencari masalah dalam soal selidik, termasuk soalan yang lemah, arahan yang tidak lengkap dan item yang sukar dijawab.

58 Garis panduan ujian rintis
Tidak boleh gunakan kumpulan fokus sebenar. Garis panduan ujian rintis Untuk kajian baharu, lakukan dua kali ujian rintis. Jumlah responden tidak ditentukan dengan tepat, dicadangkan sekurang-kurangnya 25 orang, lebih baik antara 50 – 75 orang.

59 Procedures for Administering the Data Collection
Develop standard written procedures for administering an instrument Obtain permission to collect and use public documents Train researchers to collect observational data Procedures for Administering the Data Collection Respect individuals and sites during data gathering (ethics)

60 What Permissions Are Needed: Obtaining Permission
Institutional or organizational (e.g., school district) Site-specific (e.g., secondary school) Individual participants What Permissions Are Needed: Obtaining Permission Parents of participants who are not considered adults Campus approval (e.g., university or college) and Institutional Review Board (IRB)

61 Kesahan Sejauh mana alat mengukur apa yang ia sepatutnya ukur.
Tiga Aspek: Kesahan Gagasan Kesahan Kandungan Kesahan Kriteria

62 Kesahan Kandungan Sejauh mana alat merangkumi kandungan sesuatu bidang. Matlamat utama ialah untuk memastikan semua isi dan kandungan bidang yang diukur menggambarkan bidang tersebut. Berdasarkan kepada skop dan objektif dan kandungan sesuatu bidang yang dikaji. Jika kandungan luas, perlu persampelan kandungan. Bina Jadual Penentuan bagi mengenalpasti domain-domain yang hendak diukur. Pendapat pakar atau penilai luar diperlukan bagi menilai kesesuaian butiran bagi domain yang dipilih.

63 Kesahan Gagasan Sejauh mana alat menghasilkan gerak balas yang mewakili gagasan (sikap, motivasi) yang diukur. Walau pun berbentuk abstrak, terdapat ciri atau kesan daripada kewujudan atau ketidak wujudan sesuatu gagasan pendidikan (diukur secara tak langsung berasaskan kesan atau ciri yang terhasil daripada gagasan). Contoh: Minat terhadap matematik adalah terdiri daripada bilangan latihan, tempoh masa membuat latihan matematik dan sebagainya. Analisis faktor digunakan bagi membina alat ukur gagasan.

64 Kesahan Kriteria Sejauh mana kaitan antara item alat dengan kriteria luaran yang berkecuali (sama ada butir mengukur kriteria yang hendak diukur). Ditentukan dengan analisis korelasi antara dua set markah (markah alat dibina dengan alat kriteria). Kriteria Serentak: kriteria yang ditunjukkan pada masa yang sama dengan pengukuran. Misalnya, kebolehan semasa bermain muzik. Kriteria Jangkaan: kriteria yang ditunjukkan pada masa hadapan selepas pengukuran. Misalnya, kebolehan bermain muzik pada suatu masa hadapan selepas pengukuran dilakukan.

65 KEBOLEH PERCAYAAN (RELIABILITY)

66 Kebolehpercayaan Sejauh mana alat mengukur dengan tekal apa yang hendak diukur. Keboleh percayaan alat ukur adalah ketekalan alat mengukur pemboleh ubah atau gagasan. Variasi atau perubahan yang wujud antara dua pengukuran dengan menggunakan alat ukur yang sama merupakan aspek yang penting dalam menentukan ketekalan alat ukur.

67 Cara menentukan kebolehpercayaan alat ukur
Indeks Kebolehpercayaan Merupakan pekali yang menunjukkan ketekalan sesuatu alat ukur. Ditentukan dengan menggunakan pekali korelasi antara dua set respons (markah) yang diperolehi hasil daripada gerak balas subjek terhadap alat ukur. Kaedah menguji kebolehpercayaan: 1. Kaedah Bahagi Dua (Split-half) 2. Kaedah Uji dan Uji Kembali (Test-retest) 3. Kaedah Bentuk Setara (Equavalent Form)

68 1. Kaedah Bahagi Dua Alat ukur yang sama ditadbirkan hanya sekali ke atas subjek (hanya uji sekali). Respons pada butir yang bernombor ganjil diasingkan daripada butir yang bernombor genap. Kedua-dua set markah dikorelasikan. Pekali korelasi yang positif dan teguh antara dua set markah menunjukkan indeks kebolehpercayaan yang tinggi. Gunakan formula Spearman-Brown, Kuder Richardson dan Alpha Cronbach untuk mendapatkan pekali korelasi.

69 Pekali Alpha Cronbach (α)
Digunakan untuk mengukur ketekalan dalaman dan homogeniti. Bergantung kepada ketekalan prestasi individu dari satu butir ke satu butir yang lain (darjah persetujuan terhadap butir-butir pernyataan). Pekali Alpha Cronbach adalah berasaskan kepada sisihan piawai alat ukur dan sisihan piawai butir-butir yang berlainan.

70 Pekali alpha berasaskan kepada sisihan piawai alat ukur dan sisihan piawai butir yang berlainan

71 2. Kaedah Uji dan Uji Kembali
Ujian yang sama ditadbirkan dua kali kepada respondens yang sama, pada masa yang berlainan. Dua set markah itu dikorelasikan. Pekali korelasi = Indeks keboleh percayaan.

72 3. Kaedah Bentuk Setara (Equavalent Forms)
Digunakan apabila ada kemungkinan subjek akan ingat respons pada ujian pertama. Menggunakan satu alat yang dibina dan satu lagi yang piawai. Kedua-dua alat setara dari segi kandungan (isi kandungan dan tahap kesukaran) tetapi berbeza dari segi penyampaian. Ditadbir ke atas subjek yang sama dan pada masa yang sama atau masa yang lain. Markah dua alat dikorelasikan dan hasil korelasi adalah sama dengan pekali kestabilan kesetaraan.

73 Meningkatkan Kebolehpercayaan
Pernyataan butir mestilah jelas dan tepat. Arahan mestilah jelas dan ringkas. Butir hendaklah bentuk sejenis. Situasi dan masa pengukuran hendaklah piawai, serupa dan terkawal. Elakkan gangguan ke atas subjek. Elakkan kebimbangan subjek dengan memberi jaminan keselamatan dan kerahsiaan ke atas maklumat yang diberi.

74 Ujian Rintis

75 Fasa terakhir tinjauan sebelum pengumpulan data bermula.
Matlamatnya adalah untuk mencari masalah dalam soal selidik, termasuk soalan yang lemah, arahan yang tidak lengkap dan item yang sukar dijawab.

76 Garis panduan ujian rintis
Jumlah responden tidak ditentukan dengan tepat, dicadangkan sekurang-kurangnya 25 orang, lebih baik antara 50 – 75 orang. Untuk kajian baru, lakukan dua kali ujian rintis. Tidak boleh gunakan kumpulan fokus sebenar.

77 Pengumpulan Data

78 SEKIAN TERIMA KASIH


Download ppt "FCE3900 PENYELIDIKAN PENDIDIKAN ALAT UKUR PENYELIDIKAN"

Similar presentations


Ads by Google