PENDIDIKAN: VALIDITASI DAN RELIABILITASI

VALIDITASI DAN RELIABILITASI

A. PENGERTIAN VALIDITASI

1. Beberapa pengertian Validitas menurut beberapa sumber :

a. Azwar (1987: 173) menyatakan bahwa validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Suatu tes dikatakan memiliki validitas yang tinggi apabila alat tersebut menjalankan fungsi ukur secara tepat atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Artinya hasil ukur dari pengukuran tersebut merupakan besaran yang mencerminkan secara tepat fakta atau keadaan sesungguhnya dari apa yang diukur.

b. Suryabrata (2000: 41) menyatakan bahwa validitas tes pada dasarnya menunjuk kepada derajat fungsi pengukurnya suatu tes, atau derajat kecermatan ukurnya sesuatu tes. Validitas suatu tes mempermasalahkan apakah tes tersebut benar-benar mengukur apa yang hendak diukur. Maksudnya adalah seberapa jauh suatu tes mampu mengungkapkan dengan tepat ciri atau keadaan yang sesungguhnya dari obyek ukur, akan tergantung dari tingkat validitas tes yang bersangkutan.

c. Sudjana (2004: 12) menyatakan bahwa validitas berkenaan dengan ketepatan alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai. Suatu tes yang valid untuk tujuan tertentu atau pengambilan keputusan tertentu, mungkin tidak valid untuk tujuan atau pengambilan keputusan lain. Jadi validitas suatu tes, harus selalu dikaitkan dengan tujuan atau pengambilan keputusan tertentu. Tes masuk di SMA misalnya harus selalu dikaitkan dengan seberapa jauh tes masuk tersebut dapat mencerminkan prestasi atau hasil belajar para calon peserta didik baru setelah belajar nanti.

d. (Arikunto, 1999: 65) menyatakan Validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes. Suatu tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Tes memiliki validitas yang tinggi jika hasilnya sesuai dengan kriteria, dalam arti memiliki kesejajaran antara tes dan kriteria.

Menurut pengertian beberapa sumber diatas dapat disimpulkan bahwa validitasi adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes yang dibuat dari hasil pengukuran atau evaluasi yang bersifat benar dengan menunjukkan suatu bukti yang ada.

2. Jenis – Jenis Validitas

Validitas suatu instrumen selalu bergantung kepada situasi dan tujuan khusus penggunaan instrumen tersebut. Suatu tes yang valid untuk suatu situasi mungkin tidak valid untuk situasi yang lain. Maka dari itu, dikenal beberapa macam validitas, Menurut Djaali dan Pudji (2008) validitas dibagi menjadi 3 yaitu:

1. Validitas isi (content validity)

Validitas isi suatu tes mempermasalahkan seberapa jauh suatu tes mengukur tingkat penguasaan terhadap isi suatu materi tertentu yang seharusnya dikuasai sesuai dengan tujuan pengajaran. Dengan kata lain, tes yang mempunyai validitas isi yang baik ialah tes yang benar-benar mengukur penguasaan materi yang seharusnya dikuasai sesuai dengan konten pengajaran yang tercantum dalam Garis-Garis Besar Program Pengajaran (GBPP).

Untuk mengetahui apakah tes itu valid atau tidak harus dilakukan melalui penelaahan kisi-kisi tes untuk memastikan bahwa soal-soal tes itu sudah mewakili atau mencerminkan keseluruhan konten atau materi yang seharusnya dikuasai secara proporsional. Oleh karena itu, validitas isi suatu tes tidak memiliki besaran tertentu yang dihitung secara statistika, tetapi dipahami bahwa tes itu sudah valid berdasarkan telaah kisi-kisi tes. Oleh karena itu, wiersma dan Jurs dalam Djaali dan Pudji (2008) menyatakan bahwa validitas isi sebenarnya mendasarkan pada analisis logika, jadi tidak merupakan suatu koefisien validitas yang dihitung secara statistika.

Selanjutnya, validitas isi ini terbagi lagi menjadi dua tipe, yaitu face validity (validitas muka) dan logical validity (validitas logis).

· Face Validity (Validitas Muka)

Validitas muka adalah tipe validitas yang paling rendah signifikasinya karena hanya didasarkan pada penilaian selintas mengenai isi alat ukur. Apabila isi alat ukur telah tampak sesuai dengan apa yang ingin diukur maka dapat dikatakan validitas muka telah terpenuhi.

· Logical Validity (Validitas Logis)

Validitas logis disebut juga sebagai validitas sampling (sampling validity). Validitas tipe ini menunjuk pada sejauhmana isi alat ukur merupakan representasi dari aspek yang hendak diukur

Untuk memperoleh validitas logis yang tinggi suatu alat ukur harus dirancang sedemikian rupa sehingga benar-benar berisi hanya item yang relevan dan perlu menjadi bagian alat ukur secara keseluruhan. Suatu objek ukur yang hendak diungkap oleh alat ukur hendaknya harus dibatasi lebih dahulu kawasan perilakunya secara seksama dan konkrit. Batasan perilaku yang kurang jelas akan menyebabkan terikatnya item-item yang tidak relevan dan tertinggalnya bagian penting dari objek ukur yang seharusnya masuk sebagai bagian dari alat ukur yang bersangkuatan.

Validitas isi suatu alat evaluasi artinya ketepatan alat tersebut ditinjau dari segi materi yang dievaluasikan, seperti materi/bahan yang dipakai sebagai alat evaluasi juga merupakan sampel representattif dari pengetahuan yang harus dikuasai. Dengan menggunakan kisi-kisi dan format penulisan soal, keseluruhan soal yang disajikan dalam alat evaluasi akan merupakan sampel yang representatif dari pengetahuan siswa yang akan diuji. Apabila soal evaluasi tersusun dari bahan-bahan diluar materi yang diajarkan maka soal tersebut tidak valid menurut validitas isi. Agar soal yang dibuat memiliki validitas isi yang baik, haruslah memperhatikan hal-hal berikut ini, yaitu :

· Bahan evaluasi merupakan sampel representatif untuk mengukur seberapa jauh tujuan dapat tercapai

· Titik berat bahan yang diujikan harus berimbang dengan titik berat bahan dalam kurikulum

· Untuk mengerjakan evaluasi tidak diperlukan pengetahuan bahan yang belum diajarkan.

Validitas isi menunjukkan sejauh mana instrumen tersebut mencerminkan isi yang dikehendaki. Dalam menilai validitas isi suatu instrumen, kita berkepentingan dengan masalah seberapa jauh isi instrumen itu mencerminkan seluruh universum isi yang diukur? Agar dapat memiliki validitas isi, suatu ukuran harus secara memadai menarik sampel topik maupun proses kognitif yang terdapat di dalam universum isi bidang yang sedang diteliti. Tentu saja universum isi semacam itu bersifat teoritis. Akan tetapi, kita dapat membuat suatu kerangka atau kisi-kisi topik, kecakapan, dan kemampuan yang merupakan wilayah isi yang sedang diukur, disertai petunjuk tentang pentingnya tiap-tiap wilayah itu. Butir-butir tes dapat ditulis berdasarkan kerangka ini sebagai pedoman. Validitas isi tidak dapat dinyatakan dalam bentuk angka. Pengesahan ini pada dasarnya dan terpaksa didasarkan pada pertimbangan, dan pertimbangan tersebut harus dilakukan secara terpisah untuk setiap situasi. Peneliti harus selalu menilai validitas isi dari tes hasil belajar buatan sendiri maupun baku yang akan dipakai dalam penyelidikannya.

2. Validitas empiris ( kriteria)

Validitas empiris sama dengan validitas kriteria yang berarti bahwa validitas ditentukan berdasarkan kriteria, baik kriteria internal maupun kriteria eksternal. Kriteria internal adalah tes atau instrumen itu sendiri yang menjadi kriteria, sedangkan kriteria eksternal adalah hasil ukur instrumen atau tes lain di luar instrumen itu sendiri yang menjadi kriteria. Ukuran lain yang sudah dianggap baku atau dapat dipercaya dapat pula dijadikan sebagai kriteria eksternal.

Validitas yang ditentukan berdasarkan kriteria internal disebut validitas internal, sedangkan validitas yang ditentukan berdasarkan kriteria eksternal disebut validitas eksternal.

· Validitas internal

Validitas internal merupakan validitas yang diukur dengan besaran yang menggunakan instrumen sebagai suatu kesatuan (keseluruhan butir) sebagai kriteria untuk menentukan validitas item atau butir dari instrumen itu. Dengan demikian validitas internal mempermasalahkan validitas butir atau item suatu instrumen dengan menggunakan hasil ukur instrumen tersebut sebagai suatu kesatuan dan sebagai kriteria, sehingga biasa disebut juga validitas butir.

Pengujian validitas butir instrumen atau soal tes dilakukan dengan menghitung koefesien korelasi antara skor butir instrumen atau soal tes dengan skor total instrumen atau tes. Butir atau soal yang dianggap valid adalah butir instrumen atau soal tes yang skornya mempunyai koefesien korelasi yang signifikan dengan skor total instrumen atau tes.

· Validitas eksternal

Kriteria eksternal dapat berupa hasil ukur instrumen yang sudah baku atau instrumen yang dianggap baku dapat pula berupa hasil ukur lain yang sudah tersedia dan dapat dipercaya sebagai ukuran dari suatu konsep atau varaibel yang hendak diukur. Validitas eksternal diperlihatkan oleh suatu besaran yang merupakan hasil perhitungan statistika. Jika kita menggunakan hasil ukur instrumen yang sudah baku sebagai kriteria eksternal, maka besaran validitas eksternal dari instrumen yang kita kembangkan didapat dengan jalan mengkorelasikan skor hasil ukur instrumen yang dikembangkan dengan skor hasil ukur instrumen baku yang dijadikan kriteria. Makin tinggi koefesien korelasi yang didapat, maka validitas instrumen yang dikembangkan juga makin baik. Kriteria yang digunakan untuk menguji validitas eksternal adalah nilai table r (r-tabel).

Ditinjau dari kriteria eksternal yang dipilih, validitas eksternal dapat dibedakan atas dua macam yaitu:Validitas prediktif apabila kriteria eksternal yang digunakan adalah adalah ukuran atau penampilan masa yang akan datang.

Validitas kongkuren apabila kriteria eksternal yang digunakan adalah ukuran atau penampilan saat ini atau saat yang bersamaan dengan pelaksanaan pengukuran.

Validitas yang dikaitkan dengan kriteria menunjuk pada hubungan antara skor suatu instrumen pengukuran dengan suatu variabel (kriteria) luar yang mandiri dan dipercaya dapat mengukur langsung tingkah laku atau ciri-ciri yang diselidiki. Misalnya jika seseorang menyelidiki hubungan antara skor suatu tes bakat skolastik dengan indeks prestasi (IP) di perguruan tinggi maka itu berarti bahwa ia menyelidiki validitas es bakat tersebut yang dikaitkan dengan suatu kriteria. Dalam hal ini, kriteria tersebut adalah IP.

Validitas semacam ini lebih memberi tekanan kepada kriterianya, bukan kepada instrumen itu sendiri. Hal yang terutama diperhatikan adalah apa yang dapat diramalkan oleh instrumen tersebut, bukan isi tesnya. Berbeda dengan validitas isi, validitas yang dikaitkan dengan kriteria ini menggunakan teknik-teknik empiris untuk menyelidiki hubungan antara skor instrumen yang sedang dipersoalkan dengan kriteria luar. Ciri yang harus dimiliki oleh ukuran kriteria adalah relevansi. Kita harus menilai apakah kriteria yang dipilih itu benar-benar menggambarkan ciri-ciri yang tepat dari tingkah laku yang sedang diselidiki. Ciri yang kedua ialah bahwa suatu kriteria haruslah reliabel (dapat dipercaya). Ini berarti bahwa kriteria tersebut harus merupakan ukuran yang ajeg bagi atribut tersebut, dari waktu ke waktu dan dari satu situasi ke situasi yang lain. Ciri ketiga hendaknya kriteria bebas dari bias. Artinya, pemberian skor pada suatu ukuran kriteria hendaknya tidak dipengaruhi oleh faktor-faktor selain penampilan sebenarnya pada kriteria itu. Setelah kriteria luar itu ditetapkan, maka data empiris pun dapat segera dikumpulkan untuk menilai hubungan antara skor pada instrumen pengukur dengan skor pada kriteria.

3. Validitas Konstruk (Construct validity)

Menurut Djaali dan Pudji (2008) validitas konstruk adalah validitas yang mempermasalahkan seberapa jauh item-item tes mampu mengukur apa-apa yang benar-benar hendak diukur sesuai dengan konsep khusus atau definisi konseptual yang telah ditetapkan.

Validitas konstruk biasa digunakan untuk instrumen-instrumen yang dimaksudkan mengukur variabel-variabel konsep, baik yang sifatnya performansi tipikal seperti instrumen untuk mengukur sikap, minat, konsep diri, lokus control, gaya kepemimpinan, motivasi berprestasi, dan lain-lain, maupun yang sifatnya performansi maksimum seperti instrumen untuk mengukur bakat (tes bakat), intelegensi (kecerdasan intelekual), kecerdasan emosional dan lain-lain.

Untuk menentukan validitas konstruk suatu instrumen harus dilakukan proses penelaahan teoritis dari suatu konsep dari variabel yang hendak diukur, mulai dari perumusan konstruk, penentuan dimensi dan indikator, sampai kepada penjabaran dan penulisan butir-butir item instrumen. Perumusan konstruk harus dilakukan berdasarkan sintesis dari teori-teori mengenai konsep variabel yang hendak diukur melalui proses analisis dan komparasi yang logik dan cermat.

3. Penggunaan Konsep Validitas dalam Penelitian

Penelitian eksperimen memiliki karateristik tersendiri dalam penelitian kuantitatif. Karena variabel bebasnya berupa perlakuan (treatment) yang akan dilihat pengaruhnya terhadap variabel terikat. Sehingga untuk dapat mengetahui pengaruh dari variabel bebas terhadap variabel terikat, terdapat variabel-variabel luar yang seharusnya dikontrol oleh peneliti. Karena secara hakiki, penelitian eksperimen yang valid berkaitan dengan hasil penelitian adalah benar-benar berasal dari variabel bebas. Dalam hal ini, penelitian eksperimen memerlukan validitas dalam penelitiannya. Validitas dalam penelitian eksperimen ini berkaitan dengan validitas internal dan eksternal.

Validitas internal mengacu pada hasil yang benar-benar berasal dari variabel bebas (perlakuan) bukan dari variabel lain. Pada validitas internal ini terdapat hal-hal perlu diperhatikan dan dikendalikan oleh peneliti seperti:

1. History, berkaitan dengan adanya peristiwa yang dimiliki masing-masing individu sehingga dapat mempengaruhi tingkah laku. Peristiwa ini bukan merupakan bagian dari perlakuan eksperimen, tetapi dapat mempengaruhi performansi pada variabel bebas. Karena dalam dunia pendidikan, subyek penelitian adalah siswa tentulah dipahami bahwa siswa tidak mungkin berangkat dari kevakuman namun memiliki peristiwa yang terjadi di masa lalu. Oleh karena itu, hal ini perlu dikendalikan dengan melakukan randomisasi, karena peneliti tidak dapat mengendalikan adanya history tersebut namun dapat mengontrol kemunculannya.

2. Maturasi, berkaitan dengan perubahan fisik atau mental individu seperti perubahan menjadi lebih termotivasi, tidak termotivasi atau bosan dan sebagainya. Perubahan mental atau fisik ini dapat mempengaruhi performa subyek, sedangkan eksperimen berupaya mengetahui hubungan antara variabel bebas terhadap variabel terikat semata. Maturasi ini pada umumnya dapat terjadi karena penelitian dilakukan terlalu lama. Oleh karena itu, sama seperti history, hal ini tidak dapat dikendalikan oleh peneliti namun dapat dikontrol dengan melakukan randomisasi.

3. Testing, berkaitan dengan pengaruh pre-test terhadap peningkatan post-test. Adanya pre-test terlebih dahulu sebelum perlakuan ternyata menimbulkan kerancuan. Karena pre-test dapat diduga menjadi pengaruh terhadap perubahan hasil post-test. Melalui adanya pre-test terlebih dahulu, subyek akan memahami dan mempelajari materi yang akan diujikan berdasarkan hasil pre-test. Sehingga peningkatan yang diperoleh dapat diduga bukan hanya terjadi karena perlakuan.

4. Instrumentasi, berkaitan dengan kurang konsistennya instrumen atau tidak reliabel. Sebagaimana dipahami realibilitas berkaitan dengan kekonsistenan instrumen pengukuran yang digunakan pada waktu tertentu. Permasalahan terkait instrumen ini dapat muncul ketika adanya kesulitan yang berbeda antara pre-test dan post-test. Maka, peneliti perlu memperhatikan penyusunan instrumen berdasarkan validitas, reliabilitasnya.

5. Regresi statistik, berkaitan dengan adanya subyek yang memperoleh hasil pre-test yang sangat baik namun, ketika post-test mendapat hasil yang sangat buruk atau dapat terjadi sebaliknya, subyek dengan hasil pre-test yang paling rendah mendapat hasil post-test yang sangat baik. Padahal yang diharapkan subyek dengan pre-test yang paling baik dapat memperoleh hasil yang paling baik pula pada post-test. Sedangkan subyek dengan skor pre-test paling rendah, dapat memperoleh hasil yang lebih baik pada post-test. Maka, peneliti harus menggunakan desain penelitian yang mampu mengendalikan hal ini.

6. Seleksi subyek yang berbeda, berkaitan dengan penggunaan dua atau lebih kelompok yang tidak dirandom, sehingga dipahami bahwa kelompok dari awal sudah menunjukan perbedaan. Sehingga apabila dilakukan perbandingan perbedaan antara dua kelompok bukan hanya dapat terjadi karena adanya perlakuan.

Sedangkan, validitas eksternal berkaitan dengan kemampuan generalisasi hasil penelitian terhadap populasi lain yang representatif. Hal-hal yang perlu diperhatikan diantaranya:

1. Interaksi Pre-test-Perlakuan, kelompok yang telah mengikuti pre-test dapat saja mengingat soal pre-test sehingga perubahan dapat saja bukan karena perlakuan. Hal ini sama seperti yang terjadi pada testing, bahwa subyek yang telah mengikuti pre-test menunjukan perubahan pada hasil post-test karena subyek telah mengingat instrumen pre-test dengan baik. Sehingga hasil yang diperoleh hanya dapat digenerelisasikan pada kelompok yang mendapat pre-test juga.

2. Interaksi seleksi-perlakuan, berkaitan dengan subyek yang tidak dipilih secara acak sehingga membatasi kemampuan peneliti untuk mengeneralisasikan karena keterwakilan sampel dipertanyakan.

3. Spesifitas variabel, mengacu pada fakta bahwa suatu studi yang dilakukan dengan subyek yang spesifik, penggunaan instrumen pengukur yang spesifik, pada waktu yang spesifik dan keadaan yang spesifik.

4. Pengaturan reaktif, mengacu pada munculnya sesuatu yang baru dari subyek seperti menurunnya minat, motivasi belajar sehingga penelitian harus dilakukan dengan periode tertentu agar sesuatu yang baru tersebut hilang dan kondisi subyek diupayakan telah stabil.

5. Interferensi perlakuan jamak, muncul apabila subyek yang sama menerima lebih dari satu perlakuan. Dengan demikian, peneliti perlu menyediakan waktu yang cukup di antara perlakuan-perlakuan sehingga perbedaan dari variabel bebas dapat diketahui secara nyata.

6. Kontaminasi dan bias pelaku eksperimen, muncul apabila peneliti memiliki keakraban dengan subyek sehingga secara tidak sengaja peneliti mempengaruhi perilaku subyek. Dengan demikian, peneliti perlu menjaga profesionalisme dalam penelitian.

B. REALIBILITAS

1. Pengertian Realibilitas beberapa sumber

a. Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu hasil pengukuran dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur dalam diri subyek memang belum berubah.

b. Nur (1987: 47) menyatakan bahwa reliabilitas ukuran menyangkut seberapa jauh skor deviasi individu, atau skor-z, relatif konsisten apabila dilakukan pengulangan pengadministrasian dengan tes yang sama atau tes yang ekivalen.

c. Azwar (2003 : 176) menyatakan bahwa reliabilitas merupakan salah-satu ciri atau karakter utama instrumen pengukuran yang baik.

d. Arifin (1991: 122) menyatakan bahwa suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda. Konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat dengan masalah kekeliruan pengukuran. Kekeliruan pengukuran sendiri menunjukkan sejauh mana inkonsistensi hasil pengukuran terjadi apabila dilakukan pengukuran ulang terhadap kelompok subyek yang sama. Sedangkan konsep reliabilitas dalam arti reliabilitas hasil ukur berkaitan erat dengan kekeliruan dalam pengambilan sampel yang mengacu pada inkonsistensi hasil ukur apabila pengukuran dilakukan ulang pada kelompok yang berbeda.

e. Sudjana (2004: 16) menyatakan bahwa reliabilitas alat penilaian adalah ketepatan atau keajegan alat tersebut dalam menilai apa yang dinilainya. Artinya, kapanpun alat penilaian tersebut digunakan akan memberikan hasil yang relatif sama.

Dari pengertian beberapa ahli tersebut maka dapat disimpulkan bahwa Reliabilitas data adalah derajat konsistensi data yang bersangkutan. Realibilitas berkenaan dengan pertanyaan, apakah suatu data dapat dipercaya sesuai dengan kriteria yang telah ditetapkan. Suatu data dapat dikatakan reliabel jika selalu memberikan hasil yang sama jika diujikan pada kelompok yang sama pada waktu atau kesempatan yang berbeda. Reliabilitas mempermasalahkan sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu hasil pengukuran hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama. kapan pun alat ukur tersebut digunakan akan memberikan hasil ukur yang sama. Contoh paling nyata adalah timbangan atau meteran. Hal yang sama terjadi untuk alat ukur suatu gejala, tingkah laku, ciri atau sifat individu dan lain‑lain.

2. Jenis-Jenis Realibilitas

Salah satu syarat agar hasil suatu tes dapat dipercaya adalah tes tersebut harus mempunyai reliabilitas yang memadai. Oleh karena itu Jaali dan Pudji (2008) membedakan reliabilitas menjadi 2 macam, yaitu :

Reliabilitas Konsistensi tanggapan, dan
Reliabilitas konsistensi gabungan item

1. Reliabilitas Konsistensi Tanggapan

Reliabilitas ini selalu mempersoalkan mengenai tanggapa responden atau objek terhadap tes tersebut apakah sudah baik atau konsisten. Dalam artian apabila tes yang telah di cobakan tersebut dilakukan pengukuran kembali terhadap obyek yang sama, apakah hasilnya masih tetap sama dengan pengukuran sebelumnya. Jika hasil pengukuran kedua menunjukkan ketidakonsistenan, maka hasil pengukuran tersebut tidak mengambarkan keadaan obyek yang sesungguhnya. Untuk mengetahui apakah suatu tes atau instrument tersebut sudah mantap atau konsisten, maka tes/instrument tersebut harus diuji kepada obyek ukur yang sama secara berulang-ulang.

Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan responden terhadap tes (Jaali ; 2008) yaitu :

Teknik test-retest ialah pengetesan dua kali dengan menggunakan suatu tes yang sama pada waktu yang berbeda.
Teknik belah dua ialah pengetesan (pengukuran) yang dilakukan dengan dua kelompok item yang setara pada saat yang sama.
Bentuk ekivalen ialah pengetesan (pengukuran) yang dilakukan dengan menggunakan dua tes yang dibuat setara kemudian diberikan kepada responden atau obyek tes dalam waktu yang bersamaan.

2. Reliabilitas Konsistensi Gabungan Item

Reabilitas ini terkait dengan konsistensi antara item-item suatu tes atau instrument.. Apabila terhadap bagian obyek ukur yang sama, hasil pengukuran melalui item yang satu kontradiksi atau tidak konsisten dengan hasil ukur melalui item yang lain maka pengukuran dengan tes (alat ukur) sebagai suatu kesatuan itu tidak dapat dipercaya. Untuk itu jika terjadi hal demikian maka kita tidak bisa menyalahkan obyek ukur, melainkan alat ukur (tes) yang dipersalahkan, dengan mengatakan bahwa tes tersebut tidak reliable atau memiliki reliabilitas yang rendah.

Koefisien reliabilitas konsistensi gabungan item dapat dihitung dengan menggunakan 3 rumus (Jaali 2008), yakni :

Rumus Kuder-Richardson, yang dikenal dengan nama KR-20 dan KR-21.

Keterangan:

k = cacah butir

p_iq_i = varians skor butir

p_i = proporsi jawaban yang benar untuk butir nomor i

q_i= proporsi jawaban yang salah untuk butir nomor i

S_t² = varians skor total responden

Rumus koefisien Alpha atau Alpha Cronbach.

Keterangan:

r_ii = koefisien reliabilitas

k = cacah butir

s_i² = varians skor butir

s_t² = varians skor total responden

Rumus reliabilitas Hoyt, yang menggunakan analisis varian.

Keterangan:

r_ii = koefisien reliabilitas

V_t= Varians skor total

V_s= Varians sisa

3. Cara Meningkatkan Reliabilitas

1. Mengonsep satu variabel dengan jelas.

2. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah variabel harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain.

3. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat suatu level pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang dimiliki semakin mendetail. Prinsip dasarnya adalah cobalah melakukan pengukuran pada level paling tepat yang mungkin diperoleh.

4. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indikator yang spesifik, peneliti dapat melakukan pengukuran dari range yang lebih luas terhadap konten definisi konseptual.

5. Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan Pilot Studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari literatur-literatur yang berkaitan. Selanjutnya , pengukuran terdahulu dapat dipergunakan sebagai patokan dari pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.

DAFTAR PUSTAKA

Arikunto, Suharsimi. 2003. Prosedur Penelitian, Suatu Praktek. Jakarta: Bina Aksara.

Azwar, Saifuddin. Sikap Manusia Teori dan Pengukurannya. Liberty: Yogyakarta, 1988.

Azwar, Saifudidin. Sikap Manusia Terori dan Pengukurannya. Yokyakarta: Pustaka Pelajar, 2003.

Djaali dan M. Pudji, 2008, Pengukuran dalam Bidang Pendidikan, Grasindo, Jakarta.

Djaali., dkk. Pengukuran Dalam Pendidikan. Jakarta: Program Pascasarjana, 2000.

Nasional, 1992. Nur, Mohamad. Teori Tes. Surabaya: IKIP Surabaya, 1987.

Nurkancana, Wayan., PPN. Sunartana. Evaluasi Hasil Belajar, Surabaya: Usaha

Silverius, Suke. Evaluasi Hasil Belajar dan Umpan Balik. Jakarta: PT Gramedia Widiasarana Indonesia, 1991.

Sudjana, Nana, Penilaian Hasil Proses Belajar Mengajar, Bandung: Remaja Rosdakarya, 2004.

Suryabrata, Sumadi, Pengembangan Alat Ukur Psikologis, Yogyakarta: Andi,2000

PENDIDIKAN

Sabtu, 07 April 2018

VALIDITASI DAN RELIABILITASI

Tidak ada komentar:

Posting Komentar

Pages