VALIDITASI DAN RELIABILITASI
A.
PENGERTIAN
VALIDITASI
1.
Beberapa
pengertian Validitas menurut beberapa sumber :
a.
Azwar (1987: 173) menyatakan
bahwa validitas berasal dari kata validity yang mempunyai arti sejauh
mana ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam melakukan
fungsi ukurnya. Suatu tes dikatakan memiliki validitas yang tinggi apabila alat
tersebut menjalankan fungsi ukur secara tepat atau memberikan hasil ukur yang
sesuai dengan maksud dilakukannya pengukuran tersebut. Artinya hasil ukur dari
pengukuran tersebut merupakan besaran yang mencerminkan secara tepat fakta atau
keadaan sesungguhnya dari apa yang diukur.
b.
Suryabrata (2000: 41)
menyatakan bahwa validitas tes pada dasarnya menunjuk kepada derajat fungsi
pengukurnya suatu tes, atau derajat kecermatan ukurnya sesuatu tes. Validitas
suatu tes mempermasalahkan apakah tes tersebut benar-benar mengukur apa yang
hendak diukur. Maksudnya adalah seberapa jauh suatu tes mampu mengungkapkan
dengan tepat ciri atau keadaan yang sesungguhnya dari obyek ukur, akan
tergantung dari tingkat validitas tes yang bersangkutan.
c.
Sudjana (2004: 12)
menyatakan bahwa validitas berkenaan dengan ketepatan alat penilaian terhadap
konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai.
Suatu tes yang valid untuk tujuan tertentu atau pengambilan keputusan tertentu,
mungkin tidak valid untuk tujuan atau pengambilan keputusan lain. Jadi
validitas suatu tes, harus selalu dikaitkan dengan tujuan atau pengambilan
keputusan tertentu. Tes masuk di SMA misalnya harus selalu dikaitkan dengan
seberapa jauh tes masuk tersebut dapat mencerminkan prestasi atau hasil belajar
para calon peserta didik baru setelah belajar nanti.
d.
(Arikunto, 1999: 65) menyatakan
Validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes.
Suatu tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur.
Tes memiliki validitas yang tinggi jika hasilnya sesuai dengan kriteria, dalam
arti memiliki kesejajaran antara tes dan kriteria.
Menurut
pengertian beberapa sumber diatas dapat disimpulkan bahwa validitasi adalah
suatu ukuran yang menunjukkan tingkat kesahihan suatu tes yang dibuat dari
hasil pengukuran atau evaluasi yang bersifat benar dengan menunjukkan suatu
bukti yang ada.
2.
Jenis
– Jenis Validitas
Validitas suatu instrumen selalu
bergantung kepada situasi dan tujuan khusus penggunaan instrumen tersebut.
Suatu tes yang valid untuk suatu situasi mungkin tidak valid untuk situasi yang
lain. Maka dari itu, dikenal beberapa macam validitas, Menurut Djaali dan Pudji
(2008) validitas dibagi menjadi 3 yaitu:
1. Validitas isi (content validity)
Validitas isi suatu tes
mempermasalahkan seberapa jauh suatu tes mengukur tingkat penguasaan terhadap
isi suatu materi tertentu yang seharusnya dikuasai sesuai dengan tujuan
pengajaran. Dengan kata lain, tes yang mempunyai validitas isi yang baik ialah
tes yang benar-benar mengukur penguasaan materi yang seharusnya dikuasai sesuai
dengan konten pengajaran yang tercantum dalam Garis-Garis Besar Program
Pengajaran (GBPP).
Untuk mengetahui apakah tes itu
valid atau tidak harus dilakukan melalui penelaahan kisi-kisi tes untuk
memastikan bahwa soal-soal tes itu sudah mewakili atau mencerminkan keseluruhan
konten atau materi yang seharusnya dikuasai secara proporsional. Oleh karena
itu, validitas isi suatu tes tidak memiliki besaran tertentu yang dihitung
secara statistika, tetapi dipahami bahwa tes itu sudah valid berdasarkan telaah
kisi-kisi tes. Oleh karena itu, wiersma dan Jurs dalam Djaali dan Pudji (2008)
menyatakan bahwa validitas isi sebenarnya mendasarkan pada analisis logika,
jadi tidak merupakan suatu koefisien validitas yang dihitung secara statistika.
Selanjutnya, validitas isi ini terbagi
lagi menjadi dua tipe, yaitu face validity (validitas muka) dan logical
validity (validitas logis).
·
Face
Validity (Validitas Muka)
Validitas muka adalah tipe validitas
yang paling rendah signifikasinya karena hanya didasarkan pada penilaian
selintas mengenai isi alat ukur. Apabila isi alat ukur telah tampak sesuai
dengan apa yang ingin diukur maka dapat dikatakan validitas muka telah
terpenuhi.
·
Logical
Validity (Validitas Logis)
Validitas logis disebut juga sebagai
validitas sampling (sampling validity). Validitas tipe ini menunjuk pada
sejauhmana isi alat ukur merupakan representasi dari aspek yang hendak diukur
Untuk memperoleh validitas logis yang tinggi suatu alat ukur
harus dirancang sedemikian rupa sehingga benar-benar berisi hanya item yang relevan
dan perlu menjadi bagian alat ukur secara keseluruhan. Suatu objek ukur yang
hendak diungkap oleh alat ukur hendaknya harus dibatasi lebih dahulu kawasan
perilakunya secara seksama dan konkrit. Batasan perilaku yang kurang jelas akan
menyebabkan terikatnya item-item yang tidak relevan dan tertinggalnya bagian
penting dari objek ukur yang seharusnya masuk sebagai bagian dari alat ukur
yang bersangkuatan.
Validitas isi suatu alat evaluasi artinya ketepatan alat
tersebut ditinjau dari segi materi yang dievaluasikan, seperti materi/bahan
yang dipakai sebagai alat evaluasi juga merupakan sampel representattif dari
pengetahuan yang harus dikuasai. Dengan menggunakan kisi-kisi dan format
penulisan soal, keseluruhan soal yang disajikan dalam alat evaluasi akan
merupakan sampel yang representatif dari pengetahuan siswa yang akan diuji.
Apabila soal evaluasi tersusun dari bahan-bahan diluar materi yang diajarkan
maka soal tersebut tidak valid menurut validitas isi. Agar soal yang dibuat
memiliki validitas isi yang baik, haruslah memperhatikan hal-hal berikut ini,
yaitu :
·
Bahan
evaluasi merupakan sampel representatif untuk mengukur seberapa jauh tujuan
dapat tercapai
·
Titik
berat bahan yang diujikan harus berimbang dengan titik berat bahan dalam
kurikulum
·
Untuk
mengerjakan evaluasi tidak diperlukan pengetahuan bahan yang belum diajarkan.
Validitas isi menunjukkan sejauh mana instrumen tersebut
mencerminkan isi yang dikehendaki. Dalam menilai validitas isi suatu instrumen,
kita berkepentingan dengan masalah seberapa jauh isi instrumen itu mencerminkan
seluruh universum isi yang diukur? Agar dapat memiliki validitas isi, suatu
ukuran harus secara memadai menarik sampel topik maupun proses kognitif yang
terdapat di dalam universum isi bidang yang sedang diteliti. Tentu saja
universum isi semacam itu bersifat teoritis. Akan tetapi, kita dapat membuat
suatu kerangka atau kisi-kisi topik, kecakapan, dan kemampuan yang merupakan
wilayah isi yang sedang diukur, disertai petunjuk tentang pentingnya tiap-tiap
wilayah itu. Butir-butir tes dapat ditulis berdasarkan kerangka ini sebagai
pedoman. Validitas isi tidak dapat dinyatakan dalam bentuk angka.
Pengesahan ini pada dasarnya dan terpaksa didasarkan pada pertimbangan, dan
pertimbangan tersebut harus dilakukan secara terpisah untuk setiap situasi.
Peneliti harus selalu menilai validitas isi dari tes hasil belajar buatan
sendiri maupun baku yang akan dipakai dalam penyelidikannya.
2. Validitas
empiris ( kriteria)
Validitas empiris sama dengan validitas kriteria yang
berarti bahwa validitas ditentukan berdasarkan kriteria, baik kriteria internal
maupun kriteria eksternal. Kriteria internal adalah tes atau instrumen itu
sendiri yang menjadi kriteria, sedangkan kriteria eksternal adalah hasil ukur
instrumen atau tes lain di luar instrumen itu sendiri yang menjadi kriteria.
Ukuran lain yang sudah dianggap baku atau dapat dipercaya dapat pula dijadikan
sebagai kriteria eksternal.
Validitas yang ditentukan berdasarkan kriteria internal
disebut validitas internal, sedangkan validitas yang ditentukan berdasarkan
kriteria eksternal disebut validitas eksternal.
·
Validitas
internal
Validitas internal merupakan validitas yang diukur dengan
besaran yang menggunakan instrumen sebagai suatu kesatuan (keseluruhan butir)
sebagai kriteria untuk menentukan validitas item atau butir dari instrumen itu.
Dengan demikian validitas internal mempermasalahkan validitas butir atau item
suatu instrumen dengan menggunakan hasil ukur instrumen tersebut sebagai suatu
kesatuan dan sebagai kriteria, sehingga biasa disebut juga validitas butir.
Pengujian validitas butir instrumen atau soal tes dilakukan
dengan menghitung koefesien korelasi antara skor butir instrumen atau soal tes
dengan skor total instrumen atau tes. Butir atau soal yang dianggap valid
adalah butir instrumen atau soal tes yang skornya mempunyai koefesien korelasi
yang signifikan dengan skor total instrumen atau tes.
·
Validitas
eksternal
Kriteria eksternal dapat berupa hasil ukur instrumen yang
sudah baku atau instrumen yang dianggap baku dapat pula berupa hasil ukur lain
yang sudah tersedia dan dapat dipercaya sebagai ukuran dari suatu konsep atau
varaibel yang hendak diukur. Validitas eksternal diperlihatkan oleh suatu
besaran yang merupakan hasil perhitungan statistika. Jika kita menggunakan hasil
ukur instrumen yang sudah baku sebagai kriteria eksternal, maka besaran
validitas eksternal dari instrumen yang kita kembangkan didapat dengan jalan
mengkorelasikan skor hasil ukur instrumen yang dikembangkan dengan skor hasil
ukur instrumen baku yang dijadikan kriteria. Makin tinggi koefesien korelasi
yang didapat, maka validitas instrumen yang dikembangkan juga makin baik.
Kriteria yang digunakan untuk menguji validitas eksternal adalah nilai table r
(r-tabel).
Validitas yang dikaitkan dengan kriteria menunjuk pada
hubungan antara skor suatu instrumen pengukuran dengan suatu variabel
(kriteria) luar yang mandiri dan dipercaya dapat mengukur langsung tingkah laku
atau ciri-ciri yang diselidiki. Misalnya jika seseorang menyelidiki hubungan
antara skor suatu tes bakat skolastik dengan indeks prestasi (IP) di perguruan
tinggi maka itu berarti bahwa ia menyelidiki validitas es bakat tersebut yang
dikaitkan dengan suatu kriteria. Dalam hal ini, kriteria tersebut adalah IP.
Validitas semacam ini lebih memberi tekanan kepada
kriterianya, bukan kepada instrumen itu sendiri. Hal yang terutama diperhatikan
adalah apa yang dapat diramalkan oleh instrumen tersebut, bukan isi tesnya.
Berbeda dengan validitas isi, validitas yang dikaitkan dengan kriteria ini
menggunakan teknik-teknik empiris untuk menyelidiki hubungan antara skor
instrumen yang sedang dipersoalkan dengan kriteria luar. Ciri yang harus
dimiliki oleh ukuran kriteria adalah relevansi. Kita harus menilai apakah
kriteria yang dipilih itu benar-benar menggambarkan ciri-ciri yang tepat dari
tingkah laku yang sedang diselidiki. Ciri yang kedua ialah bahwa suatu kriteria
haruslah reliabel (dapat dipercaya). Ini berarti bahwa kriteria tersebut harus
merupakan ukuran yang ajeg bagi atribut tersebut, dari waktu ke waktu dan dari
satu situasi ke situasi yang lain. Ciri ketiga hendaknya kriteria bebas dari
bias. Artinya, pemberian skor pada suatu ukuran kriteria hendaknya tidak
dipengaruhi oleh faktor-faktor selain penampilan sebenarnya pada kriteria itu.
Setelah kriteria luar itu ditetapkan, maka data empiris pun dapat segera
dikumpulkan untuk menilai hubungan antara skor pada instrumen pengukur dengan
skor pada kriteria.
3. Validitas
Konstruk (Construct validity)
Menurut Djaali dan Pudji (2008) validitas konstruk adalah
validitas yang mempermasalahkan seberapa jauh item-item tes mampu mengukur
apa-apa yang benar-benar hendak diukur sesuai dengan konsep khusus atau
definisi konseptual yang telah ditetapkan.
Validitas konstruk biasa digunakan untuk instrumen-instrumen
yang dimaksudkan mengukur variabel-variabel konsep, baik yang sifatnya
performansi tipikal seperti instrumen untuk mengukur sikap, minat, konsep diri,
lokus control, gaya kepemimpinan, motivasi berprestasi, dan lain-lain, maupun
yang sifatnya performansi maksimum seperti instrumen untuk mengukur bakat (tes
bakat), intelegensi (kecerdasan intelekual), kecerdasan emosional dan lain-lain.
Untuk menentukan validitas konstruk suatu instrumen harus
dilakukan proses penelaahan teoritis dari suatu konsep dari variabel yang
hendak diukur, mulai dari perumusan konstruk, penentuan dimensi dan indikator,
sampai kepada penjabaran dan penulisan butir-butir item instrumen. Perumusan
konstruk harus dilakukan berdasarkan sintesis dari teori-teori mengenai konsep
variabel yang hendak diukur melalui proses analisis dan komparasi yang logik
dan cermat.
Validitas konstruk biasa digunakan untuk instrumen-instrumen
yang dimaksudkan mengukur variabel-variabel konsep, baik yang sifatnya
performansi tipikal seperti instrumen untuk mengukur sikap, minat, konsep diri,
lokus control, gaya kepemimpinan, motivasi berprestasi, dan lain-lain, maupun
yang sifatnya performansi maksimum seperti instrumen untuk mengukur bakat (tes
bakat), intelegensi (kecerdasan intelekual), kecerdasan emosional dan
lain-lain.
Untuk menentukan validitas konstruk suatu instrumen harus
dilakukan proses penelaahan teoritis dari suatu konsep dari variabel yang
hendak diukur, mulai dari perumusan konstruk, penentuan dimensi dan indikator,
sampai kepada penjabaran dan penulisan butir-butir item instrumen. Perumusan
konstruk harus dilakukan berdasarkan sintesis dari teori-teori mengenai konsep
variabel yang hendak diukur melalui proses analisis dan komparasi yang logik
dan cermat.
3.
Penggunaan
Konsep Validitas dalam Penelitian
Penelitian
eksperimen memiliki karateristik tersendiri dalam penelitian kuantitatif.
Karena variabel bebasnya berupa perlakuan (treatment) yang akan dilihat
pengaruhnya terhadap variabel terikat. Sehingga untuk dapat mengetahui pengaruh
dari variabel bebas terhadap variabel terikat, terdapat variabel-variabel luar
yang seharusnya dikontrol oleh peneliti. Karena secara hakiki, penelitian
eksperimen yang valid berkaitan dengan hasil penelitian adalah benar-benar
berasal dari variabel bebas. Dalam hal ini, penelitian eksperimen memerlukan
validitas dalam penelitiannya. Validitas dalam penelitian eksperimen ini
berkaitan dengan validitas internal dan eksternal.
Validitas
internal mengacu pada hasil yang benar-benar berasal dari variabel bebas
(perlakuan) bukan dari variabel lain. Pada validitas internal ini terdapat
hal-hal perlu diperhatikan dan dikendalikan oleh peneliti seperti:
1. History,
berkaitan dengan adanya peristiwa yang dimiliki masing-masing individu sehingga
dapat mempengaruhi tingkah laku. Peristiwa ini bukan merupakan bagian dari
perlakuan eksperimen, tetapi dapat mempengaruhi performansi pada variabel
bebas. Karena dalam dunia pendidikan, subyek penelitian adalah siswa tentulah
dipahami bahwa siswa tidak mungkin berangkat dari kevakuman namun memiliki
peristiwa yang terjadi di masa lalu. Oleh karena itu, hal ini perlu
dikendalikan dengan melakukan randomisasi, karena peneliti tidak dapat
mengendalikan adanya history tersebut namun dapat mengontrol
kemunculannya.
2. Maturasi,
berkaitan dengan perubahan fisik atau mental individu seperti perubahan menjadi
lebih termotivasi, tidak termotivasi atau bosan dan sebagainya. Perubahan
mental atau fisik ini dapat mempengaruhi performa subyek, sedangkan eksperimen
berupaya mengetahui hubungan antara variabel bebas terhadap variabel terikat
semata. Maturasi ini pada umumnya dapat terjadi karena penelitian dilakukan
terlalu lama. Oleh karena itu, sama seperti history, hal ini tidak dapat
dikendalikan oleh peneliti namun dapat dikontrol dengan melakukan randomisasi.
3. Testing,
berkaitan dengan pengaruh pre-test terhadap peningkatan post-test. Adanya
pre-test terlebih dahulu sebelum perlakuan ternyata menimbulkan kerancuan.
Karena pre-test dapat diduga menjadi pengaruh terhadap perubahan hasil
post-test. Melalui adanya pre-test terlebih dahulu, subyek akan memahami dan
mempelajari materi yang akan diujikan berdasarkan hasil pre-test. Sehingga
peningkatan yang diperoleh dapat diduga bukan hanya terjadi karena
perlakuan.
4. Instrumentasi,
berkaitan dengan kurang konsistennya instrumen atau tidak reliabel. Sebagaimana
dipahami realibilitas berkaitan dengan kekonsistenan instrumen pengukuran yang
digunakan pada waktu tertentu. Permasalahan terkait instrumen ini dapat muncul
ketika adanya kesulitan yang berbeda antara pre-test dan post-test. Maka,
peneliti perlu memperhatikan penyusunan instrumen berdasarkan validitas,
reliabilitasnya.
5. Regresi
statistik, berkaitan dengan adanya subyek yang memperoleh hasil pre-test yang
sangat baik namun, ketika post-test mendapat hasil yang sangat buruk atau dapat
terjadi sebaliknya, subyek dengan hasil pre-test yang paling rendah mendapat
hasil post-test yang sangat baik. Padahal yang diharapkan subyek dengan
pre-test yang paling baik dapat memperoleh hasil yang paling baik pula pada
post-test. Sedangkan subyek dengan skor pre-test paling rendah, dapat
memperoleh hasil yang lebih baik pada post-test. Maka, peneliti harus
menggunakan desain penelitian yang mampu mengendalikan hal ini.
6. Seleksi
subyek yang berbeda, berkaitan dengan penggunaan dua atau lebih kelompok yang
tidak dirandom, sehingga dipahami bahwa kelompok dari awal sudah menunjukan
perbedaan. Sehingga apabila dilakukan perbandingan perbedaan antara dua
kelompok bukan hanya dapat terjadi karena adanya perlakuan.
Sedangkan,
validitas eksternal berkaitan dengan kemampuan generalisasi hasil penelitian
terhadap populasi lain yang representatif.
Hal-hal yang perlu diperhatikan diantaranya:
1. Interaksi
Pre-test-Perlakuan, kelompok yang telah mengikuti pre-test dapat saja mengingat
soal pre-test sehingga perubahan dapat saja bukan karena perlakuan. Hal ini
sama seperti yang terjadi pada testing, bahwa subyek yang telah mengikuti
pre-test menunjukan perubahan pada hasil post-test karena subyek telah
mengingat instrumen pre-test dengan baik. Sehingga hasil yang diperoleh hanya
dapat digenerelisasikan pada kelompok yang mendapat pre-test juga.
2. Interaksi
seleksi-perlakuan, berkaitan dengan subyek yang tidak dipilih secara acak
sehingga membatasi kemampuan peneliti untuk mengeneralisasikan karena
keterwakilan sampel dipertanyakan.
3. Spesifitas
variabel, mengacu pada fakta bahwa suatu studi yang dilakukan dengan subyek
yang spesifik, penggunaan instrumen pengukur yang spesifik, pada waktu yang
spesifik dan keadaan yang spesifik.
4. Pengaturan
reaktif, mengacu pada munculnya sesuatu yang baru dari subyek seperti
menurunnya minat, motivasi belajar sehingga penelitian harus dilakukan dengan
periode tertentu agar sesuatu yang baru tersebut hilang dan kondisi subyek
diupayakan telah stabil.
5. Interferensi
perlakuan jamak, muncul apabila subyek yang sama menerima lebih dari satu
perlakuan. Dengan demikian, peneliti perlu menyediakan waktu yang cukup di
antara perlakuan-perlakuan sehingga perbedaan dari variabel bebas dapat
diketahui secara nyata.
6. Kontaminasi
dan bias pelaku eksperimen, muncul apabila peneliti memiliki keakraban dengan
subyek sehingga secara tidak sengaja peneliti mempengaruhi perilaku subyek.
Dengan demikian, peneliti perlu menjaga profesionalisme dalam penelitian.
B. REALIBILITAS
1.
Pengertian Realibilitas
beberapa sumber
a.
Reliabilitas berasal dari
kata reliability berarti sejauh mana hasil suatu pengukuran dapat
dipercaya. Suatu hasil pengukuran dapat dipercaya apabila dalam beberapa kali
pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil
pengukuran yang relatif sama, selama aspek yang diukur dalam diri subyek memang
belum berubah.
b.
Nur (1987: 47) menyatakan
bahwa reliabilitas ukuran menyangkut seberapa jauh skor deviasi individu, atau
skor-z, relatif konsisten apabila dilakukan pengulangan pengadministrasian
dengan tes yang sama atau tes yang ekivalen.
c.
Azwar (2003 : 176)
menyatakan bahwa reliabilitas merupakan salah-satu ciri atau karakter utama
instrumen pengukuran yang baik.
d.
Arifin (1991: 122)
menyatakan bahwa suatu tes dikatakan reliabel jika selalu memberikan hasil yang
sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang
berbeda. Konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat
dengan masalah kekeliruan pengukuran. Kekeliruan pengukuran sendiri menunjukkan
sejauh mana inkonsistensi hasil pengukuran terjadi apabila dilakukan pengukuran
ulang terhadap kelompok subyek yang sama. Sedangkan konsep reliabilitas dalam
arti reliabilitas hasil ukur berkaitan erat dengan kekeliruan dalam pengambilan
sampel yang mengacu pada inkonsistensi hasil ukur apabila pengukuran dilakukan
ulang pada kelompok yang berbeda.
e.
Sudjana (2004: 16)
menyatakan bahwa reliabilitas alat penilaian adalah ketepatan atau keajegan
alat tersebut dalam menilai apa yang dinilainya. Artinya, kapanpun alat
penilaian tersebut digunakan akan memberikan hasil yang relatif sama.
Dari
pengertian beberapa ahli tersebut maka dapat disimpulkan bahwa Reliabilitas
data adalah derajat konsistensi data yang bersangkutan. Realibilitas berkenaan
dengan pertanyaan, apakah suatu data dapat dipercaya sesuai dengan kriteria
yang telah ditetapkan. Suatu data dapat dikatakan reliabel jika selalu
memberikan hasil yang sama jika diujikan pada kelompok yang sama pada waktu
atau kesempatan yang berbeda. Reliabilitas
mempermasalahkan sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu
hasil pengukuran hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran
terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif
sama. kapan pun alat ukur tersebut digunakan akan memberikan hasil ukur yang
sama. Contoh paling nyata adalah timbangan atau meteran. Hal yang sama terjadi
untuk alat ukur suatu gejala, tingkah laku, ciri atau sifat individu dan lain‑lain.
2.
Jenis-Jenis
Realibilitas
Salah satu syarat agar hasil suatu tes dapat dipercaya
adalah tes tersebut harus mempunyai reliabilitas yang memadai. Oleh karena itu
Jaali dan Pudji (2008) membedakan reliabilitas menjadi 2 macam, yaitu :
- Reliabilitas Konsistensi
tanggapan, dan
- Reliabilitas konsistensi
gabungan item
1. Reliabilitas Konsistensi Tanggapan
Reliabilitas ini selalu mempersoalkan mengenai tanggapa
responden atau objek terhadap tes tersebut apakah sudah baik atau konsisten.
Dalam artian apabila tes yang telah di cobakan tersebut dilakukan pengukuran
kembali terhadap obyek yang sama, apakah hasilnya masih tetap sama dengan
pengukuran sebelumnya. Jika hasil pengukuran kedua menunjukkan
ketidakonsistenan, maka hasil pengukuran tersebut tidak mengambarkan keadaan
obyek yang sesungguhnya. Untuk mengetahui apakah suatu tes atau instrument
tersebut sudah mantap atau konsisten, maka tes/instrument tersebut harus diuji
kepada obyek ukur yang sama secara berulang-ulang.
Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan
responden terhadap tes (Jaali ; 2008) yaitu :
- Teknik
test-retest
ialah
pengetesan dua kali dengan menggunakan suatu tes yang sama pada waktu yang
berbeda.
- Teknik
belah dua
ialah
pengetesan (pengukuran) yang dilakukan dengan dua kelompok item yang
setara pada saat yang sama.
- Bentuk
ekivalen
ialah
pengetesan (pengukuran) yang dilakukan dengan menggunakan dua tes yang
dibuat setara kemudian diberikan kepada responden atau obyek tes dalam
waktu yang bersamaan.
2.
Reliabilitas Konsistensi Gabungan Item
Reabilitas ini terkait dengan konsistensi antara item-item
suatu tes atau instrument.. Apabila terhadap bagian obyek ukur yang sama, hasil
pengukuran melalui item yang satu kontradiksi atau tidak konsisten dengan hasil
ukur melalui item yang lain maka pengukuran dengan tes (alat ukur) sebagai
suatu kesatuan itu tidak dapat dipercaya. Untuk itu jika terjadi hal demikian
maka kita tidak bisa menyalahkan obyek ukur, melainkan alat ukur (tes) yang
dipersalahkan, dengan mengatakan bahwa tes tersebut tidak reliable atau
memiliki reliabilitas yang rendah.
Koefisien reliabilitas konsistensi gabungan item dapat
dihitung dengan menggunakan 3 rumus (Jaali 2008), yakni :
- Rumus
Kuder-Richardson, yang dikenal dengan nama KR-20 dan KR-21.
Keterangan:
k =
cacah butir
piqi = varians skor butir
pi = proporsi jawaban yang benar untuk butir nomor i
qi = proporsi jawaban yang salah untuk butir nomor i
St2 = varians skor total responden
- Rumus koefisien Alpha atau
Alpha Cronbach.
Keterangan:
rii =
koefisien reliabilitas
k = cacah
butir
si2 =
varians skor butir
st2 =
varians skor total responden
- Rumus reliabilitas Hoyt, yang
menggunakan analisis varian.
Keterangan:
rii = koefisien reliabilitas
Vt = Varians skor total
Vs = Varians sisa
3.
Cara Meningkatkan Reliabilitas
1. Mengonsep satu variabel dengan jelas.
2. Setiap pengukuran harus merujuk pada satu dan hanya
satu konsep/variabel. Sebuah variabel harus spesifik agar dapat mengurangi
intervensi informasi dari variabel lain.
3. Menggunakan level pengukuran yang tepat. Semakin
tinggi atau semakin tepat suatu level pengukuran, maka variabel yang dibuat
akan semakin reliabel karena informasi yang dimiliki semakin mendetail. Prinsip
dasarnya adalah cobalah melakukan pengukuran pada level paling tepat yang
mungkin diperoleh.
4. Gunakan lebih dari satu indikator. Dengan adanya lebih
dari satu indikator yang spesifik, peneliti dapat melakukan pengukuran dari
range yang lebih luas terhadap konten definisi konseptual.
5. Gunakan Tes Pilot, yakni dengan membuat satu atau
lebih draft atau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis
(pretest). Dalam penggunaan Pilot Studies, prinsipnya adalah mereplikasi
pengukuran yang pernah dilakukan oleh peneliti terdahulu dari
literatur-literatur yang berkaitan. Selanjutnya , pengukuran terdahulu dapat
dipergunakan sebagai patokan dari pengukuran yang dilakukan peneliti saat ini.
Kualitas pengukuran dapat ditingkatkan dengan berbagai cara sejauh definisi dan
pemahaman yang digunakan oleh peneliti kemudian tetap sama.
DAFTAR PUSTAKA
Arikunto, Suharsimi. 2003. Prosedur Penelitian,
Suatu Praktek. Jakarta: Bina Aksara.
Azwar, Saifuddin. Sikap Manusia Teori dan Pengukurannya. Liberty:
Yogyakarta, 1988.
Azwar, Saifudidin. Sikap Manusia Terori dan Pengukurannya.
Yokyakarta: Pustaka Pelajar, 2003.
Djaali dan M. Pudji, 2008, Pengukuran dalam Bidang Pendidikan,
Grasindo, Jakarta.
Djaali., dkk. Pengukuran Dalam Pendidikan. Jakarta: Program
Pascasarjana, 2000.
Nasional, 1992. Nur, Mohamad. Teori Tes. Surabaya: IKIP
Surabaya, 1987.
Nurkancana, Wayan., PPN. Sunartana. Evaluasi Hasil Belajar,
Surabaya: Usaha
Silverius, Suke. Evaluasi Hasil Belajar dan Umpan Balik. Jakarta:
PT Gramedia Widiasarana Indonesia, 1991.
Sudjana, Nana, Penilaian Hasil Proses Belajar Mengajar, Bandung:
Remaja Rosdakarya, 2004.
Suryabrata, Sumadi, Pengembangan Alat Ukur Psikologis,
Yogyakarta: Andi,2000
Tidak ada komentar:
Posting Komentar