Kamis, Januari 24, 2013

Validitas dan Reliabilitas

A.    Definisi Validitas
Validitas berasal dari bahasa Inggris dari kata validity yang berarti keabsahan atau kebenaran. Dalam konteks alat ukur atau instrumen asesmen, validitas berarti sejauh mana kecermatan atau ketepatan alat ukur dalam
melakukan fungsi ukurnya. Sebuah instrumen yang valid akan menghasilkan data yang tepat seperti yang diinginkan. Sebagai contoh, jika kita ingin mengetahui
berat maka alat ukur yang tepat adalah timbangan atau neraca bukan meteran,
termometer, atau alat yang lain. Dengan kata lain, sifat valid memberikan
pengertian bahwa alat ukur yang digunakan mampu memberikan nilai yang sesungguhnya dari apa yang diinginkan.
Contoh di atas barang kali terlalu sederhana dan mudah untuk mengecek
dan mengendalikannya. Berbeda halnya jika kita akan melakukan pengukuran
dalam dunia pembelajaran atau dunia pendidikan, tidak sesederhana seperti pada
pengukuran berat ataupun panjang. Untuk mengetahui alat ukur prestasi belajar
apakah valid atau tidak maka perlu dipelajari dengan hati -hati.
            Validitas sangat berkaitan dengan tujuan pengukuran. Validitas tidak
berlaku secara umum bagi semua pengukuran. Suatu tes mempunyai hasil ukuran
yang baik (valid) untuk suatu tujuan tertentu yang spesifik tetapi tidak valid
untuk tujuan yang lain atau bahkan untuk tujuan yang sama pada kelompok yang
lain.
Linn & Gronlund (2000) mengemukakan hakikat validitas tes dan asesmen
sebagai berikut.
1.      Validitas menyatakan ketepatan interpretasi hasil bukan pada prosedurnya.
2.      Validitas merupakan persoalan yang berkaitan dengan derajat (tingkatan),
sebagai konsekuensinya kita harus menghindari pemikiran hasil asesmen
sebagai valid atau tidak valid. Oleh karena validitas adalah persoalan
derajad maka sebuah instrumen dapat dikategorikan mempunyai derajad
validitas tinggi, sedang, dan rendah.
3.      Validitas selalu bersifat khusus untuk penggunaan atau interpretasi
tertentu. Tidak ada asesmen yang valid untuk semua tujuan. Sebagai
contoh, hasil tes aritmatika mungkin mempunyai tingkat validitas yang
tinggi untuk kemampuan hitung, validitas yang r endah untuk alasan-alasan
aritmatika, dan mempunyai derajat validitas sedang untuk memprediksi
kesuksesan prestasi matematika yang akan datang.
4.      Validitas merupakan kesatuan konsep. Hakikat konsep validitas dipandang
sebagai sebuah kesatuan konsep berdasark an berbagai macam bagian dari fakta.
5.      Validitas melibatkan sebuah keputusan evaluatif yang menyeluruh.

B.     Macam-macam Validitas
Di dalam buku Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B. Anderson dan kawan-kawan disebutkan: A test is valid if it measure what it purpose to measure. Atau jika diartikan lebih kurang demikian: sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia “valid” disebut dengan istilah “sahih”.
Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes  itu sendiri tetapi pada hasil pengetesan atau skornya.
Contoh: skor yang diperoleh dari hasil mengukur kemampuan mekanik akan menunjukkan kemampuan seseorang dalam memegang dan memperbaiki mobil, bukan pengetahuan orang tersebut dalam hall yang berkaitan dengan mobil bukanlah tes yang sahih untuk mekanik.
            Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.
1)      Validitas Logis
            Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika” yang berarti penalaran. Dengan makna demikian maka validitas  logis untuk sebuah instrumen evaluasi menunjuk pada kondisi bagi sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang terpenuhi apabila instrumen yang bersangkutan sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah karangan, jika penulis sudah mengikuti aturan mengarang, tentu secara logis karangannya sudah baik.
Maka instrumen yang sudah disusun berdasarkan teori penyusunan instrumen, secara logis dapat dikatakan sudah valid. Dari penjelasan tersebut kita dapat memahami bahwa validitas logis dapat dicapai apabila instrumen disusun mengikuti ketentuan yang ada. Dengan demikian, dapat disimpulkan bahwa validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah instrumen tersebut selesai disusun.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu: validitas isi dan validitas konstrak. Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah instrumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi. Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi sebuah instrumen yang disusun berdasarkan konstrak aspek-aspek kejiwaan yang seharusnya dievaluasi. Penjelasan lebih jauh tentang kedua jenis validitas logis ini akan diberikan berturut-turut dalam membahas jenis-jenis validitas instrumen nanti.
2)      Validitas Empiris
Istilah “validitas empiris” memuat kata empiris yang artinya “pengalaman”. Sebuah instrumen dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari, seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut sudah banyak menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang sudah ada. Dari penjelasan dan contoh tersebut diketahui bahwa validitas empiris tidak dapat diperoleh hanya dengan menyusun instrumen seperti validitas logis, tetapi harus dibuktikan melalui pengalaman.
Ada dua macam validitas empiris, yakni ada dua cara yang dapat dilakukan untuk menguji bahwa instrumen memang valid. Pengujian tersebut dilakukan dengan membandingkan kondisi instrumen yang bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang digunakan sebagai pembanding kondisi instrumen dimaksudkan ada dua, yaitu yang sudah tersedia dan yang belum ada tetapi akan terjadi di waktu yang akan datang. Bagi instrumen yang kondisinya sesuai dengan kriterium yang sudah tersedia disebut memiliki validitas “sekarang ada”, yang dalam istilah bahasa Inggris disebut memiliki concurrent validity. Selanjutnya instrumen yang kondisinya sesuai dengan kreterium yang diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas prediksi, yang dalam istilah bahasa Inggris disebut memiliki prediktive validity.
Dari uraian adanya dua jenis validitas, yakni validitas logis yang ada dua macam, dan validitas empiris yang juga ada dua macam, maka secara keseluruhan kita mengenal adanya empat validitas, yaitu:
(1)   Validitas Isi
(2)   Validtas Konstrak
(3)   Validitas “ada sekarang” dan
(4)   Validitas predictive.
           Dua yang pertama yakni (1) dan (2) melalui penyusunan berdasarkan ketentuan atau teori, sedangkan dua berikutnya, yakni (3) dan (4) dicapai atau diketahui sesudah dibuktikan melalui pengalaman. Adapun penjelasan masing-masing validitas adalah sebagai berikut.
1)      Validitas Isi (content validity)
           Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum maka validitas ini sering juga disebut validitas kurikuler.
            Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara merinci materi kurikulum atau meteri buku pelajaran. Bagaimana cara merinci materi untuk kepentingan diperolehnya validitas isi sebuah tes akan dibicarakan secara mendalam pada waktu menjelaskan cara penyusunan tes.
2)      Validitas Konstruksi (construct validity)
           Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun dan mengukur setiap aspek berpikir seperti yang disebutkan dalam Tujuan Instruksional Khusus. Sebagai contoh jika Rumusan Tujuan Instruksioanl Khusus (TIK): “Siswa dapat membandingkan antara aspek biologis dan aspek psikologis”, maka butir soal pada tes merupakan perintah agar siswa membedakan antara dua efek tersebut.
           Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan cara merinci dan memasangkan setiap butir soal dengan setiap aspek dalam TIK. Pengerjaannya dilakukan berdasarkan logika, bukan pengalaman. Dalam pembicaraan mengenai penyusunan tes hal ini akan disinggung lagi.
3)      Validitas “ada sekarang” (concurrent validity)
           Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang, concurrent).
           Dalam membandingkan hasil sebuah tes maka diperlukan suatu kriterium atau alat pembanding. Maka hasil tes merupakan suatu yang dibandingkan. Untuk jelasnya dibawah ini dikemukakan sebagai contoh: misalnya seorang guru ingin mengetahui apakah hasil tes sumatif disusun sudah valid atau belum. Untuk ini diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki. Misalnya nilai ulangan harian atau nilai ulangan sumatif yang lalu.
4)      Validitas Prediksi (predictive validity)
           Memprediksi artinya meramal, yaitu selalu mengenai hal yang akan datang, jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan datang.
           Misalnya tes masuk Perguruan Tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan datang. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi-rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin akan mampu mengikuti perkuliahan kelak. Sebaliknya seorang calon dikatakan tidak lulus tes karena memiliki nilai tes rendah diperkirakan akan tidak mampu mengikuti perkuliahan yang akan datang.
           Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta didik mengikuti pelajaran di Perguruan Tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan dengan yang dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud tidak memiliki validitas prediksi.  

C.      Faktor-Faktor yang Mempengaruhi Validitas
Banyak faktor yang menyebabkan hasil asesmen tidak valid. Beberapa di
antaranya tampak jelas dan mudah untuk menghindarinya. Tidak ada guru yang
akan berpikir untuk mengukur pengetahuan biologi dengan asesmen matematika.
Demikian pula juga tidak ada guru yang akan mengukur kemampuan memecahkan masalah (problem solving) biologi kelas 7 SMP dengan
menggunakan asesmen yang didesain untuk kelas 12 SMA. Dalam dua contoh
tersebut sudah sangat jelas hasil asesmen akan menjadi tidak valid.
Faktor yang mempengaruhi validitas tes antara lain:
1)      Faktor dari dalam tes itu sendiri
Pengujian terhadap butir tes secara hati-hati akan menunjukkan apakah tes
yang digunakan untuk mengukur isi materi atau fungsi -fungsi mental yang akan
diases oleh guru. Bagaimanapun juga, beberapa faktor berikut dapat menjaga
butir tes dari fungsi yang dikehendaki dan dengan demikian juga terjaga dari
rendahnya validitas hasil asesmen. Lima faktor yang pertama dapat diterapkan
sejajar dengan asesmen penampilan siswa secara luas serta tes-tes tradisional.
Lima faktor yang terakhir lebih diterapkan secara langsung terhadap tes pilihan
dan tes dengan jawaban singkat dengan jawaban benar atau salah.
a.       Petunjuk yang tidak jelas. Petunjuk yang tidak jelas menyebabkan siswa kehilangan waktu untuk sekedar memahami petunjuk pengerjaan atau bahkan tidak dapat melakukan apa yang seharusnya dilakukan.
b.      Penggunaan kosakata dan struktur kalimat yang sulit dimengerti. Penggunaan kosakata atau struktur kalimat yang sulit dimengerti dapat menyebabkan siswa terjebak untuk memahami maksud dari sebuah pertanyaan bukan untuk menyelesaikan pertanyaan itu sendiri.
c.       Ambiguitas. Ambiguitas yaitu adanya kemungkinan multi tafsir juga menyebabkan menurunnya validitas sebuah tes. Karena ambiguitas menyebabkan siswa salah dalam menafsirkan kata-kata.
d.      Alokasi waktu yang tidak cukup. Seyogyanya sebuah tes memberikan waktu yang cukup bagi siswa untuk mengerjakan seluruh butir tes yang ada. Kekurangan waktu dalam menyelesaikan sebuah tes bisa jadi bukan karena siswa tidak mampu untuk menyelesaikan tesnya tetapi karena keterbatasan kesempatan untuk mengerjakannya.
e.       Penekanan yang berlebihan terhadap aspek tertentu, sehingga terlalu mudah ditebak kecenderungan dari jawaban soal akan menyebabkan menurunnya tingkat validitas soal.
f.       Kualitas butir tes yang tidak memadai untuk mengukur hasil belajar. Kualitas yang tidak memadai misalnya tes dimaksudkan untuk megukur kemampuan berpikir tingkat tinggi (higher order thinking) jelas tidak cukup hanya digunakan tes yang bersifat untuk mengungkap pengetahuan faktual saja.
g.      Susunan tes yang jelek
h.      Tes terlalu pendek.
i.        Penyusunan butir tes yang tidak runtut.
j.        Pola jawaban yang mudah ditebak, misalnya pada soal pilihan ganda jawabannya adalah A semua, atau B semua atau menunjukkan pola tertentu misalnya D, C, B, A, D, C, B, A, dan sebagainya.
2)      Faktor berfungsinya tes dan prosedur mengajar
Sebuah tes dikatakan valid apabila dapat memenuhi fungsinya sebagai alat evaluasi yang dapat mengukur jangkauan hasil belajar yang dilakukan oleh guru kepada siswa. Tes yang valid juga digunakan sebagai bahan acuan guru dalam melaksanakan pembelajaran agar dapat mencapai tujuan belajar. Hal ini berfungsi untuk membatasi bahasan atau materi yang akan disampaikan agar tidak terlalu melebar pada konteks yang terlalu luas.
3)      Faktor administrasi dan penskoran.
            Pemberian skor terhadap jawaban siswa (testee) harus dilakukan secara hati-hati jangan sampai salah tulis atau meremehkan selisih angka walaupun hanya sedikit. Hal ini akan menyebabkan hasil pengujian terhadap validitas akan memberikan makna yang berbeda.
4)      Faktor tanggapan siswa.
            Tanggapan siswa yang tidak serius bisa hanya dijumpai pada saat siswa diminta untuk mengisi sebuah angket. Hal ini akan menyebabkan siswa mengisi angket secara sembarangan karena merasa tidak penting maupun alasan -alasan yang lain. Oleh karena itu berikan angket pada waktu dan kondisi yang tepat .
5)      Hakikat kelompok dan kriteria.
            Seperti sudah dijelaskan di atas bahwa validitas bersifat spesifik. Sebuah asesmen atau instrumen alat ukur mungkin hanya valid untuk kelompok tertentu saja dan tidak valid untuk kelompok yang lain. Sebagai contoh misalnya sebuah tes diujicobakan pada siswa jurusan akuntansi hasilnya akan berbeda dengan jika diujicobakan pada siswa jurusan IPA.

D.    Definisi Reliabilitas
Reliabilitas diterjemahkan dari kata reliability yang berarti hal yang dapat
dipercaya (tahan uji). Sebuah tes dikatakan mempunyai reliabilitas yang tinggi
jika tes tersebut memberikan data hasil yang tetap (ajeg) walaupun diberikan pada
waktu yang berbeda kepada responden yang sama. Hasil tes yang tetap atau
seandainya berubah maka perubahan itu tidak signifikan maka tes tersebut
dikatakan reliabel. Oleh karena itu reliabilitas sering disebut dengan keterpercayaan, keterandalan, keajegan, konsistensi, kestabilan, dan sebagainya.
Seperti diuraikan di atas sebuah alat ukur yang baik harus valid dan
reliabel. Namun demikian validitas lebih penting dibandingkan dengan
reliabilitas. Reliabilitas merupakan penyokong validitas. Sebuah alat ukur yang
valid selalu reliabel. Akan tetapi alat ukur yang reliabel belum tentu valid, seperti
digambarkan pada ilustrasi di atas. Seperti halnya validitas, reliabilitas juga merupakan tingkatan. Tingkat atau kadar reliabilitas dinyatakan dengan koefisien reliabilitas.

E.     Cara-cara Mencari Besarnya Reliabilitas
            Reliabiltas adalah ketetapan suatu tes apabila diteskan kepada subyek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus korelasi product moment  untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.
            Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada diluar tes (consistency external) dan pada tes itu sendiri (consistency internal).
1)      Metode bentuk paralel (equivalent)
            Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesuakaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa Inggris disebut alternate-forms method (paralel form).
            Dengan metode bentuk paralel ini, dua buah tes yang paralel, misalnya tes Matematika Seri A yang akan dicari reliabilitasnya dan tes Seri B diteskan kepada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang menunjukkan keofisien reliabiltas tes Seri A. Jika koefisiennya tinngi maka tes tersebut sudah reliabel dan dapat digunakan sebagai alat pengetes yang terandalkan.
            Dalam menggunakan metode tes paralel ini pengetes harus menyiapakan dua buah tes, dan masing-masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada orang menyebutkan sebagai double test-double-trial-method. Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor “masih ingat soalnya” yang dalam evaluasi disebut adanya practice-effect dan carry-over effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut. 
            Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.
2)      Metode Tes Ulang (test-retest method)
            Metode tes ulang dilakukan orang untuk menghindari penyusunan dua tes seri. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi diujicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali maka metode ini dapat disebut dengan single-test-double-trial-method. Kemudian hasil dari kedua tes tersebut dihitung korelasinya.
            Untuk tes yang banyak mengungkapkan pengetahuan (ingatan) dan pemahaman, cara ini kurang mengena krena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena itu, tenggang waktu antara pemberian tes pertama dengan yang kedua menjadi permasalahan tersendiri. Jika tenggang waktu terlalu sempit, siswa masih banyak ingat masteri. Sebaliknya kalau faktor waktu terlalu lama, maka faktor-faktor atau kondisi tes sudah akan berbeda. Tentu saja faktor-faktor ini akan berpengaruh bila terhadap reliabilitas. Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes yang pertama. Hal ini tidak mengapa karena pengetes harus sadar akan adanya practice effect dan carry over effect. Yang penting adalah adanya kesejajaran hasil atau ketetapan hasil yang ditunjukkan oleh koefisien korelasi yang tinggi.
Contoh:
Siswa
Tes Pertama
Tes Kedua
Skor
Rangking
Skor
Rangking
A
B
C
D
E
15
20
9
18
12
3
1
5
2
4
20
25
15
23
18
3
1
5
2
4

            Walaupun  tampak skornya naik, akan tetapi kenaikannya dialami oleh semua siswa. Metode ini juga disebut self-correlation method (korelasi diri sendiri) karena mengkorelasikan hasil dari tes yang sama.
3)      Metode Belah Dua atau Split-half Method
            Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu tes dua kali percobaan diatas dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan dua kali. Oleh karena itu, disebut juga single-test-single-trial method.
            Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien korelasi langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak dapat demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui reliabilitas setengah tes. Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus Sperman-Brown sebagai berikut.
Contoh:
Di mana:
r1/21/2 = korelasi antara skor-skor setiap belahan tes
r11 = koefisien reliabilitas yang sudah disesuaikan.
Contoh:
Korelasi antara belahan tes = 0,60
Maka reliabilitas tes =
            Banyak pemakai metode ini salah membelah hasil tes pada waktu menganalisis. Yang mereka lakukan adalah mengelompokan hasil separo subyek peserta tes dan separo yang lain kemudian hasil kedua  kelompok ini dikorelasikan. Yang benar adalah membelah item atau butir soal. Tidak akan keliru kiranya bagi pemakai metode ini harus ingat bahwa banyaknya butir soal harus genap agar dapat dibelah.
            Ada dua cara membelah butir soal ini yaitu:
a.       Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut belahan ganjil-genap, dan
b.      Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada nomor-nomor akhir yang selanjutnya disebut belahan awal-akhir.
Selain menggunakan rumus korelasi product moment, dua orang ahli mengajukan rumus lain. Seorng bernama Flanagan menemukan rumus yang perhitungannya menngunakan belah dua ganjil-genap dan seorang lagi bernama Rulon yang rumusnya diterapkan pada data awal-akhir.
Penggunaan rumus Flanagan
Rumus
Di mana:
r11 = reliabilitas tes
 varians belahan pertama (1) yang dalam hal ini varians skor item ganjil
varians belahan kedua (2) yaitu varians skor item genap
= varians total yaitu skor total
            Secara sederhana dapat dipahami bahwa varians adalah standar deviasi kuadrat. Dengan demikian bagi peminat yang menghitung  dengan kalkulator statistik varians ini diperoleh dengan menguadratkan standar deviasi. Untuk mereka yang tidak menggunakan kalkulator statistik maka varians dapat dicari dengan rumus sebagai berikut:
            Standar deviasi (SD) dapat disebut dengan istilah Indonesia Simpangan Baku (SB). Namun huruf S (B besar) juga dapat dikatakan sudah menyebut standar deviasi. Dalam kalkulator tertera dengan simbol σ.
            Bagi yang berminat mencari S dulu untuk mencari varians, dapat menggunakan rumus S, yaitu:
S = standar deviasi
x = Simpangan baku X dan , yang dicari dari
S2 = Varians, selalu dituliskan dalam bentuk kuadrat, karena standar deviasi kuadrat
N = Banyaknya subjek pengikut tes
Penggunaan Rumus Rulon
Rumus: r11 = 1 -
Di mana:
 varians beda (verians difference)
 difference yaitu perbedaan antara skor belahan pertama (awal( dengan skor belahan kedua (akhir)
Penggunaan Rumus K-R.20
Rumus r11 =
Di mana:
r11= reliabilitas tes secara keseluruhan
p = proporsi subjek yang menjawab item dengan benar
q = proporsi subjek yang menjawab item dengan salah (q = 1- p)
∑pq = jumlha hasil perkalian antara p dan q
p = banyaknya item
S = standar deviasi tes (standar deviasi adalah akar varians)
            Dalam buku-buku lain n (n kecil) ini sering diganti dengan huruf k (k kecil), yang juga melambangkan banyaknya item. Demikian juga huruf S sebagai lambang standar deviasi, dituliskan SB sebagai singkatan dari kata “Simpangan Baku.” Maka rumus K-R 20 menjadi:
r11 =
Penggunaan rumus K-R 21
Rumus K-R 21;
r11 =
keterangan
M = Mean atau rerata skor total
Jika dibandingkan reliabilitas yang dihitung dengan K-R 20 dan K-R 21 lebih besar yang pertama. Memang menggunakan rumus K-R 20 cenderung memberikan hasil yang lebih tinggi, tetapi pekerjaan lebih rumit.
Penggunaan Rumus Hoyt
Rumusnya adalah:
r11 = 1 -     atau   r11 =
r11 = Reliabilitas seluruh soal
Vr = Varians Responden
Vs = Varians sisa
            Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah sebagai berikut:
Langkah 1: mencari jumlah kuadrat responden dengan rumus:
Jk(r) =  
Keterangan:
Jk(r) = jumlah kuadrat responden
Xt = skor total tiap responden
K = banyaknya item
N = banyaknya responden atau subyek
Langkah 2: mencari jumlah kuadrat item dengan rumus:
Jk(i) =  -
Keterangan:
Jk(1) = Jumlah kuadrat item
∑B2 = Jumlah kuadrat jawab benar seluruh item
(∑Xt)2 = Kuadrat dari jumlah skor total
Langkah 3: Mencari jumlah kuadrat total dengan rumus
Jk(t) =
Keterangan:
Jk(t) = jumlah kuadrat total
∑B = jumlah jawab benar seluruh item
∑S = jumlah jawab salah seluruh item
Langkah 4: mencari jumlah kuadrat sisa, dengan rumus:
Jk(s) = Jk(t) – Jk(r) – J(i)
Langkah 5: mencari varians responden dan varians sisa dengan tabel F.
Dalam mencari varians ini diperlukan d.b (derajat kebebasan) dari masing-masing sumber varians kemudian d.b ini digunakan sebagai penyebut terhadap setiap jumlah kuadrat untuk memperoleh variansi.
d.b = banyaknya N setiap sumber variansi dikurangi 1.
Jadi Variansi =
Langkah 6: Memasukkan ke dalam rumus r11
mencari reliabilitas tes bentuk uraian
apa yang sudah dibeicarakan didepan atau juga yang banyak terdapat di buku-buku lain, hanya meliputi uraian mengenai reliabilitas tes bentuk objektif, yaitu soal yang terdiri dari butir-butir soal yang dinilai hanya “benar” atau “salah.” Menilai soal bentuk uraian tidak dapat dilakukan seperti itu. Suatu butir soal uraian menghendaki gradualisasi penilaian. Barangkali butir soal nomor 1 penilaian terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi hanya 5, dan butir soal 3 sampai 10, dan sebagainya.
Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan analisis butir soal seperti halnya soal bentuk objektif. Skor untuk masing-masing butir soal dicantunkan pada kolom item menurut apa adanya. Rumus yang digunakan adalah rumus Alpha sebagai berikut:
r11 =  
di mana:
r11 = reliabilitas yang dicari
 = jumlah varians skor tiap-tiap item
= varians total
Bagi mahasiswa yang menulis skripsi dan ingin menguji reliabilitas angket yang digunakan untuk mengumpulkan data, rumus Alpha ini dapat juga diterapkan. Kesalahan fatal yang sering kita jumpai adalah penggunaan teknik belah dua untuk menghitung reliabilitas angket. Dalam menggunakan teknik belah dua, peneliti harus selalu ingat persyaratannya, antara lain bahwa belahan pertama dengan belahan kedua yang dicari kesejajaran harus seimbang.

Tidak ada komentar:

Poskan Komentar

komen o yo rek,, *suwun