KRITERIA TEST YANG BAIK DALAM PEMBELAJARAN
Oleh: Ni Putu Asih Rosalina
1111031160
Abstract
Tes merupakan salah satu alat penilaian yang dipergunakan untuk menilai
proses dan hasil belajar yang telah dilakukan
kepada anak didik. Berdasarkan pengertian dari beberapa ahli, dapat
disimpulkan bahwa tes merupakan alat yang digunakan untuk mengukur
kemampuan seseorang. Tes
memiliki peranan yang sangat penting untuk mengukur keberhasilan siswa. Oleh karena itu, tes harus disusun secara sistematis dan memenuhi
kriteri-kriteria pembuatan tes yang telah ditentukan agar tujuan pembuatan tes
tersebut dapat tercapai. Tes yang baik memiliki persyaratan antara
lain (1) hanya mengukur satu aspek saja, (2) handal dalam pengukuran,
kehandalan ini meliputi ketepatan hasil pengukuran dan keajegan hasil
pengukuran. Tes yang merupakan salah satu alat
penilaian dikatakan mempunyai kualitas yang baik apabila tes memiliki atau
memenuhi minimal dua kriteria, yaitu
ketepatannya atau validitasnya dan ketetapan atau kejaegannya atau
reliabilitasnya. Selain itu, kriterites lainnya yang perlu
dipertimbangkan dalam pembuatan tes adalah relevan, representative, seimbang,
sensitive, fair, praktis, ekonomis, objektif.
A.
PENDAHULUAN
Didalam
pendidikan terdapat bermacam-macam alat penilaian yang dapat dipergunakan untuk
menilai proses dan hasil pendidikan yang telah dilakukan terhadap anak didik.
Salah satunya adalah melalui tes. Sebagai contoh biasanya, untuk masuk sekolah
dasar, siswa baru akan diberikan tes terlebih dahulu. Ada sekolah yang
memberikan tes tulis adapula yang memberikan tes lisan. Tes yang diberikan
tentunya sudah diperhitungkan menurut tingkat perkembangan dan kemampuan siswa.
Adapun pengertian tes menurut
para ahli seperti Riduwan ( 2006: 37), tes sebagai instrumen pengumpulan data
adalah serangkaian pertanyaan / latihan yang digunakan untuk mengukur
ketrampilan pengetahuan, intelegensi, kemampuan atau bakat yang dimiliki
individu / kelompok. Menurut Allen Philips (1979: 1-2) A test is commonly
difined as a tool or instrument of measurement that is used to obtain data
about a specific trait or characteristic of an individual or group (Test
biasanya diartikan sebagai alat atau instrumen dari pengukuran yang digunakan
untuk memperoleh data tentang suatu karakteristik atau ciri yang spesifik dari
individu atau kelompok). Menurut Rusli Lutan (2000:21) tes adalah sebuah
instrument yang dipakai untuk memperoleh informasi tentang seseorang atau
objek. Dari pengertian beberapa ahli di atas, dapat disimpulkan bahwa tes
adalah tes merupakan alat yang
digunakan untuk mengukur kemampuan seseorang. Tes memiliki peranan
yang sangat penting untuk mengukur keberhasilan siswa.
Tes
memiliki 2 fungsi, yaitu sebagai alat untuk mengukur keberhasilan program
pengajaran sekaligus kualitas pendidik dalam mengelola pembelajaran dan alat
untuk mengukur tingkat pencapaian siswa pada kompetensi yang dipersyaratkan
yang terjabar dalam indikator pencapaian. Oleh karena itu, tes tidak dibuat
sembarangan. Tes hendaknya dibuat dengan baik sehingga mudah dipahami oleh
siswa. Perkembangan siswa juga dijadikan acuan dalam pembuatan tes agar
nantinya siswa tidak bingung akan maksud tes tersebut. Mengingat pentingnya tes
tersebut, guru harus sangat teliti dan harus mampu membuat tes dengan baik.
Misalnya di sekolah dasar, yang dihadapi guru adalah anak-anak SD yang
perkembangannya masih rendah dan rentan. Perlu strategi dan teknik yang tepat
dalam menyusun tes agar mudah dipahami anak SD.. Oleh karena itu, dalam makalah ini akan diuraikan tentang kriteria
pembuatan tes yang baik agar nantinya kita sebagai calon guru mampu membuat tes
yang baik dan mudah dipahami siswa.
B.
ISI
Ada beberapa
persyaratan yang harus dipenuhi agar suatu tes dapat dikatakan sebagai tes yang
baik dan layak diberikan kepada siswa untuk mendapatkan hasil penilain yang
baik. Secara umum, tes yang baik memiliki persyaratan antara lain (1) hanya
mengukur satu aspek saja, (2) handal dalam pengukuran, kehandalan ini meliputi
ketepatan hasil pengukuran dan keajegan hasil pengukuran. Dengan memahami
pentingnya tes dalam pembelajaran di sekolah, pendidik hendaknya mengetahui
kriteria tes yang baik. Tes yang merupakan salah satu alat penilaian dikatakan
mempunyai kualitas yang baik apabila tes memiliki atau memenuhi dua hal, yaitu
ketepatannya atau validitasnya dan ketetapan atau kejaegannya atau
reliabilitasnya. Selain itu, beberapa kriteria yang lain juga harus dipenuhi
agar tes tersebut baik untuk diberikan kepada siswa.
a.
Validitas
Sebuah tes
disebut valid jika dapat mengukur
secara tepat apa yang seharusnya diukur.
Jadi bukan sekedar mengukur daya ingatan atau kemampuan bahasa
saja misalnya. Sebagai contoh menilai kemampuan siswa
dalam matematika. Misalnya diberikan soal dengan kalimat yang panjang dan
berbeli-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat
menjawab karena tidak memahami maksudnya.
Tinggi
rendahnya tingkat validitas instrumen menunjukkan sejauh mana data dari
variabel yang terkumpul tidak menyimpang dari gambaran tentang variabel yang
dimaksud. Kerlinger (1986) dalam Endang Poerwanti menyatakan bahwa validitas
alat ukur tidak cukup ditentukan oleh derajat ketepatan alat ukur dapat
mengukur apa yang seharusnya diukur, tetapi perlu pula dilihat dari 3 kriteria
yang lain yaitu appropriatness, meaningfullness dan usefullnes. (1) Appropriateness: kriteria ini menunjuk pada kelayakan
dari tes sebagai alat ukur tersebut, yaitu seberapa jauh alat ukur dapat
menjangkau keragaman aspek perilaku tertentu. (2) Meaningfullness: kriteria
yang didasarkan pada kemampuan alat ukur untuk dapat memberikan keseimbangan
item-item pengukurannya berdasar tingkat kepentingan/urgensi dari setiap bagian
gejala. (3) Usefullness to inferences: kriteria ini menunjuk pada sensitif
tidaknya alat ukur untuk dapat menangkap gejala perilaku, dan tingkat
ketelitian yang ditunjukkan dalam pembuatan kesimpulan.
Jenis-jenis
validitas yang dapat dipakai sebagai kriterium dalam menetapkan tingkat
kehandalan tes, diantaranya adalah:
1)
Validitas Permukaan (Face Validity) :
Validitas ini sering
pula disebut sebagai validitas tampang. Validitas jenis ini menggunakan kriterium
yang paling sederhana karena yang menjadi kriterianya hanya tampang atau
penampakan dari instrumen itu sendiri. Apabila tes sebagai instrumen
pengukuran, berdasar pengamatan sepintas sudah dianggap baik, maka alat
tersebut sudah dapat dianggap memenuhi kriteria face validity, sehingga tidak diperlukan adanya pertimbangan
mendalam
2)
Validitas Konsep (Construct Validity)
Validitas ini disebut
juga sebagai validitas konstruksi teori. Dalam hal ini alat ukur dikatakan
valid apabila item sebagai alat ukur telah mencerminkan konsep perilaku yang
dikur, dan memiliki tingkat kesesuaian dengan konstruksi teoritiknya. Validitas
ini juga disebut dengan validitas logis. Penggunaan validitas logis terutama
dalam pengukuran-pengukuran gejala perilaku yang abstrak misalnya ukuran
tentang kesetiakawanan, kematangan emosi, sikap terhadap KB, motivasi dan
sebagainya.
3)
Validitas Isi
Validitas isi berkenaan
dengan kesanggupan alat penilaian dalam mengukur isi yang seharusnya. Artinya,
tes tersebut mampu mengungkapkan isi suatu konsep atau variabel yang hendak
diukur. Misalnya tes hasil belajar bidang studi IPS harus bisa mengungkapkan isi
bidang studi tersebut. Tes hasil belajar tidak mampu mengungkapkan semua materi
yang ada dalam bidang studi tertentu seklaipun hanya satu semester. Oleh sebab
itu, harus diambil sebagian dari materi dalam bentuk sampel tes. Sampel harus
dapat mencerminkan materi yang terkandung dalam seluruh materi bidang studi.
Cara yang ditempuh dalam menetapkan sampel tes adalah memilih konsep-konsep
materi yang esensial. Misalnya menetapkan sejumlah konsep dari setiap pokok
bahasan yang ada. Dari setiap konsep dikembangkan beberapa pertanyaan tes.
4) Concurrent
Validity: Validitas ini dikenal pula dengan nama
validitas bandingan karena dalam menetapkan tingkat validitas alat ukur
diperlukan kriterium luar yang berupa alat ukur lain yang serupa dan sudah
dibakukan validitasnya. Apabila hasil pengukuran yang dilakukan dengan alat
ukur baru, mempunyai tingkat kesesuaian dengan hasil yang pengukuran yang
diperoleh dari alat ukur yang sudah dibakukan, maka tes sebagai alat ukur ini
dianggap memenuhi Concurrent Validity.
Upaya meningkatkan
validitas suatu tes dipengaruhi oleh faktor-faktor:
1)
Komprehensif
Suatu evaluasi
dikatakan komprehensif apabila evaluasi hasil belajar terdiri dari soal-soal
tes yang relatif menyeluruh dari semua materi yang diajarkan.
2)
Besarnya suatu ukuran
Maksudnya adalah dalam
tahap pengukuran hendaknya evaluasi menggunakan alat ukur yang tidak terlalu
jauh.
3)
Menggunakan bahasa yang
komunikatif
Bahasa yang terlalu
sulit menyebabkan siswa tidak bisa mengerjakan, bukan karena tidak menguasai
materi, tetapi karena tidak tahu apa yang dimaksud dalam pertanyaan tersebut.
b.
Realiabilitas
Realibilitas alat
penilaian adalah ketepatan atau konsistensi hasil alat penilaian tersebut pada
situasi yang berbeda. Artinya, kapan pun
alat penilaian tersebut digunakan akan memberikan hasil yang sama.
Tes hasil belajar
dikatakan ajeg apabila hasil pengukuran saat ini menunjukkan kesamaan hasil
pada saat yang berlainan waktunya terhadap siswa yang sama. Misalnya siswa
kelas V pada hari ini dites kemampuan bahasa inggrisnya. Minggu berikutnya
siswa tersebut dites kembali. Hasil dari kedua tes tersebut relatif sama.
Sungguh pun demikian, masih mungkin terjadi ada perbedaan hasil untuk hal-hal
tertentu akibat faktor kebetulan, selang waktu, atau terjadinya perubahan
pandangan siswa terhadap soal yang sama. Jika ini terjadi, kelemahan terletak
dalam tes itu, yang tidak memiliki kepastian jawaban atau meragukan siswa.
Dengan kata lain, derajat reliabilitasnya masih rendah. Di lain pihak perbedaan
hasil penilaian bukan disebabkan oleh alat penilaiannya, melainkan oleh kondisi
yang terjadi pada diri siswa. Misalnya fisik siswa dalam keadaan sakit pada
waktu tes yang pertama, motivasi pada waktu tes pertama berbeda dengan motivasi
tes pada berikutnya. Atas dasar itu perbedaan hasil penilaian pertama dengan
hasil penilaian berikutnya bisa terjadi akibat perubahan pada diri subyek yang
dinilai dan atau oleh faktor yang berkaitan dengan pemberian tes itu sendiri.
Ini berarti, skor hasil penilaian yang pertama dan skor hasil penilaian kedua
terhadapa subyek yang sama, terjadi kesalahan pengukuran yang dimungkinkan oleh
kedua faktor di atas.
Cara mencari koefisien
reliabilitas alat ukur, dapat dilakukan dengan menggunakan beberapa cara, yang
masing-masing mempunyai kekurangan dan keunggulan. Bernagai pilihan tentang
cara menetapkan tingkat reliabilitas alat ukur tersebut adalah:
·
Teknik Pengulangan
Cara ini disebut
sebagai teknik ulangan karena dilakukan dengan memberikan dua kali pengukuran
dengan rentang waktu tertentu dengan menggunakan alat ukur yang sama. Skor yang
diperoleh pada pengukuran pertama dikorelasikan dengan skor dari hasil pengukuran
pada pengukuran yang kedua. Berbagai faktor dapat menyebabkan seseorang
mempunyai skor yang berbeda pada saat dua kali mengerjakan tes yang sama.
Sangat mungkin perubahan skor yang terjadi bukan karena perubahan hal yang
diukur, tetapi karena situasi yang berbeda atau pengalaman dari responden pada
saat mengerjakan soal yag pertama sehingga pada saat mengerjakan tes kedua
lebih berhati-hati dan hasilnya menjadi lebih baik.
·
Teknik Bentuk Paralel
Mencari reliabilitas
dengan teknik bentuk paralel dilakukan dengan cara pengukuran pada subyek yang
sama tetapi menggunakan alat ukur berbeda yang mempunyai tingkat kesamaan.
Peneliti perlu mempersiapkan dua set alat ukur yang berbeda. Penggunaan dua set
alat ukur ini dimaksudkan untuk mengurangi kemungkinan terjadinya pengaruh
ingatan terhadap pengukuran yang pertama. Skor dari pengukuran alat ukur yang
pertama dikorelasikan dengan skor hasil pengukuran kedua. Koefisien korelasi
yang diperoleh akan mengungkap derajat ekuivalnesi dan indeks stabilitas.
Adapun
faktor—faktor yang mempengaruhi keterandalan alat evaluasi adalah:
1)
Jumlah soal
Alat evaluasi yang
jumlah soalnya lebih banyak cenderung lebih reliable dibandingkan soal yang
jumlahnya lebih sedikit.
2)
Homogenitas
Alat evaluasi yang
terdiri dari soal yang homogen cenderung lebih reliable dibandingkan soal yang
heterogen.
3)
Waktu penyelesaian soal
Waktu menyelesaikan
soal harus cukup, tidak kurang dan tidak berlebihan.
4)
Keseragaman kondisi
Setiap tes perlu
disusun standar administrasinya (pelaksanaannya).
5)
Tingkat kesukaran
Soal evaluasi yang
terlalu sulit atau terlalu mudah menimbulkan rendahnya tingkat keterandalan
soal evaluasi.
c.
Valid
Soal dikatakan valid
bila dapat mengukur apa yang seharusnya diukur, validitas soal dapat dilihat
dari kesesuaian soal dengan tujuan instruksional khusus dan tujuan pengukuran
yang telah ditetapkan. Validitas dapat pula dilihat dari kemampuannya
memprediksi prestasi di masa yang akan datang.
d.
Relevan
Tes yang relevan
mengandung soal-soal yang dapat mengukur kemampuan belajar sesuai dengan
tingkat kemampuan yang ditetapkan dalam indikator pencapaian hasil belajar
(ranah kognitif, afektif, dan psikomotor). Bila kompetensi dasar dan indikator
bertujuan mengungkap ranah afektif, pertanyaan soal harus pula mengarah ke
sikap dan seterusnya.
e.
Spesifik
Soal harus direncanakan
sedemikian rupa agar jawabannya pasti dan tidak menimbulkan ambivalensi atau
spakulasi dalam memberikan jawaban. Kesulitan soal tidak saja kesulitan materi
juga bisa ditambah kesulitan dalam memahami soal bila soal tidak disusun secara
spesifik.
f.
Representatif
Soal tes sebaiknya
dikembangkan dari satuan materi yang jelas cakupannya, dan bersifat
komprehensif dalam artian materi tes harus mencakup seluruh materi pengajaran.
Untuk itu, seluruh pokok bahasan (sub pokok bahasan) idealnya harus terwakili
dalam soal tes. Syarat ini akan dapat mengurangi error terhadap hasil
pengukuran.
g.
Seimbang
Dalam proses pengajaran
dosen akan tahu persis, bahwasetiap pokok bahasan memiliki tingkat kesulitan
yang berbeda, soal tes dikatakan seimabang bila pokok bahasan yang terpenting
mendapat porsi terbanyak dalam soal. Kalau dalam keadaan terpaksa hal tersebut
tidak dapat dilakukan maka keseimbbangan dapat dicapai dengan memberikan bobot
yang berbeda pada pokok bahasan yang memiliki tingkat kesulitan yang berbeda.
h.
Sensitif
Syarat ini berkaitan
erat dengan taraf kesukaran soal, butir tes yang baik harus memiliki
sensitivitas untuk membedakan siswa yang benar-benar menguasai materi dengan
yang tidak. Hal ini akan tercapai bila soal terlalu sulit sehingga semua siswa
dapat mengerjakan dengan benar.
i.
Fair
Tes hasil ujian
hendaknya bersifat terbuka dalam artian tidak mengandung jebakan. Jelas cakupan
materinya, kejelasan norma yag dipakai serta kriteria keberhasilannya. Dalam
pelaksanaannya obyektif, tidak merugikan kelompok tertentu.
j.
Objektif
Objektif
berarti tidak adanya unsur pribadi yang mempengaruhi. Hal ini terjadi pada
sistem skoring. Objektifitas menekankan ketetapan pada sistem skoring.
k.
Praktis
Sebuah
tes dikatakan praktis apabila mudah dilaksanakan, mudah pemeriksaannya, dan
dilengkapi dengan petunjuk yang baik.
l.
Ekonomis
Ekonomis adalah bahwa
pelaksanaan tes tersebut tidak membutuhkan ongkos atau biaya mahal, tenaga yang
banyak, dan waktu yang lama.
Tidak ada komentar:
Posting Komentar