Halaman

Minggu, 05 Januari 2014

KRITERIA TEST YANG BAIK DALAM PEMBELAJARAN

Oleh: Ni Putu Asih Rosalina
1111031160


Abstract
                  Tes merupakan salah satu alat penilaian yang dipergunakan untuk menilai proses dan hasil belajar yang telah dilakukan  kepada anak didik. Berdasarkan pengertian dari beberapa ahli, dapat disimpulkan bahwa tes merupakan alat yang digunakan untuk mengukur kemampuan seseorang. Tes memiliki peranan yang sangat penting untuk mengukur keberhasilan siswa. Oleh karena itu, tes harus disusun secara sistematis dan memenuhi kriteri-kriteria pembuatan tes yang telah ditentukan agar tujuan pembuatan tes tersebut dapat tercapai. Tes yang baik memiliki persyaratan antara lain (1) hanya mengukur satu aspek saja, (2) handal dalam pengukuran, kehandalan ini meliputi ketepatan hasil pengukuran dan keajegan hasil pengukuran. Tes yang merupakan salah satu alat penilaian dikatakan mempunyai kualitas yang baik apabila tes memiliki atau memenuhi minimal dua kriteria, yaitu ketepatannya atau validitasnya dan ketetapan atau kejaegannya atau reliabilitasnya. Selain itu, kriterites lainnya yang perlu dipertimbangkan dalam pembuatan tes adalah relevan, representative, seimbang, sensitive, fair, praktis, ekonomis, objektif.


A.       PENDAHULUAN
Didalam pendidikan terdapat bermacam-macam alat penilaian yang dapat dipergunakan untuk menilai proses dan hasil pendidikan yang telah dilakukan terhadap anak didik. Salah satunya adalah melalui tes. Sebagai contoh biasanya, untuk masuk sekolah dasar, siswa baru akan diberikan tes terlebih dahulu. Ada sekolah yang memberikan tes tulis adapula yang memberikan tes lisan. Tes yang diberikan tentunya sudah diperhitungkan menurut tingkat perkembangan dan kemampuan siswa.
                  Adapun pengertian tes menurut para ahli seperti Riduwan ( 2006: 37), tes sebagai instrumen pengumpulan data adalah serangkaian pertanyaan / latihan yang digunakan untuk mengukur ketrampilan pengetahuan, intelegensi, kemampuan atau bakat yang dimiliki individu / kelompok. Menurut Allen Philips (1979: 1-2) A test is commonly difined as a tool or instrument of measurement that is used to obtain data about a specific trait or characteristic of an individual or group (Test biasanya diartikan sebagai alat atau instrumen dari pengukuran yang digunakan untuk memperoleh data tentang suatu karakteristik atau ciri yang spesifik dari individu atau kelompok). Menurut Rusli Lutan (2000:21) tes adalah sebuah instrument yang dipakai untuk memperoleh informasi tentang seseorang atau objek. Dari pengertian beberapa ahli di atas, dapat disimpulkan bahwa tes adalah tes merupakan alat yang digunakan untuk mengukur kemampuan seseorang. Tes memiliki peranan yang sangat penting untuk mengukur keberhasilan siswa.
Tes memiliki 2 fungsi, yaitu sebagai alat untuk mengukur keberhasilan program pengajaran sekaligus kualitas pendidik dalam mengelola pembelajaran dan alat untuk mengukur tingkat pencapaian siswa pada kompetensi yang dipersyaratkan yang terjabar dalam indikator pencapaian. Oleh karena itu, tes tidak dibuat sembarangan. Tes hendaknya dibuat dengan baik sehingga mudah dipahami oleh siswa. Perkembangan siswa juga dijadikan acuan dalam pembuatan tes agar nantinya siswa tidak bingung akan maksud tes tersebut. Mengingat pentingnya tes tersebut, guru harus sangat teliti dan harus mampu membuat tes dengan baik. Misalnya di sekolah dasar, yang dihadapi guru adalah anak-anak SD yang perkembangannya masih rendah dan rentan. Perlu strategi dan teknik yang tepat dalam menyusun tes agar mudah dipahami anak SD.. Oleh karena itu, dalam makalah ini akan diuraikan tentang kriteria pembuatan tes yang baik agar nantinya kita sebagai calon guru mampu membuat tes yang baik dan mudah dipahami siswa.


B.           ISI
Ada beberapa persyaratan yang harus dipenuhi agar suatu tes dapat dikatakan sebagai tes yang baik dan layak diberikan kepada siswa untuk mendapatkan hasil penilain yang baik. Secara umum, tes yang baik memiliki persyaratan antara lain (1) hanya mengukur satu aspek saja, (2) handal dalam pengukuran, kehandalan ini meliputi ketepatan hasil pengukuran dan keajegan hasil pengukuran. Dengan memahami pentingnya tes dalam pembelajaran di sekolah, pendidik hendaknya mengetahui kriteria tes yang baik. Tes yang merupakan salah satu alat penilaian dikatakan mempunyai kualitas yang baik apabila tes memiliki atau memenuhi dua hal, yaitu ketepatannya atau validitasnya dan ketetapan atau kejaegannya atau reliabilitasnya. Selain itu, beberapa kriteria yang lain juga harus dipenuhi agar tes tersebut baik untuk diberikan kepada siswa.
a.         Validitas
Sebuah tes disebut valid jika  dapat mengukur secara tepat apa yang seharusnya diukur. Jadi bukan sekedar mengukur daya ingatan atau kemampuan bahasa saja misalnya. Sebagai contoh menilai kemampuan siswa dalam matematika. Misalnya diberikan soal dengan kalimat yang panjang dan berbeli-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak memahami maksudnya.
Tinggi rendahnya tingkat validitas instrumen menunjukkan sejauh mana data dari variabel yang terkumpul tidak menyimpang dari gambaran tentang variabel yang dimaksud. Kerlinger (1986) dalam Endang Poerwanti menyatakan bahwa validitas alat ukur tidak cukup ditentukan oleh derajat ketepatan alat ukur dapat mengukur apa yang seharusnya diukur, tetapi perlu pula dilihat dari 3 kriteria yang lain yaitu appropriatness, meaningfullness dan usefullnes. (1) Appropriateness: kriteria ini menunjuk pada kelayakan dari tes sebagai alat ukur tersebut, yaitu seberapa jauh alat ukur dapat menjangkau keragaman aspek perilaku tertentu. (2) Meaningfullness: kriteria yang didasarkan pada kemampuan alat ukur untuk dapat memberikan keseimbangan item-item pengukurannya berdasar tingkat kepentingan/urgensi dari setiap bagian gejala. (3) Usefullness to inferences: kriteria ini menunjuk pada sensitif tidaknya alat ukur untuk dapat menangkap gejala perilaku, dan tingkat ketelitian yang ditunjukkan dalam pembuatan kesimpulan.
Jenis-jenis validitas yang dapat dipakai sebagai kriterium dalam menetapkan tingkat kehandalan tes, diantaranya adalah:
1)        Validitas Permukaan (Face Validity) :
Validitas ini sering pula disebut sebagai validitas tampang. Validitas jenis ini menggunakan kriterium yang paling sederhana karena yang menjadi kriterianya hanya tampang atau penampakan dari instrumen itu sendiri. Apabila tes sebagai instrumen pengukuran, berdasar pengamatan sepintas sudah dianggap baik, maka alat tersebut sudah dapat dianggap memenuhi kriteria face validity, sehingga tidak diperlukan adanya pertimbangan mendalam
2)        Validitas Konsep (Construct Validity)
Validitas ini disebut juga sebagai validitas konstruksi teori. Dalam hal ini alat ukur dikatakan valid apabila item sebagai alat ukur telah mencerminkan konsep perilaku yang dikur, dan memiliki tingkat kesesuaian dengan konstruksi teoritiknya. Validitas ini juga disebut dengan validitas logis. Penggunaan validitas logis terutama dalam pengukuran-pengukuran gejala perilaku yang abstrak misalnya ukuran tentang kesetiakawanan, kematangan emosi, sikap terhadap KB, motivasi dan sebagainya.
3)        Validitas Isi
Validitas isi berkenaan dengan kesanggupan alat penilaian dalam mengukur isi yang seharusnya. Artinya, tes tersebut mampu mengungkapkan isi suatu konsep atau variabel yang hendak diukur. Misalnya tes hasil belajar bidang studi IPS harus bisa mengungkapkan isi bidang studi tersebut. Tes hasil belajar tidak mampu mengungkapkan semua materi yang ada dalam bidang studi tertentu seklaipun hanya satu semester. Oleh sebab itu, harus diambil sebagian dari materi dalam bentuk sampel tes. Sampel harus dapat mencerminkan materi yang terkandung dalam seluruh materi bidang studi. Cara yang ditempuh dalam menetapkan sampel tes adalah memilih konsep-konsep materi yang esensial. Misalnya menetapkan sejumlah konsep dari setiap pokok bahasan yang ada. Dari setiap konsep dikembangkan beberapa pertanyaan tes.
4)  Concurrent Validity: Validitas ini dikenal pula dengan nama validitas bandingan karena dalam menetapkan tingkat validitas alat ukur diperlukan kriterium luar yang berupa alat ukur lain yang serupa dan sudah dibakukan validitasnya. Apabila hasil pengukuran yang dilakukan dengan alat ukur baru, mempunyai tingkat kesesuaian dengan hasil yang pengukuran yang diperoleh dari alat ukur yang sudah dibakukan, maka tes sebagai alat ukur ini dianggap memenuhi Concurrent Validity.
Upaya meningkatkan validitas suatu tes dipengaruhi oleh faktor-faktor:
1)        Komprehensif
Suatu evaluasi dikatakan komprehensif apabila evaluasi hasil belajar terdiri dari soal-soal tes yang relatif menyeluruh dari semua materi yang diajarkan.
2)        Besarnya suatu ukuran
Maksudnya adalah dalam tahap pengukuran hendaknya evaluasi menggunakan alat ukur yang tidak terlalu jauh.
3)        Menggunakan bahasa yang komunikatif
Bahasa yang terlalu sulit menyebabkan siswa tidak bisa mengerjakan, bukan karena tidak menguasai materi, tetapi karena tidak tahu apa yang dimaksud dalam pertanyaan tersebut.
b.        Realiabilitas
Realibilitas alat penilaian adalah ketepatan atau konsistensi hasil alat penilaian tersebut pada situasi yang berbeda.  Artinya, kapan pun alat penilaian tersebut digunakan akan memberikan hasil yang sama.
Tes hasil belajar dikatakan ajeg apabila hasil pengukuran saat ini menunjukkan kesamaan hasil pada saat yang berlainan waktunya terhadap siswa yang sama. Misalnya siswa kelas V pada hari ini dites kemampuan bahasa inggrisnya. Minggu berikutnya siswa tersebut dites kembali. Hasil dari kedua tes tersebut relatif sama. Sungguh pun demikian, masih mungkin terjadi ada perbedaan hasil untuk hal-hal tertentu akibat faktor kebetulan, selang waktu, atau terjadinya perubahan pandangan siswa terhadap soal yang sama. Jika ini terjadi, kelemahan terletak dalam tes itu, yang tidak memiliki kepastian jawaban atau meragukan siswa. Dengan kata lain, derajat reliabilitasnya masih rendah. Di lain pihak perbedaan hasil penilaian bukan disebabkan oleh alat penilaiannya, melainkan oleh kondisi yang terjadi pada diri siswa. Misalnya fisik siswa dalam keadaan sakit pada waktu tes yang pertama, motivasi pada waktu tes pertama berbeda dengan motivasi tes pada berikutnya. Atas dasar itu perbedaan hasil penilaian pertama dengan hasil penilaian berikutnya bisa terjadi akibat perubahan pada diri subyek yang dinilai dan atau oleh faktor yang berkaitan dengan pemberian tes itu sendiri. Ini berarti, skor hasil penilaian yang pertama dan skor hasil penilaian kedua terhadapa subyek yang sama, terjadi kesalahan pengukuran yang dimungkinkan oleh kedua faktor di atas.
Cara mencari koefisien reliabilitas alat ukur, dapat dilakukan dengan menggunakan beberapa cara, yang masing-masing mempunyai kekurangan dan keunggulan. Bernagai pilihan tentang cara menetapkan tingkat reliabilitas alat ukur tersebut adalah:
·           Teknik Pengulangan
Cara ini disebut sebagai teknik ulangan karena dilakukan dengan memberikan dua kali pengukuran dengan rentang waktu tertentu dengan menggunakan alat ukur yang sama. Skor yang diperoleh pada pengukuran pertama dikorelasikan dengan skor dari hasil pengukuran pada pengukuran yang kedua. Berbagai faktor dapat menyebabkan seseorang mempunyai skor yang berbeda pada saat dua kali mengerjakan tes yang sama. Sangat mungkin perubahan skor yang terjadi bukan karena perubahan hal yang diukur, tetapi karena situasi yang berbeda atau pengalaman dari responden pada saat mengerjakan soal yag pertama sehingga pada saat mengerjakan tes kedua lebih berhati-hati dan hasilnya menjadi lebih baik.
·           Teknik Bentuk Paralel
Mencari reliabilitas dengan teknik bentuk paralel dilakukan dengan cara pengukuran pada subyek yang sama tetapi menggunakan alat ukur berbeda yang mempunyai tingkat kesamaan. Peneliti perlu mempersiapkan dua set alat ukur yang berbeda. Penggunaan dua set alat ukur ini dimaksudkan untuk mengurangi kemungkinan terjadinya pengaruh ingatan terhadap pengukuran yang pertama. Skor dari pengukuran alat ukur yang pertama dikorelasikan dengan skor hasil pengukuran kedua. Koefisien korelasi yang diperoleh akan mengungkap derajat ekuivalnesi dan indeks stabilitas.

Adapun faktor—faktor yang mempengaruhi keterandalan alat evaluasi adalah:                 
1)        Jumlah soal
Alat evaluasi yang jumlah soalnya lebih banyak cenderung lebih reliable dibandingkan soal yang jumlahnya lebih sedikit.
2)        Homogenitas
Alat evaluasi yang terdiri dari soal yang homogen cenderung lebih reliable dibandingkan soal yang heterogen.
3)        Waktu penyelesaian soal
Waktu menyelesaikan soal harus cukup, tidak kurang dan tidak berlebihan.
4)        Keseragaman kondisi
Setiap tes perlu disusun standar administrasinya (pelaksanaannya).
5)        Tingkat kesukaran
Soal evaluasi yang terlalu sulit atau terlalu mudah menimbulkan rendahnya tingkat keterandalan soal evaluasi.
c.         Valid
Soal dikatakan valid bila dapat mengukur apa yang seharusnya diukur, validitas soal dapat dilihat dari kesesuaian soal dengan tujuan instruksional khusus dan tujuan pengukuran yang telah ditetapkan. Validitas dapat pula dilihat dari kemampuannya memprediksi prestasi di masa yang akan datang.
d.        Relevan
Tes yang relevan mengandung soal-soal yang dapat mengukur kemampuan belajar sesuai dengan tingkat kemampuan yang ditetapkan dalam indikator pencapaian hasil belajar (ranah kognitif, afektif, dan psikomotor). Bila kompetensi dasar dan indikator bertujuan mengungkap ranah afektif, pertanyaan soal harus pula mengarah ke sikap dan seterusnya.
e.         Spesifik
Soal harus direncanakan sedemikian rupa agar jawabannya pasti dan tidak menimbulkan ambivalensi atau spakulasi dalam memberikan jawaban. Kesulitan soal tidak saja kesulitan materi juga bisa ditambah kesulitan dalam memahami soal bila soal tidak disusun secara spesifik.
f.         Representatif
Soal tes sebaiknya dikembangkan dari satuan materi yang jelas cakupannya, dan bersifat komprehensif dalam artian materi tes harus mencakup seluruh materi pengajaran. Untuk itu, seluruh pokok bahasan (sub pokok bahasan) idealnya harus terwakili dalam soal tes. Syarat ini akan dapat mengurangi error terhadap hasil pengukuran.
g.        Seimbang
Dalam proses pengajaran dosen akan tahu persis, bahwasetiap pokok bahasan memiliki tingkat kesulitan yang berbeda, soal tes dikatakan seimabang bila pokok bahasan yang terpenting mendapat porsi terbanyak dalam soal. Kalau dalam keadaan terpaksa hal tersebut tidak dapat dilakukan maka keseimbbangan dapat dicapai dengan memberikan bobot yang berbeda pada pokok bahasan yang memiliki tingkat kesulitan yang berbeda.
h.        Sensitif
Syarat ini berkaitan erat dengan taraf kesukaran soal, butir tes yang baik harus memiliki sensitivitas untuk membedakan siswa yang benar-benar menguasai materi dengan yang tidak. Hal ini akan tercapai bila soal terlalu sulit sehingga semua siswa dapat mengerjakan dengan benar.
i.          Fair
Tes hasil ujian hendaknya bersifat terbuka dalam artian tidak mengandung jebakan. Jelas cakupan materinya, kejelasan norma yag dipakai serta kriteria keberhasilannya. Dalam pelaksanaannya obyektif, tidak merugikan kelompok tertentu.
j.          Objektif
Objektif berarti tidak adanya unsur pribadi yang mempengaruhi. Hal ini terjadi pada sistem skoring. Objektifitas menekankan ketetapan pada sistem skoring.
k.        Praktis
Sebuah tes dikatakan praktis apabila mudah dilaksanakan, mudah pemeriksaannya, dan dilengkapi dengan petunjuk yang baik.
l.          Ekonomis

Ekonomis adalah bahwa pelaksanaan tes tersebut tidak membutuhkan ongkos atau biaya mahal, tenaga yang banyak, dan waktu yang lama.

Tidak ada komentar:

Posting Komentar