Page 106 - Evaluasi Pembelajaran
P. 106

Beberapa  contoh    di  atas  adalah  instrumen  yang
                 umumnya digunakan dalam pengukuran langsung. Dalam
                 pengukuran  langsung,  umumnya  instrumen  telah
                 disepakati  dan  distandarisasi  secara  internasional.
                 Contohnya  adalah  meteran.  Ukuran  atau  skala  yang
                 digunakan sebagai patokan atau standar dalam meteran,
                 merupakan    skala   yang   telah   disepakati   secara
                 internasional.  Contoh  lainnya  adalah  termometer,  yang
                 mana  skala  atau  ukuran-ukuran  yang  digunakan  telah
                 disepakati dan distandarisasi secara internasional.
                   Hal  yang  berbeda  terjadi  pada  pengukuran  tidak
                 langsung. Sebagaimana telah dijelaskan pada bagian awal
                 bab  ini,  pengukuran  hasil  belajar  termasuk  ke  dalam
                 pengukuran    tidak    langsung.   Instrumen    dalam
                 pengukuran  tak  langsung,  tidak  dapat  distandarisasi
                 secara luas maupun internasional. Hal ini terjadi karena
                 sifat  obyek  pengukuran  yang  laten/tersembunyi,
                 sehingga evaluator hanya bisa mengukur gejalanya saja.
                 Faktor  kedua  adalah,  hasil  pengukuran  tidak  langsung
                 bersifat relatif, karena hasilnya yang dapat berubah-ubah
                 sesuai  dengan  keadaan  yang  terjadi  saat  pengukuran.
                 Ada    ketergantungan    antara   hasil   pengukuran
                 menggunakan  instrumen  tertentu,  dengan  karakteristik
                 peserta  pengukuran.  Keterkaitan  antara  keduanya
                 dinyatakan  sebagai  ciri  khas  teori  skor  klasik  (Naga,
                 1992).
                   Hasil  pengukuran  yang  masih  relatif,  menyebabkan
                 keharusan bagi evaluator untuk memiliki instrumen yang
                 benar-benar handal, antara lain harus memiliki validitas
                 yang tinggi.
                   Validitas instrumen dapat dibedakan menjadi validitas
                 teoretis  dan  validitas  empiris.  Pengelompokkan  ini
                 didasarkan  pada  perbedaan  perlakuan  pada  saat
                 penyusunan  instrumen.  Hal  itu  akan  dibahas  sebagai
                 berikut:


                                                                     95
   101   102   103   104   105   106   107   108   109   110   111