A. Hakikat Evaluasi
Program Pendidikan
Evaluasi adalah suatu upaya untuk
menentukan nilai atau jumlah, sehingga dalam melakukan kegiatan evaluasi harus
hati-hati, tanggung jawab, menggunakan strategi, dan dapat dipertanggung
jawabkan. Ada beberapa ahli menyebutkan tentang makna evaluasi diantaranya:
1. Suchman (1975), memandang
evaluasi sebagai sebuah proses menentukan hasil yang telah dicapai dari
beberapa kegiatan yang direncanakan.
2. Worthen dan Sanders (1973),
menyebutkan bahwa evaluasi adalah kegiatan mencari sesuatu yang berharga
tentang sesuatu, termasuk mencari informasi yang bermanfaat dalam menilai
keberadaan program, produksi, prosedur serta alternatif strategi.
3. Stufflebeam (1971), mengatakan
bahwa evaluasi merupakan proses penggambaran, pencarian, dan pemberian
informasi yang sangat bermanfaat bagi pengambil keputusan dalam menetukan
altenatif keputusan.
Dengan evaluasi tersebut, maka evaluator dapat menentukan dan
mengambil sebuah keputusan berdasarkan informasi yang telah dikumpulkan. Evaluasi
hendaknya bertujuan dalam membantu pengembangan, implementasi, kebutuhan suatu
program, perbaikan program, pertanggungjawaban, seleksi, motivasi, menambah
pengetahuan dan dukungan dari stakeholders. Tujuan evaluasi adalah;(1) Untuk
memperoleh dasar bagi pertimbangan akhir suatu periode kerja, apa yang telah
dicapai, apa yang belum dicapai, dan apa yang perlu mendapat perhatian khusus,
(2) Untuk menjamin cara kerja yang efektif dan efisien yang membawa organisasi
pada penggunaan sumber daya yang dimiliki secara efesien dan ekonomis, (3)
Untuk memperoleh fakta tentang kesulitan, hambatan, penyimpangan dilihat dari
aspek-aspek tertentu.
Dalam
memaknai program ada pengertian khusus dan umum, secara umum “program”
diartikan dengan rencana atau kesatuan kegiatan.
Berdasarkan pengertian itu maka program merupakan sebuah sistem, yaitu
rangkaian kegiatan yang dilakukan tidak hanya satu kali tetapi
berkesinambungan. Sedangkan secara khususnya, apabila “program” ini langsung
dikaitkan dengan evaluasi program maka program didefinisikan sebagai suatu unit
atau kesatuan kegiatan yang merupakan realisasi atau implementasi dari suatu
kebijakan, berlangsung dalam proses yang berkesinambungan, dan terjadi dalam
suatu organisasi yang melibatkan sekelompok orang.
Ada tiga pengertian penting dan perlu ditekankan
dalam menentukan program, yaitu:
1. Realisasi atau implementasi suatu kebijakan
2.Terjadi dalam waktu yang relatif lama-bukan
kegiatan tunggal tetapi jamak-
berkesinambungan.
berkesinambungan.
3.Terjadi dalam organisasi yang melibatkan sekelompok
orang
Implementasi program harus senantiasa di evaluasi untuk melihat
sejauh mana program tersebut telah berhasil mencapai maksud pelaksanaan program
yang telah ditetapkan sebelumnya. Tanpa adanya evaluasi, program-program yang
berjalan tidak akan dapat dilihat efektifitasnya. Dengan demikian,
kebijakan-kebijakan baru sehubungan dengan program itu tidak akan didukung oleh
data. Karenanya, evaluasi program bertujuan untuk menyediakan data dan
informasi serta rekomendasi bagi pengambil kebijakan (decision maker) untuk
memutuskan apakah akan melanjutkan, memperbaiki atau menghentikan sebuah
program.
Ditinjau dari bentuk-bentuk evaluasi, maka evaluasi bertujuan untuk, evaluasi formatif untuk bertujuan untuk perbaikan dan pengembangan kegiatan yang sedang berjalan, sedang evaluasi sumatif bertujuan untuk pertanggungjawaban, keterangan, seleksi dan lanjutan. Menurut Stufflebeam yang membagi evaluasi kepada proactive evaluation, yakni melayani pemegang keputusan, sedangkan retroactive evaluation bertujuan untuk keperluan pertanggungjawaban.
Ditinjau dari bentuk-bentuk evaluasi, maka evaluasi bertujuan untuk, evaluasi formatif untuk bertujuan untuk perbaikan dan pengembangan kegiatan yang sedang berjalan, sedang evaluasi sumatif bertujuan untuk pertanggungjawaban, keterangan, seleksi dan lanjutan. Menurut Stufflebeam yang membagi evaluasi kepada proactive evaluation, yakni melayani pemegang keputusan, sedangkan retroactive evaluation bertujuan untuk keperluan pertanggungjawaban.
Dari uraian yang telah dikemukan dapat diambil kesimpulan bahwa
evaluasi program adalah upaya menyediakan informasi untuk disampaikan kepada
pengambil keputusan. Adapun fungsi evaluasi program Menurut scriven (1967) adalah
sebagai berikut:
1. Fungsi Formatif yaitu evaluasi dipakai untuk perbaikan dan pengembangan kegiatan yang sedang berjalan (program, orang, produk, dan sebagainya).
1. Fungsi Formatif yaitu evaluasi dipakai untuk perbaikan dan pengembangan kegiatan yang sedang berjalan (program, orang, produk, dan sebagainya).
2. Fungsi
sumatif yaitu evaluasi dipakai untuk pertanggungjawaban, keterangan, seleksi atau
lanjutan. Jadi evaluasi hendaknya membantu pengembangan, implementasi,
kebutuhan suatu program, perbaikan program, pertanggungjawaban, seleksi,
motivasi, menambah pengetahuan dan dukungan dari mereka yang terlibat.
3. Fungsi
diagnostik yaitu untuk mendiagnostik sebuah program
B. Model-model
Evaluasi Program Pendidikan
Ada banyak
model evaluasi yang dikembangkan oleh para ahli yang dapat dipakai dalam
mengevaluasi program pembelajaran. Berbagai model sebagaimana yang dikemukakan
oleh Kirkpatrick (2009) adalah:
- Jack PhillPS’ Five Level ROI Model,
- Daniel Stufflebeam’s CIPP Model (Context, Input,
Process, Product),
- Robert Stake’s Responsive Evaluation Model,
- Robert Stake’s Congruence-Contingency Model,
- Kaufman’s Five Levels of Evaluation,
- CIRO (Context, Input, Reaction, Outcome),
- PERT (Program Evaluation and Review Technique),
- Alkins’ UCLA Model,
- Michael Scriven’s Goal-Free Evaluation Approach,
- Provus’s Discrepancy Model,
- Eisner’s Connoisseurship Evaluation Models,
- Illuminative Evaluation Model,
- Portraiture Model.
Berbagai model
tersebut di atas akan diuraikan model yang populer dan banyak dipakai sebagai
strategi atau pedoman kerja dalam pelaksanaan evaluasi program pembelajaran,
yaitu 1) Evaluasi Model Kirkpatrick (Kirkpatrick Four Levels Evaluation Model),
2) Evaluasi Model CIPP (Context, Input, Prosess, and
Product), dan 3) Evaluasi Model Stake (Model Couintenance).
- Evaluasi Model Kirkpatrick
Kirkpatrick
salah seorang ahli evaluasi program pelatihan dalam bidang pengembangan sumber
daya manusia (SDM). Model evaluasi yang dikembangkan oleh Kirkpatrick dikenal
dengan istilah Kirkpatrick Four Levels Evaluation Model. Evaluasi terhadap
efektivitas program pelatihan (training) menurut Kirkpatrick (1998)
mencakup empat level evaluasi, yaitu: level 1 reaction, level 2 learning,
level 3 behavior, dan level 4 result.
- Evaluasi Reaksi (Evaluating Reaction)
Mengevaluasi
terhadap reaksi peserta pelatihan berarti mengukur kepuasan peserta (customer
satisfaction). Program pelatihan dianggap efektif apabila proses pelatihan
dirasa menyenangkan dan memuaskan bagi peserta pelatihan sehingga mereka
tertarik termotivasi untuk belajar dan berlatih. Dengan kata lain peserta
pelatihan akan termotivasi apabila proses pelatihan berjalan secara memuaskan
bagi peserta yang pada akhirnya akan memunculkan reaksi dari peserta yang
menyenangkan. Sebaliknya apabila peserta tidak merasa puas terhadap proses
pelatihan yang diikutinya maka mereka tidak akan termotivasi untuk mengikuti
pelatihan lebih lanjut.
Partner (2009)
mengemukakan the
interest, attention and motivation of the participants are critical to the
success of any training program, people learn better when they react positively
to the learning environment. Disimpulkan bahwa keberhasilan proses kegiatan
pelatihan tidak terlepas dari minat, perhatian, dan motivasi peserta pelatihan
dalam mengikuti jalannya kegiatan pelatihan. Orang akan belajar lebih baik
manakala mereka memberi reaksi positif terhadap lingkungan belajar.
Kepuasan
peserta pelatihan dapat dikaji dari beberapa aspek, yaitu materi yang
diberikan, fasilitas yang tersedia, strategi penyampaian materi yang digunakan
oleh instruktur, media pembelajaran yang tersedia, jadwal kegiatan sampai menu,
dan penyajian konsumsi yang disediakan. Mengukur reaksi dapat dilakukan dengan reaction
sheet dalam bentuk angket sehingga lebih mudah dan lebih efektif.
- Evaluasi Belajar (Evaluating Learning)
Kirkpatrick
(1998:20) mengemukakan learning can be defined as the extend to which participans
change attitudes, improving knowledge, and/or increase skill as a result of
attending the program. Terdapat tiga hal yang dapat instruktur ajarkan dalam
program pelatihan, yaitu pengetahuan, sikap maupun keterampilan. Peserta
pelatihan dikatakan telah belajar apabila pada dirinya telah mengalami
perubahan sikap, perbaikan pengetahuan maupun peningkatan keterampilan.
Oleh karena itu
untuk mengukur efektivitas program pelatihan maka ketiga aspek tersebut perlu
untuk diukur. Tanpa adanya perubahan sikap, peningkatan pengetahuan maupun
perbaikan keterampilan pada peserta pelatihan maka program dapat dikatakan
gagal. Penilaian evaluating learning ini ada yang menyebut dengan
penilaian hasil (output) belajar. Oleh karena itu dalam pengukuran hasil
belajar (learning measurement) berarti penentuan satu atau lebih hal
berikut: 1) pengetahuan yang telah dipelajari, 2) perubahan sikap, dan 3)
keterampilan yang telah dikembangkan atau diperbaiki.
- Evaluasi Tingkah Laku (Evaluating Behavior)
Evaluasi pada
level ke 3 (evaluasi tingkah laku) ini berbeda dengan evaluasi terhadap sikap
pada level ke 2. Penilaian sikap pada evaluasi level 2 difokuskan pada
perubahan sikap yang terjadi pada saat kegiatan pelatihan dilakukan sehingga
lebih bersifat internal, sedangkan penilaian tingkah laku difokuskan pada
perubahan tingkah laku setelah peserta kembali ke tempat kerja. Apakah
perubahan sikap yang telah terjadi setelah mengikuti pelatihan juga akan
diimplementasikan setelah peserta kembali ke tempat kerja, sehingga penilaian
tingkah laku ini lebih bersifat eksternal.
Perubahan perilaku
apa yang terjadi di tempat kerja setelah peserta mengikuti program pelatihan.
Dengan kata lain yang perlu dinilai adalah apakah peserta merasa senang setelah
mengikuti pelatihan dan kembali ke tempat kerja? Bagaimana peserta dapat
mentrasfer pengetahuan, sikap dan keterampilan yang diperoleh selama pelatihan
untuk diimplementasikan di tempat kerjanya? Karena yang dinilai adalah
perubahan perilaku setelah kembali ke tempat kerja maka evaluasi level 3 ini
dapat disebut sebagai evaluasi terhadap outcomes dari kegiatan pelatihan.
- Evaluasi Hasil (Evaluating Result)
Evaluasi hasil
dalam level ke 4 ini difokuskan pada hasil akhir (final result)
yang terjadi karena peserta telah mengikuti suatu program. Termasuk dalam
kategori hasil akhir dari suatu program pelatihan di antaranya adalah kenaikan
produksi, peningkatan kualitas, penurunan biaya, penurunan kuantitas terjadinya
kecelakaan kerja, penurunan turnover (pergantian) dan kenaikan
keuntungan.
Beberapa
program mempunyai tujuan meningkatkan moral kerja maupun membangun teamwork
(tim kerja) yang lebih baik. Dengan kata lain adalah evaluasi terhadap impact
program (pengaruh program). Tidak semua pengaruh dari sebuah program dapat
diukur dan juga membutuhkan waktu yang cukup lama. Oleh karena itu evaluasi
level 4 ini lebih sulit di bandingkan dengan evaluasi pada level-level
sebelumnya.
- Evaluasi Model CIPP
Konsep evaluasi
model CIPP (Context, Input, Prosess, and Product)
pertama kali dikemukakan oleh Stufflebeam tahun 1965 sebagai hasil usahanya
mengevaluasi ESEA (The Elementary and Secondary Education Act). Konsep tersebut
ditawarkan Stufflebeam dengan pandangan bahwa tujuan penting evaluasi adalah
bukan membuktikan tetapi untuk memperbaiki. Hal ini dipertegas oleh Madaus dkk
(1983:118) yang mengemukakan the CIPP approach is based on the view that the most
important purpose of evaluation is not to prove but to improve.
Evaluasi model
CIPP dapat diterapkan dalam berbagai bidang, seperti pendidikan, manajemen,
perusahaan serta dalam berbagai jenjang baik itu proyek, program maupun
institusi. Dalam bidang pendidikan Stufflebeam (2003) menggolongkan sistem
pendidikan atas empat dimensi, yaitu context, input, process,
dan product, sehingga model evaluasi yang ditawarkan diberi nama CIPP
model yang merupakan singkatan ke empat dimensi tersebut.
Sudjana dan
Ibrahim (2004:246) menerjemahkan masing-masing dimensi tersebut dengan makna:
- Context, situasi atau latar belakang yang
mempengaruhi jenis-jenis tujuan dan strategi pendidikan yang akan
dikembangkan dalam sistem yang bersangkutan, situasi ini merupakan faktor
eksternal, seperti misalnya masalah pendidikan yang dirasakan, keadaan
ekonomi negara, dan pandangan hidup masyarakat,
- Input, sarana/modal/bahan dan rencana
strategi yang ditetapkan untuk mencapai tujuan pendidikan, komponen input
meliputi siswa, guru, desain, saran, dan fasilitas,
- Process, pelaksanaan strategi dan
penggunaan sarana/modal/bahan di dalam kegiatan nyata di lapangan,
komponen proses meliputi kegiatan pembelajaran, pembimbingan, dan
pelatihan,
- Product, hasil yang dicapai baik selama
maupun pada akhir pengembangan sistem pendidikan yang bersangkutan,
komponen produk meliputi pengetahuan, kemampuan, dan sikap (siswa dan
lulusan).
Aspek yang
dievaluasi dan prosedur pelaksanaan evaluasi model CIPP menurut Stufflebeam
dalam Oliva (1992:491) seperti pada Tabel 1.
Tabel 1 Aspek dan Prosedur Pelaksanaan
Evaluasi Model CIPP
Context Evaluation
|
Input Evaluation
|
Process Evaluation
|
Product Evaluation
|
|
Obyek (sasaran)
|
Mendefinisikan
operasional context, mengidentifikasi dan memperkirakan kebutuhan dan
mendiagnosa masalah, memprediksi kebutuhan dan peluang
|
Mengidentifikasi dan
memperkirakan kapabilitas sistem, strategi input yang sekarang tersedia, dan
mendesain untuk implementasi strategi
|
Mengidentifikasi dan
memperkirakan di dalam proses, tentang kerusakan di dalam desain prosedur
atau implementasi, menyediakan informasi sebelum program diputuskan dan
memperbaiki dokumen even prosedural dan aktivitas
|
Menghubungkan informasi
outcomes dengan obyek dan informasi context, input, dan process
|
Metode
|
Mendeskripsikan context,
membandingkan dengan yang sebenarnya dan mengawasi input dan output,
membandingkan kemungkinan dan ketidakmungkinan sistem kerja, dan menganalisa
penyebab ketidakmungkinan dan ketidaksesuaian kenyataan dengan tujuan
(harapan)
|
Mendeskripsikan dan
menganalisis SDM dan sumber daya material yang tersedia, solusi strategis,
dan desain prosedur untuk relevansi, kemungkinan kegiatan yang dapat
dilaksanakan, dan kebutuhan ekonomi dalam rangkaian kegiatan
|
Memonitoring setiap
aktivitas yang berpotensi terdapat tantangan secara prosedural, dan
memberikan tanda untuk antisipasi, untuk memperoleh informasi yang spesifik
untuk memutuskan suatu program, dan mendeskripsikan proses yang aktual
|
Mendefinisikan
operasional dan mengukur kriteria asosiasi dengan obyektif dan membandingkan
hasil pengukuran dengan standar sebelum dilakukan antisipasi, dan
menginterpretasi outcomes berdasarkan dokumen informasi context, input,
dan process
|
Hubungan pengambilan
keputusan dengan proses perubahan
|
Memutuskan dalam hal
menyajikan perangkat, tujuan asosiasi, dengan mendiskusikan kebutuhan dan
peluang, dan sasaran asosiasi untuk perubahan perencanaan kebutuhan
|
Memilih SDM sebagai
pendukung, solusi strategis, dan desain prosedural untuk perubahan struktur
kerja (aktivitas)
|
Untuk implementasi dan
memperbaiki desain program dan prosedur untuk efektivitas proses kontrol
|
Untuk memutuskan dalam
kegiatan secara kontinu, menghentikan (mengakhiri), modifikasi, mengatur
kembali fokus perubahan aktivitas dengan tahapan materi yang lain dalam
proses perubahan untuk mengatur kembali aktivitas perubahan
|
Stufflebeam
dalam naskah yang dipresentasikan pada Annual Conference of the Oregon Program
Evaluation Network (OPEN) Portland tahun 2003, memperluas makna evaluasi product
menjadi impact evaluation (evaluasi pengaruh), effectiveness
evaluation (evaluasi efektivitas), sustainability evaluation
(evaluasi keberlanjutan), dan transportability evaluation
(evaluasi transformasi) (Stufflebeam, 2003:59-62).
- Evaluasi Model Stake (Model Couintenance)
Stake
menekankan adanya dua dasar kegiatan dalam evaluasi, yaitu description
(deskripsi) dan judgement (pertimbangan), serta membedakan adanya tiga
tahap dalam program pendidikan, yaitu antecedent (program
pendahulu/masukan/context), transaction (transaksi/kejadian/process),
dan outcomes (hasil/result). Stake dalam Tayibnapis (2000:19)
berpendapat menilai suatu program pendidikan harus melakukan perbandingan yang
relatif antara program satu dan program yang lain, atau perbandingan yang
absolut yaitu membandingkan suatu program dengan standar tertentu.
Penekanan yang
umum atau hal yang penting dalam model ini adalah bahwa evaluator yang membuat
penilaian tentang program yang dievaluasi. Lebih lanjut Stake dalam Tayibnapis
(2000:20) menyatakan bahwa description di satu pihak berbeda dengan judgement
di lain pihak. Dalam model ini antecendent (masukan) transaction
(proses) dan outcomes (hasil) data di bandingkan tidak hanya untuk menentukan
apakah ada perbedaan antara tujuan dengan keadaan yang sebenarnya, tetapi juga
dibandingkan dengan standar yang absolut untuk menilai manfaat program.
DAFTAR RUJUKAN
Arikunto,
Suharsimi dan Safruddin, Cepi. 2004. Evaluasi
Program Pendidikan Pedoman
Teoritis Praktis Bagi Praktisi Pendidikan. Jakarta: Bumi Aksara.
Teoritis Praktis Bagi Praktisi Pendidikan. Jakarta: Bumi Aksara.
Mardapi, D.
2000. Evaluasi Pendidikan. Makalah disajikan dalam Konvensi Pendidikan
Nasional, Universitas Negeri Jakarta, Jakarta, 19-23 September.
Mardapi, D.
2003. Kurikulum 2004 dan Optimalisasi Sistem Evaluasi Pendidikan di Sekolah.
Makalah disajikan dalam Seminar Nasional Kurikulum 2004 Berbasis Kompetensi,
Universitas Ahmad Dahlan, Yogyakarta, 10 Januari.
0 komentar:
Posting Komentar