[ad_1]
Diterbitkan pada 3 Juni 2025
(Awalnya diterbitkan di Sekarang dibutuhkan untuk belajar dan mengajar14 April 2025)
Pendidikan tinggi tidak asing dengan gangguan. Pandemi COVID-19 telah memaksa universitas untuk mengubah proses belajar mengajar dalam sekejap. Kini, pesatnya pertumbuhan kecerdasan buatan generatif menciptakan tantangan baru dan memerlukan penilaian ulang serupa, terutama dalam penilaian. Karena kecerdasan buatan kini mampu menghasilkan esai, menyelesaikan persamaan kompleks, dan bahkan mereproduksi gaya penulisan individu, institusi dihadapkan pada pertanyaan mendesak dan mendasar:
Bagaimana kita memastikan bahwa sistem pembelajaran kita, termasuk penilaian, tetap bermakna, adil, dan tahan terhadap masa depan di era AI yang berkembang pesat?
Respons yang terfragmentasi terhadap AI dalam penilaian
Universitas-universitas di Australia merespons kecerdasan buatan dengan cara yang berbeda-beda dan seringkali beragam. Beberapa diantaranya memanfaatkan potensi AI, mengembangkan alat seperti Cogniti AI (dikenal dengan model akses terbukanya) dan VAL di RMIT (lembaga pendidikan khusus) yang mendukung pembelajaran berbasis AI. Yang lain fokus pada format penilaian alternatif, seperti lisan interaktif dan relevan dengan topik industri, yang menekankan pemikiran kritis dan penerapan pengetahuan secara real-time. Pendekatan-pendekatan ini menjanjikan dalam mengurangi ketergantungan pada respons yang dihasilkan AI sekaligus mendorong keterlibatan siswa, namun skalabilitasnya masih belum pasti (Krautloher, 2024). Sementara itu, beberapa institusi telah melipatgandakan perwalian dan pengawasan yang lebih ketat untuk mencegah ketidakjujuran akademik. Meskipun langkah-langkah ini bertujuan untuk mendukung integritas akademik, langkah-langkah ini juga menimbulkan kekhawatiran mengenai privasi, aksesibilitas, dan kesejahteraan siswa (UBSS, 2021).
Meskipun strategi-strategi ini mencerminkan otonomi kelembagaan, strategi-strategi ini juga menyoroti kurangnya kohesi, yang menyebabkan duplikasi upaya, pengalaman siswa yang tidak konsisten, dan hilangnya peluang untuk perbaikan di seluruh sektor. Beberapa upaya kolaboratif telah muncul, seperti inisiatif industri TEQSA dan kelompok kerja ahli antar lembaga, namun pendekatan nasional yang lebih terstruktur diperlukan untuk memastikan bahwa praktik terbaik diterapkan di seluruh sektor.
Jalur, Jalur, dan Evaluasi Terprogram: Apakah Kita Berbicara dalam Bahasa yang Sama?
Untuk mengatasi tantangan integritas akademik yang terkait dengan AI sambil mempertahankan penilaian yang ketat dan bermakna, universitas telah mulai mengembangkan kerangka kerja terstruktur, seperti model dua-band atau enam-band, yang mendukung penggunaan AI dan desain panduan penilaian yang dapat diterima. Model-model ini membantu memperjelas ekspektasi, mengurangi risiko, dan mendorong keselarasan, namun model-model tersebut hanyalah satu bagian dari transformasi yang lebih luas yang diperlukan.
Secara paralel, pergeseran yang semakin besar ke arah strategi kurikulum di seluruh program sejalan dengan saran TEQSA mengenai praktik yang baik dan kumpulan ide terbaru yang diterbitkan dalam Emerging Practice Toolkit. Strategi-strategi ini berfokus pada transformasi kurikulum secara holistik, melampaui tugas-tugas penilaian yang terisolasi menuju pengalaman pembelajaran yang terintegrasi dan berkembang. Sebagai bagian dari perubahan ini, beberapa institusi telah mengadopsi penilaian tingkat program untuk mengoordinasikan penilaian lintas tingkat dengan lebih baik, sementara yang lain menggunakan penilaian berbasis program, sebuah model yang lebih longitudinal dan kaya akan masukan berdasarkan pendidikan berbasis kompetensi.
Meskipun langkah-langkah ini cukup menjanjikan, implementasi di lapangan masih menjadi tantangan utama karena adanya perbedaan dalam kebijakan, kesiapan kelembagaan, dan kapasitas fakultas untuk melakukan transformasi kurikuler berskala besar. Hal yang penting adalah kurangnya terminologi yang umum sering kali menghambat kemajuan: sebuah lembaga mungkin mendefinisikan “penilaian tingkat program” sebagai penyelarasan penugasan berdasarkan derajatnya, sementara lembaga lain menggunakan “penilaian program” untuk menggambarkan sistem penilaian yang berisiko rendah, bersifat perkembangan, dan bersifat sumatif. Perbedaan definisi ini menimbulkan kebingungan, memperlambat kolaborasi antar lembaga, dan mempersulit peningkatan skala inovasi.
Kerangka kerja kolaboratif sangat penting tidak hanya untuk mengubah praktik yang sudah ada, namun juga untuk memungkinkan ekosistem penilaian responsif AI yang dapat diskalakan dan bermanfaat bagi siswa dan pendidik. Untuk beralih dari inovasi yang berbeda ke perubahan pada tingkat sistem, institusi harus bekerja sama untuk mengembangkan bahasa yang sama yang didukung oleh pemikiran sistem, desain bersama, dan tujuan bersama. Seperti pendapat para penulis The Good Shift, yang dibutuhkan adalah perubahan nyata dari “keibuan” menjadi “pola pikir”.
Memperjelas terminologi: sebuah langkah maju yang penting
Kesepakatan di seluruh sektor mengenai definisi sangat penting bagi reformasi penilaian yang bermakna guna meningkatkan komunikasi dan memastikan pembagian pengetahuan yang efektif. Tanpa bahasa yang sama, institusi-institusi tersebut berisiko menerapkan ide-ide serupa dengan nama yang berbeda, sehingga membuat kerja sama menjadi sangat sulit.
Oleh karena itu, inilah saran kami untuk menguraikan secara sederhana untuk mendukung pemahaman yang lebih koheren dan sistematis:
- Pendekatan program: Pendekatan holistik yang dapat didasarkan pada perspektif holistik seperti pemikiran sistem lunak bertujuan untuk mengintegrasikan kurikulum, tugas belajar mengajar, serta format dan alat penilaian untuk mengembangkan kompetensi inti dan atribut lulusan secara bermakna di dalam dan di luar program pendidikan (Cabrera, D. & Cabrera, L., 2019; Khanna, Roberts, & Lane, 2021).
- Evaluasi di tingkat program: Koordinasi strategis penilaian berbasis gelar untuk memastikan refleksi dan keselarasan dengan hasil di tingkat program. Hal ini membantu mengurangi duplikasi, mengoptimalkan beban kerja dan meningkatkan konsistensi dengan mencerminkan bagaimana penilaian individu berkontribusi terhadap kemampuan lulusan secara keseluruhan. Jika dirancang dengan cermat, hal ini juga dapat mendukung pengembangan penilaian evaluatif siswa dan pembelajaran tebing dari waktu ke waktu melalui pengalaman penilaian kumulatif. Hal ini paling baik dilihat sebagai sarana untuk koherensi program yang lebih luas (Charlton & Newsham-West, 2024a, 2024b).*
- Penilaian program: Model evaluasi longitudinal dan holistik yang secara sistematis mengumpulkan dan mensintesis beragam bukti (misalnya, tugas-tugas berisiko rendah dan tinggi) dari waktu ke waktu. Yang mendefinisikannya adalah penggunaan penilaian naratif, triangulasi, dan data agregat untuk menginformasikan pembelajaran dan keputusan progresif (Baartman & Quinlan, 2024; van der Vleuten et al., 2015).
- Penilaian program untuk pembelajaran: Pendekatan program yang secara jelas mengintegrasikan prinsip-prinsip penilaian pembelajaran (yaitu proposisi nilai pendidikan dan program pendidikan) dengan struktur, format, dan alat penilaian. Hal ini memprioritaskan pembelajaran jangka panjang baik dalam desain program maupun praktik penilaian, serta mengoptimalkan umpan balik, keterlibatan siswa, dan kemajuan perkembangan, memposisikan penilaian sebagai pendorong pembelajaran, bukan sekadar alat penilaian yang didorong oleh proses (Torre & Schuwirth, 2024).
Memahami perbedaan-perbedaan ini sangatlah penting. Misalnya, memetakan nilai berdasarkan derajat (penilaian tingkat program) tidak sama dengan menggunakan data ini secara longitudinal untuk memberikan informasi kepada pembangunan dan kemajuan (penilaian tingkat program). Hal ini sekali lagi berbeda dengan merestrukturisasi seluruh komponen dan kegiatan program (bukan hanya penilaian) ke dalam kerangka kerja yang mendorong pembelajaran jangka panjang dan pencapaian lulusan (penilaian terprogram untuk pembelajaran). Di sinilah letak kebingungan yang ada saat ini di sektor ini dan di mana upaya untuk menerapkan model penilaian yang koheren dan siap menghadapi masa depan mungkin gagal.
Dengan memperjelas bahasa yang kami gunakan, kami mengurangi duplikasi, menyelaraskan strategi kami, dan memungkinkan kolaborasi yang lebih efektif di dalam dan antar institusi. Dalam lanskap yang mengalami gangguan AI dan perbaikan cepat sangat menggoda, kejelasan konseptual adalah aset terbesar kami.
Jalan ke Depan: Strategi Penilaian Terpadu yang Sesuai dengan AI
Untuk melampaui strategi kelembagaan yang terfragmentasi, pendidikan tinggi Australia harus mengadopsi pendekatan yang lebih terkoordinasi. Inilah yang harus terjadi selanjutnya:
- Menyepakati struktur yang disepakati secara nasional: Pemahaman bersama tentang nilai-nilai dan prinsip-prinsip pendidikan kontemporer serta pendekatan terpadu, menggunakan lensa programatik, untuk mengintegrasikan seluruh komponen kurikulum, seperti struktur, kegiatan dan penilaian, sebagai pendorong pembelajaran sepanjang hayat yang saling terkait, dengan tetap menjaga fleksibilitas kontekstual dan kelembagaan serta disiplin ilmu.
- Program pengembangan dan kepemimpinan guru: Membekali pendidik dengan pendekatan penilaian modern, model dan strategi berbasis kompetensi yang terintegrasi dengan kecerdasan buatan akan meningkatkan peluang yang sangat dibutuhkan di seluruh sektor.
- Aktifkan transparansi dan berbagi pengetahuan: Penciptaan gudang studi kasus dengan akses terbuka untuk memfasilitasi pembelajaran dan inovasi di seluruh industri menyediakan mekanisme untuk mengembangkan kedewasaan dalam diskusi nasional.
Gambaran Lebih Besar: Membentuk Masa Depan Pendidikan Tinggi
Pendidikan tinggi sedang mengalami titik balik. AI dalam penilaian bukan sekadar tantangan, namun merupakan peluang untuk memikirkan kembali dan meningkatkan cara kita menilai pembelajaran. Pertanyaannya bukan lagi apakah penilaian dapat mengimbangi AI, melainkan harus berkembang agar tetap bermakna dan efektif. Satu-satunya jalan ke depan adalah melalui visi bersama, strategi terpadu, dan tindakan kolektif.
Bergabunglah dalam percakapan
Bagaimana institusi Anda melakukan pendekatan terhadap transformasi penilaian sebagai respons terhadap AI? Haruskah kita beralih ke kerangka kerja nasional untuk evaluasi program? Bagikan pemikiran Anda dengan kami!
* Pembaruan: Definisi penilaian tingkat program ini telah diperbarui agar lebih mencerminkan peran gandanya sebagai mekanisme struktural untuk menyelaraskan penilaian di seluruh program dan, ketika dirancang secara sengaja, berkontribusi terhadap penilaian penilaian siswa dan pembelajaran dari waktu ke waktu, konsisten dengan penelitian Charlton dan Newsham-West (2024a, 2024b).
***
Membaca ini di ponsel? Gulir ke bawah untuk mempelajari lebih lanjut tentang penulisnya.