📚 Ölçme ve Değerlendirme: Güvenirlik ve Kestirim Yöntemleri Çalışma Materyali
Bu çalışma materyali, ders notları ve ders kaydı transkriptinden derlenmiştir.
Giriş: Güvenirlik Kavramı ve Önemi
Ölçme ve değerlendirme süreçlerinde güvenirlik, bir ölçme aracının ne denli tutarlı, kararlı ve duyarlı sonuçlar verdiğini ifade eden temel bir kavramdır. Elde edilen ölçüm sonuçlarının ne ölçüde doğru ve tekrarlanabilir olduğunu belirler. Güvenirliğin farklı boyutlarını anlamak ve bu boyutları ölçmek için kullanılan yöntemleri bilmek, eğitim bilimleri ve sosyal bilimler alanlarında geçerli ve anlamlı değerlendirmeler yapabilmek için kritik öneme sahiptir.
1. Güvenirliğin Temel Anlamları
Güvenirlik kavramı temelde üç farklı anlamda ele alınır:
1.1. Duyarlılık (Hassasiyet)
📚 Tanım: Ölçme aracının biriminin küçük olması durumudur. Birimi küçük olan ölçme aracı, büyük olana göre daha hassas (duyarlı) ölçüm yapar. ✅ Örnek: Altının bakkal yerine kuyumcuda tartılması gibi, eğitimde de az sorulu yüksek puanlı testler yerine, çok sorulu düşük puanlı testler daha duyarlıdır (örn: 20 puanlık 5 soru yerine, 5 puanlık 20 soru kullanmak). ⚠️ Dikkat Edilmesi Gerekenler:
- Sorular konulara homojen dağıtılmazsa (örn: eklenen soruların hepsi aynı konudan olursa) kapsam geçerliliği zedelenir.
- Test grubunun yaş, gelişim özellikleri ve kaygı düzeyleri dikkate alınmalıdır; örneğin ilkokul çocuklarına gereğinden fazla soru sormak dikkatlerini dağıtır ve kaygılarını artırır.
1.2. Kararlılık
📚 Tanım: Ölçülen özelliğin aynı ya da farklı araçlarla, farklı zamanlarda birden fazla ölçülmesi durumunda elde edilen değerlerin birbirinden farklı olmaması, değişmemesidir. Bireyin bilgisi veya tutumu değişmediği sürece ölçüm sonuçlarının aynı kalması beklenir.
1.3. Tutarlılık
📚 Tanım: Testi oluşturan maddelerin kendi içlerinde ve testin bütünüyle olan uyumudur. İç tutarlılık olarak da adlandırılır.
2. Güvenirlik Katsayısı (r)
Güvenirlik, güvenirlik katsayısı (r) ile nicel olarak ifade edilir. Bu katsayı 0 ile 1 arasında değişen bir korelasyon değeridir. Ölçmenin standart hatası da bir diğer kestirim yoludur ancak bu ders kapsamında matematiksel ağırlığı nedeniyle işlenmemiştir.
📊 Güvenirlik Katsayısı Değer Aralığı ve Yorumu:
- 0.00 - 0.29 arası: Düşük düzeyde güvenirlik. Bu aralıktaki araçların kullanımı, yorumların güvenilir olmaması nedeniyle boşa kürek çekmek gibidir.
- 0.30 - 0.69 arası: Orta düzeyde güvenirlik.
- 0.70 - 1.00 arası: Yüksek düzeyde güvenirlik. Kullanımı ideal ve gönül rahatlığıyla tercih edilebilir.
3. Güvenirlik Kestirim (Hesaplama) Yöntemleri
Güvenirliği kestirmek için farklı durumlar ve ölçülen özelliklere göre çeşitli yöntemler kullanılır:
3.1. Test-Tekrar Test Yöntemi
✅ Uygulama: Aynı ölçme aracının, farklı iki zamanda (ideali 2 ile 4 hafta arası), aynı gruba uygulanması ve elde edilen iki puan arasındaki korelasyonun hesaplanmasıdır. 💡 Verdiği Güvenirlik Anlamı: Kararlılık. 🎯 Kullanım Alanı: Kısa sürede değişmesi beklenmeyen, kalıcı olan duyuşsal özelliklerin (ilgi, tutum vb.) ölçülmesinde kullanılır.
3.2. Eşdeğer (Paralel) Form Yöntemi
✅ Uygulama: Aynı özelliği ölçmek amacıyla hazırlanmış, farklı sorulardan oluşan ancak aynı güçlükte (denk) iki farklı paralel testin, aynı gruba aynı anda art arda uygulanmasıdır. (Örn: Öğrenciye A grubu ve B grubu testlerini bir arada çözdürmek gibi). 💡 Verdiği Güvenirlik Anlamı: Kararlılık. 🎯 Kullanım Alanı: Öğrenciye aradaki zamanda yeni bir şey öğrenme fırsatı verilmediği için bilişsel özelliklerin (başarı, bilgi vb.) ölçülmesinde bu yöntem tercih edilir.
3.3. Testi İki Eş Yarıya Bölme Yöntemi
✅ Uygulama: Tek bir testin, aynı gruba bir kez uygulandıktan sonra analiz aşamasında iki eşit yarıya bölünmesi işlemidir (Örn: 40 soruluk testin iki adet 20 soruluk teste dönüştürülmesi). Öğrencinin iki yarıdan aldığı puanlar arasındaki ilişkiye bakılır. 💡 Verdiği Güvenirlik Anlamı: Tutarlılık (iç tutarlılık). ⚠️ Bölme Yöntemi: Testi ikiye bölerken en güvenilir yöntem, zorluk-kolaylık akışını bozmamak adına soruları tek sayılı (1,3,5...) ve çift sayılı (2,4,6...) olarak ayırmaktır. İlk 20 - son 20 şeklinde bölmek, testin sonuna doğru sorular zorlaşacağı için tutarlılığı olumsuz etkileyebilir. 🔢 Düzeltme Formülü: Bu yöntemle elde edilen ilk korelasyon katsayısı sadece yarım testin güvenirliğini verir. Testin bütününün güvenirliğini bulmak için özel bir düzeltme formülü kullanılır: (2 x Yarı Güvenirliği) / (1 + Yarı Güvenirliği).
3.4. KR-20 ve KR-21 (Kuder Richardson) Yöntemleri
✅ Uygulama: Testin tüm maddeleri arasındaki ilişkiye bakarak iç tutarlılık anlamında güvenirlik verir. Soruların doğruya 1, yanlışa veya boşa 0 puan verildiği (1-0 şeklinde puanlama) çoktan seçmeli sınavlarda kullanılır. 💡 Verdiği Güvenirlik Anlamı: Tutarlılık (iç tutarlılık). 🔄 Farkları:
- KR-20: Her sorunun madde analizi (p: zorluk/kolaylık derecesi) tek tek hesaplanmış ve irdelenmiştir.
- KR-21: Madde analizi yapılmadan tüm soruların orta güçlükte (0.5) olduğu varsayılır. 📈 Sonuç: Tek tek hesaplama yapıldığı için KR-20 katsayısı, her zaman KR-21'den büyük ve daha güvenilir sonuçlar verir.
3.5. Cronbach Alfa (Alpha) Yöntemi
✅ Uygulama: Bu da testin tüm maddeleri arasındaki iç tutarlılığı verir. 💡 Verdiği Güvenirlik Anlamı: Tutarlılık (iç tutarlılık). 🎯 Kullanım Alanı: KR-20/21'den farkı; dereceli puanlama (Likert tipi tutum ölçeklerindeki "hiç katılmıyorum, kararsızım, katılıyorum" gibi 5'li ölçekler) kullanıldığında tercih edilmesidir.
4. Yaklaşan Sınav İçin Önemli Notlar
- Sınav çoktan seçmeli olacak ve en az 25 sorudan oluşacaktır.
- Sorular sadece doğrudan ezber bilgi olarak gelmeyecek; senaryolar ve kurgular eşliğinde verilecektir (örn: zaman aralığı vermeden "ard arda uygulanmıştır" denerek kararlılığın tespit edilmesinin istenmesi gibi).
- Ders notları temel olmakla beraber, konunun mutlaka ders kitabından okuma yapılarak desteklenmesi ve işlenen 1. ile 2. bölümleri kapsayan çıkmış KPSS sorularının çözülmesi tavsiye edilmektedir.









