Bu çalışma materyali, verilen ders metni ve sesli ders kaydı kaynaklarından derlenerek hazırlanmıştır.
📚 Ölçme ve Değerlendirmede Geçerlik ve Güvenirlik: Kapsamlı Bir Çalışma Rehberi
Ölçme ve değerlendirme süreçlerinin temel taşları olan geçerlik ve güvenirlik kavramları, elde edilen sonuçların doğruluğunu ve tutarlılığını sağlamak açısından hayati öneme sahiptir. Bu rehber, geçerlik türlerini, korelasyon kavramını, güvenirlik tanımını ve hata türlerini detaylı bir şekilde ele alarak konuyu anlaşılır kılmayı amaçlamaktadır.
1. Geçerlik Türleri: Bir Ölçme Aracının Doğruluğu 🎯
Geçerlik, bir ölçme aracının ölçmek istediği özelliği ne derece doğru ve amaca uygun ölçtüğünü ifade eder. Temel olarak üç ana geçerlik türü bulunmaktadır: Kapsam Geçerliği, Ölçüt Bağıntılı Geçerlik ve Yapı Geçerliği. Bu bölümde, özellikle ölçüt bağıntılı ve yapı geçerliği üzerinde durulacaktır.
1.1. Korelasyon Kavramı 📊
Ölçüt bağıntılı geçerliği anlamak için öncelikle korelasyon kavramını bilmek gereklidir. Korelasyon, en az iki değişken arasındaki ilişkinin büyüklüğünü ve yönünü ifade eden istatistiksel bir ölçüdür.
- Değer Aralığı: Korelasyon katsayısı -1 ile +1 arasında değerler alır.
- Katsayının önündeki eksi (-) veya artı (+) işareti ilişkinin yönünü belirtir.
- Sayısal değerin 1'e yaklaşması ilişkinin gücünü (mükemmelliğini) gösterir.
- 0'a yaklaşması ise ilişkinin zayıfladığını veya hiç olmadığını ifade eder.
- Pozitif Korelasyon: İki değişkenin aynı yönlü hareket etmesidir. Biri artarken diğeri de artar, biri azalırken diğeri de azalır.
- Örnek: Motivasyon arttıkça başarının da artması.
- Negatif Korelasyon: İki değişkenin ters yönlü hareket etmesidir. Biri artarken diğeri azalır.
- Örnek: Yorgunluk arttıkça dikkatin azalması.
- Nötr (Sıfır) Korelasyon: Değişkenler arasında hiçbir ilişkinin olmamasıdır.
- Örnek: Saç uzunluğu ile zeka puanı arasındaki ilişki.
1.2. Ölçüt Bağıntılı Geçerlik ✅
Bu geçerlik türü, geçerliliği yüksek kabul edilen (ölçüt kabul edilen) bir test ile aynı değişkeni ölçmek için hazırlanmış, geçerliliği merak edilen başka bir testten alınan puanlar arasındaki korelasyon katsayısının hesaplanmasıyla elde edilir. Ölçütün hangi zamanda elde edildiğine göre ikiye ayrılır:
1.2.1. Yordama Geçerliği 📈
- Tanım: Elimizdeki verilere dayanarak geleceğe yönelik tahminde bulunmaktır.
- Zaman ve Ölçüt: Ölçüt, asıl testten sonra ve genellikle uzun bir süre (örneğin 1 yıl gibi) sonra elde edilir. Amacı, bireyin gelecekteki durumunu ortaya çıkarmaktır.
- Örnek: Öğrenci Seçme Sınavı (ÖSS) puanları ile üniversite 1. sınıf akademik başarı ortalaması arasındaki korelasyona bakılır. İlişki +1'e ne kadar yakınsa, sınavın yordama geçerliliği o kadar yüksektir denir.
- ⚠️ Önemli Detay: Ölçüt belirlenirken içerik benzerliği şarttır. Üniversite 1. sınıf notları ölçüt alınabilir çünkü lise müfredatına benzer genel dersleri içerir. Ancak 3. sınıf notları alınamaz, çünkü alan bazında uzmanlaşıldığı için içerik değişir ve aradaki korelasyon düşer.
1.2.2. Zamandaş (Eş Zamanlı / Uyum) Geçerlik ⏱️
- Tanım: Öğrencinin bugünkü durumunu teşhis etmeye yöneliktir.
- Zaman ve Ölçüt: Ölçüt, asıl testten önce ya da eş zamanlı (kısa bir süre içinde, örn: 1 hafta) elde edilir.
- Örnek: Bir öğrencinin Türkiye geneli deneme sınavı puanı veya lise diploma notu (OBP) ile gerçek Öğrenci Seçme Sınavı puanı arasındaki ilişkiye bakılmasıdır.
1.3. Yapı Geçerliği 🧠
Eğitim ve psikolojide doğrudan gözle görülemeyen "yapıların" (yetenek, zeka, içe dönüklük, dışa dönüklük, motivasyon, tutum vb.) ölçülebilmesi için kullanılır. Testteki sorular birbiriyle mantıklı bir örüntü (korelasyon) kurmalıdır.
- Anahtar Kelime: Faktör Analizi.
- Süreç Nasıl İşler?
- Öncelikle yapı tanımlanır (Örn: İlahiyat öğrencilerinin ölçme dersine yönelik tutumu).
- Bu tutumu ölçebilecek sınanabilir denenceler (soru maddeleri) yazılır.
- Katılımcılar bu maddelere 1'den 5'e kadar (hiç katılmıyorum-tamamen katılıyorum) tepkiler verir.
- Faktör Analizi: Toplanan veriler SPSS gibi istatistiksel programlara girilir. Bu süreç, testin yapısı hakkında bilgi veren bir "madde eleme" yöntemidir. Eğer örneğin 30 maddelik bir testte 3 madde diğerleriyle örüntü/korelasyon kuramıyorsa, faktör analizi bu uygun olmayan maddeleri eler. Geriye kalan maddeler o yapıyı ölçen geçerli bir bütün oluşturur.
2. Güvenirlik: Ölçme Sonuçlarının Tutarlılığı 🛡️
Güvenirlik, ölçme sonuçlarının hatalardan, özellikle de tesadüfi hatalardan arınıklık derecesidir. Gerçek değer ile testte ölçülen değer arasındaki fark, "hata" olarak karşımıza çıkar.
2.1. Hata Türleri 🚫
Hataların olası kaynaklarına göre üç farklı türü vardır:
2.1.1. Sabit Hata
- Tanım: Bir ölçmeden diğerine miktarı değişmeyen, herkese aynı derecede etki eden hatalardır.
- Özellik: Bu hatanın yönü ve miktarı bilindiği için ölçümden sonra düzeltilebilir.
- Örnek: Sınavda iptal edilen bir soru için sınava giren, çalışan çalışmayan herkese +5 puan verilmesi veya bir cetvelin her ölçümde 1 cm eksik ölçmesi.
2.1.2. Sistematik Hata (Yanlılık)
- Tanım: Bütün gruba değil, belirli bir gruba ayrıcalık tanıyan hatalardır.
- Özellik: Bu hatanın da yönü ve miktarı bilindiği için düzeltilebilir.
- Örnek: Sadece çalışkan öğrencilere, yazısı güzel olanlara veya öğretmenin kendi hemşerilerine ekstra +5 puan vermesi. (Not: Türkçe dersi gibi yazının gerçekten puanlama kriteri olduğu istisnai durumlar hariç).
- Ek Not: Sabit hatanın sistematikleşmiş hali de bu gruba girer. Örneğin 10 cm'de 1 cm eksik ölçen bir cetvelin, 20 cm'de 2 cm, 30 cm'de 3 cm eksik ölçmesi sistematik bir hatadır.
2.1.3. Tesadüfi Hata
- Tanım: Yönü, miktarı ve kaynağı belli olmayan, en tehlikeli hata türüdür.
- Özellik: Kime kaç puanlık etki ettiği bilinmediği için bu hata türünü ölçümden tamamen çıkarmak mümkün değildir.
- Örnek: Sınav anında gözetmenin topuklu ayakkabı sesi çıkarması, sınıfın iyi havalandırılmamış olması, öğrencinin oturduğu sıranın kırık olması veya öğrencinin sınava uykusuz/stresli girmesi gibi durumlar.
2.2. Hataların Olası Kaynakları 🔍
Ölçme sonuçlarındaki hatalar çeşitli kaynaklardan doğabilir:
- Ölçmeyi Yapan Kişiden (Değerlendirici): Puanları yanlış toplamak, yorgunluk, ya da tanıdığı başarılı bir öğrencinin (isimden etkilenme/özel puanlama eğilimi) kötü geçen sınav kağıdına yine de yüksek puan vermek. (Önlemek için kağıt isimleri kapatılıp veya numara ile okunabilir).
- Ölçme Aracından: Soruların çok zor/kolay olması veya iyi ifade edilmemesi.
- Ortamdan: Sınıfın sıcak, soğuk, havasız, gürültülü veya yetersiz ışıklandırmalı olması.
- Öğrenciden/Gruptan: Sınava uykusuz ve aşırı stresli girmek, bu nedenle bilinen bilginin kağıda yansıtılamaması.
2.3. Güvenirliğin Kavramsal Anlamları 💡
Güvenirlik; duyarlık, tutarlık ve kararlılık gibi kavramlarla açıklanır.
- Duyarlık (Hassasiyet): Bir ölçümün ne kadar ince ve hassas yapıldığıyla ilgilidir.
- Örnek: Altını bakkal terazisinde değil, kuyumcuda tartmak.
- Sınavlarda Duyarlığı Artırmak: Soru sayısını artırmak gerekir. 1 soru yerine 25 soru sormak daha hassas bir ölçüm sağlar. Ancak soru sayısını aşırı artırmak (örn: ilkokul çocuğuna 100 soru sormak) öğrencide yorgunluğa ve sıkılmaya sebep olacağı için denge iyi kurulmalıdır.
Sınava Yönelik İpuçları 📝
- Ara sınav çoktan seçmeli ve en az 25 sorudan oluşacaktır.
- Sınav konuları 1. ve 2. bölümleri kapsayacak, derste anlatılmayan konulardan soru gelmeyecektir.
- Çalışmak için ders notları haricinde çıkmış ÖSYM veya KPSS ölçme değerlendirme sorularına (bilgi değil de örnek olay üzerinden verilen yordama/sabit hata gibi tanım sorularına) bakılması tavsiye edilmiştir.
Sonuç: Geçerlik ve güvenirlik, ölçme ve değerlendirme süreçlerinin vazgeçilmez iki temel özelliğidir. Geçerlik, bir testin amacına uygunluğunu sağlarken, güvenirlik ise ölçümlerin tutarlılığını ve hatasızlığını garanti eder. Bu iki kavramın bir arada bulunması, elde edilen ölçme sonuçlarının bilimsel ve pratik açıdan anlamlı ve kullanılabilir olmasını temin eder. Eğitim ve psikoloji alanında yapılan tüm ölçümlerde, bu ilkelerin titizlikle uygulanması, doğru kararlar alınması ve bireyler hakkında isabetli yargılara varılması için kritik öneme sahiptir.









