Ölçme araçlarında bulunması gereken üç nitelik içinde en önemlisi GEÇERLİK tir.

GEÇERLİK; bir ölçme aracının ölçmeyi amaçladığı özelliği, başka herhangi bir özellikle karıştırmadan doğru olarak ölçebilme derecesidir. Başka bir deyişle bir ölçme aracının geliştirilmiş bulunduğu konuda maksada hizmet etmesidir.

ÖRNEK Þ Uzunluk ölçmek için geliştirilmiş olan metre kişilerin boylarını ölçme amacına hizmet eder. Bu demektir ki bir ölçme aracı olan metre, uzunluk ölçmede geçerlidir fakat ağırlık ölçmede geçerli değildir.

 Bir aracın geçerli olması için, onun sadece ölçmek için düzenlendiği özelliği ölçmesi yani onu başka özelliklerle karıştırmadan ölçmesi de gerekir. Mesela; yazı güzelliği, ifade biçimi, sayfa düzeni, yanlılık vb. etkenlerin de ölçmeye karışmaması gerekir. Bu etkenlerin ölçmeye karışması geçerliği düşürür.

ÖRNEK Þ Bir öğretmen yaptığı bir Biyoloji sınavında yüksek bir okuma yeteneği ve kelime bilgisi gerektirecek sorular sormuş ve puanlama yaparken de yazı güzelliği, sayfa düzeni vb. özelliklere de fazla puan vermiştir. Böyle bir test ölçmeyi amaçladığı özelliği başka özellikleri de karıştırarak ölçtüğü için geçerliliği düşüktür.

NOT: Þ Bir başarı testinin niteliği; ölçülecek olanın ne olduğuna ve onun nasıl ölçüleceğininin açıkça belirlenmiş olmasına bağlıdır. Ne ölçülecek sorusunun cevabı testin uygunluk ve ilgililik özelliği ile ilgilidir. Nasıl ölçülecek sorusunun cevabı büyük ölçüde testin güvenirliği ile ilgilidir.

 Ölçtüğü şeyle ilgili olan ve ölçtüğü şeyi tutarlı olarak ölçen bir test GEÇERLİDİR. Bu yargı geçerliğin iki önemli öğesi olduğunu belirtir. Uygunluk ve İLGİLİLİK-GÜVENİRLİK.

 

→ UYGUNLUK Þ Bir test için uygunluk onun ölçmek için düzenlediği özellik yada özelliklerle ilgili olmasıdır. Bir testin kapsadığı maddeler dersin geliştirmek istediği davranışları yansıtıyor ve onları yeterince örnekliyorsa o zamanda İLGİLİ dir.

Bir testin geçerli olması için tutarlı bir biçimde ölçümde yapması gerekir. Bu nedenle güvenirlik geçerliğin önemli bir parçasıdır. Bir test geçerli olmak için güvenilir olmak zorundadır ancak güvenirlik geçerlik için bir önkoşul olmasına karşın yeterli değildir. Güvenilir olan bir test her zaman geçerli olmayabilir.

ÖRN: Þ Bir kısmı olmayan bir cetvelle bir kitabın boyunu 4 defa ölçerek aynı sonuca ulaşabiliriz. (Güvenilirdir) Fakat bu ölçme amacına hizmet etmekten uzaktır yani doğru ölçüm yapmamaktadır. Dolayısıyla GEÇERLİ değildir. Yani test tutarlı ölçme yapabilir ama ölçmek istediği özelliği ölçmeyebilir.

 Bir testin geçerliği bir derece sorunudur. Ya hep ya hiç sorunu değildir. Bir test hepten geçerli veya hepten geçersiz olmak yerine daha çok veya daha az geçerli olabilir. (yüksek orta veya düşük)

 Bir testin geçerliği o testten elde edilen puanlarla belli bir ölçütler takımı arasındaki ilişki bakımından belirlenir. Burada ölçütler takımı olarak neyin alınması gerektiği testin kullanılış maksadına bağlıdır. Test puanları ile ölçütler takımı arasındaki ilişki katsayısına GEÇERLİK KATSAYISI adı verilir. Geçerlik katsayısı -1.00 ile +1.00 arasında değişir. Bu test için geçerlilik en fazla GÜVENİRLİĞİN KAREKÖKÜNE EŞİT OLABİLİR.

ÖRN: Þ Güvenirliği 0,81 olan bir testin geçerliği en fazla kaç olur ?

  0,90 → GEÇERLİK tir.

 

EĞİTİMDE KULLANILAN TESTLER İÇİN SÖZKONUSU OLAN BAŞLICA GEÇERLİK TÜRLERİ ŞUNLARDIR Þ

1) KAPSAM GEÇERLİĞİ: Þ Bir ölçme aracındaki en önemli geçerlik türüdür. Kapsam geçerliği bir bütün olarak testin ve testteki her bir maddenin maksada ne derce hizmet ettiğidir. Bir testin kapsam geçerliği :

 a) O testteki toplam maddelerin ölçülecek davranışları ve konu içeriğini örnekleme derecesine ve

 b) Testteki her bir maddenin ölçmek istediği davranışı ne derece iyi ölçtüğüne bağlıdır.

  Bir testin kapsam geçerliğine sahip olması için bu iki isteğin birlikte karşılanması gerekir.

 Ölçme konusu; evreni yeterli ve dengeli olarak örnekleyen ve kapsadığı maddelerin her biri ölçmek istediği davranışı gerçekten ölçen bir test kapsam geçerliğine sahiptir.

Bir testin kapsam geçerliği şu iki ana yaklaşımdan birisiyle belirlenebilir. Þ

* Mantıksal yada Rasyonel Yaklaşım Þ Mantıksal olarak kapsam geçerliğini belirlemede testteki her bir maddenin ve bir bütün olarak testteki maddelerin dağılımının testin ölçmeye yöneldiği davranışlarla, konuları kapsayıp kapsamadığına bakılır. Bunun içinde ;

→ Testteki maddelerin dağılımının belirtke tablosundaki dağılıma uygun olup olmadığına ;

→ Her bir maddenin diğer maddelerce ölçülenlerden farklı bir davranışı ölçmeye yönelip yönelmediğini ve ölçmeye yöneldiği davranışı ölçmedeki elverişliliğine bakılır.

Bu konuda başvurulabilecek bir yolda şudur Þ Belirtke tablosuna bağlı kalarak hazırlanan bir test aynı dersi okutan başka öğretmenlere, testin ilgili olduğu konuyu iyi bilen kişilere (konu alanı uzmanlarına) ve ölçme değerlendirme uzmanlarına incelettirilebilir.

Bir testin geçerliğini belirlemede İSTATİKSEL YAKLAŞIM da kullanılabilir. Bu yaklaşımda bir konuya ilişkin bir ölçme aracı yeni hazırlanmış ise daha önceden hazırlanmış ve uygulanmış yani geçerliği tespit edilmiş başka bir araçla karşılaştırılır. Bu işlemler yapılırken şu yollar izlenir Þ

→ Her iki ölçüm aracı aynı öğrencilere uygulanarak öğrencilerin aldıkları puanlar birbirleriyle karşılaştırılır.

→ Daha sonra korelasyon katsayısı bulunur ve elde edilen korelasyon katsayısı ne kadar büyükse (yani +1.00’a yakın ise) uygulanacak aracın geçerliği de o oranda yüksek olacaktır.

Görüldüğü üzere KAPSAM GEÇERLİĞİ, bir testin ölçmek istediği davranışları ne kadar kapsadığı ile ilgilidir.

ÖRNEK-2001 KMS Þ Bir matematik öğretmeni derste problem çözmeye yönelik aktivitelere ağırlık verdiği halde yaptığı sınav daha çok dört işlem yapabilme becerisini ölçen sorulardan oluşmuştur. Öğretmen bu yaklaşımıyla aşağıdakilerden hangisini olumsuz yönde etkilemiştir?

A) Puanıyla güvenirliği

B) Test-tekrar test güvenirliği

C) Testin kullanışlılığı

D) Testin kapsam geçerliği *

E) Soruların ayırt ediciliği

ÖRNEK-2003 KPSS Þ Bir başarı testinde kapsam geçerliği yüksek ise aşağıdaki sonuçlardan hangisi doğrudur ?

A) Tutarlı ve kararlı sonuçlar veren bir testten yararlandığı ;

B) Testteki soruların pek çoğunu öğrencilerin doğru olarak yanıtlayabildikleri,

C) Testteki soruların konu alanını iyi bir şekilde örneklediği,

D) Testteki soruların güçlük düzeylerinin gerçekleşmesi beklenen öğrenme düzeylerine uygun olduğu,

E) Öğrencilerin testteki soruları yanıtlamaya çalıştıkları,

 

2) YORDAMA GEÇERLİĞİ: Þ Yordama bir tahmindir. Ancak her tahmin bir yordama değildir. Bir tahminin yordama olabilmesi için onun geleceğe dönük olması ve belli bilgiler temelinde bazı teknikler kullanılarak yapılmış olması gerekir. Buna göre YORDAMA; İstatistiksel teknikler kullanılarak ve bilinenlerden yararlanarak bilinmeyen durumlar hakkında GELECEĞE YÖNELİK tahminlerde bulunma işlemidir.

 Yordama işinde kullanılan istatistiksel teknik REGRESYONDUR.

 Eğitimde kullanılan ölçme araçlarından bazıları özellikle bireylerin bir okulda yada bir işte göstermeleri gereken başarıları YORDAMAK için düzenlenmişlerdir. Genellikle bireylerin bir programa yada bir işe alınıp alınmaması onların bir testten elde ettikleri puanlara veya daha önceki bir programda almış oldukları notlara göre karara bağlanır.

ÖRNEK Þ Eğitim enstitülerine veya üniversitelere alınacak öğrencileri seçmek için yapılan sınavlar.

Yapılacak sınavın bir üst eğitime geçebilecek öğrencileri seçebilme düzeyinin incelenmesi de bir yordama geçerliğidir.

ÖRNEK Þ Öğrencinin matematik testindeki puanını göz önüne alarak fizik dersindeki başarı durumu hakkında fikir yürütmek.

ÖRNEK Þ Okula daha başlamamış bir öğrencinin zekâ testinden aldığı puana bakarak okuldaki başarı durumunun ne olacağını tahmin etmeye yönelik yapılan çalışma da YORDAMA çalışmasıdır.

Kişilerin gelecekteki başarılarını yordamak için kullanılan testlerin bu maksada hizmet etmesi yani yordama geçerliğine sahip olması istenir. Bir testin yordama geçerliği o testten elde edilen puanlar ile testin yordamak için düzenlendiği değişkenin doğrudan ölçüsü olan ve daha sonra elde edilen ölçüt arasındaki KORELASYONDUR.

Bu biçimde hesaplanan korelasyon katsayısı YORDAMA GEÇERLİĞİ katsayısı olarak adlandırılır. Korelasyon katsayısının büyüklüğü YORDAMA geçerliğinin yüksekliğine işaret eder.

NOT: Þ Bir testin yordama geçerliliği istatistiksel yollarla belirlenir. Bir testin yordama geçerliliğini belirlemede en önemli nokta uygun bir ÖLÇÜT ÖLÇÜSÜ elde etmektedir. Seçilen ölçüt ölçüsünün önem sırasına göre şu 4 niteliğe sahip olması gerekir. Þ

1) Ölçüt ölçüsü testin yordamaya çalıştığı değişken ile doğrudan ilgili olmalıdır. Bir başka deyişle ölçüt ölçüsü elde hazır bulunan test puanlarının alınmasında etkili olan aynı etkenler tarafından belirlenmelidir.

2) Ölçüt ölçüsü oldukça kararlı olmalı günden güne değişmemelidir. Çünkü kendisi kararsız olan bir ölçü hiçbir araçla yordanamaz.

3) Ölçüt ölçüsü kişinin başarısını gerçekten yansıtan nesnel ve güvenilir bir ölçü olmalıdır. Sözgelişi okulda alınan notlar ölçüt olarak alınmışsa öğrencilere verilen notlara öğrenci başarısının dışındaki etkenler etki etmemelidir.

4) Ölçütün elde edilmesi, kolay ve pratik olmalıdır.

NOT:  Genellikle bir zeka yada başarı testinin yordama geçerliğini belirlemede ölçüt olarak ders notları alınır. Sözgelişi üniversiteler arası seçme sınavında almış oldukları puanlara göre, üniversitelere girmiş olan öğrencilerin üniversitelerde almış oldukları notlar arasındaki korelasyon katsayısı üniversiteler arası seçme sınavının YORDAMA GEÇERLİĞİ katsayısıdır. Genel bir kural olarak test puanının elde edilmesi ile ölçüt ölçüsünün (üniversitelerde almış olduğu puanlar) elde edilmesi arasında geçen zaman arttıkça korelasyon düşer.

ÖRNEK-2002 KPSS  Lise 1. sınıflara uygulanan bir başarı testinin sonuçları, öğrencilerin sonraki öğrenimlerinde farklı programlara yönlendirilmeleri amacıyla kullanılabilir mi ? sorusunu soran bir kişi yapacağı geçerlik çalışması için öncelikle testin hangi özelliğini incelemelidir ?

A) İlköğretim konularını kapsama derecesini,

B) İçerdiği sorularla ilgili puanların birbiriyle korelasyonunu,

C) Aynı sınıf düzeyindeki ders notlarıyla korelasyonunu,

D) Testin yazım, çizim ve düzenleme kurallarına uygunluğu,

E) Ortaöğretim düzeyindeki başarıyı yordama, *

ÖRNEK-2003, 2004 KPSS Þ Aşağıdakilerden hangisinde bir yordama geçerliği vardır ?

 CEVAP Þ Yapılan bir sınavın bir üst eğitime geçebilecek öğrencileri seçebilme düzeyinin incelenmesi…

3) YAPI GEÇERLİĞİ  Birbiriyle ilişkili olduğu düşünülen belli öğelerin yada öğeler arasındaki ilişkilerin oluşturduğu bütüne yapı denir.

Eğitimde ve psikolojide kullanılan ölçekler benzer şekilde aralarında belirli ilişkilerin olduğu öğelerin oluşturduğu yapıları ölçmeye çalışırlar.

Zeka, yetenek, kritik düşünme gibi özellikler bir yapıdır. Mesela zekanın kendine özgü alt öğeleri vardır ve bu öğeler birbirleri arasında ilişkilidir. Bu tür yapıların ölçülmesinde ölçülecek olan yapı tanımlanır, bunlardan ölçülebilir davranışlar çıkarılır ve bunları ölçecek test maddeleri geliştirilir.

 Bir testin yapı geçerliğinin çalışılması testin maddelerinin ilgili olduğu alanı kapsamasına ve maddeler arasındaki ilişkilerin analizine dayanır.

 Yapı geçerliği, bir testin veya ölçme işleminin teorik bir yapıyı ölçüp ölçmediğinin belirlenmesidir. (Teorik yapı: Kişilik, yaratıcılık, ilgi, zeka, tutum vb) Yapı geçerliğinin temel mantığı; ölçülmesi planlanan teorik yapıya yüksek derecede sahip olan bir grupla düşük derecede sahip olan başka bir gruba testi uygulayıp testin bu grupları ne derece uygun olarak ayırıp ayırmadığına bakmaktır.

 Yapı geçerliğini kanıtlamada kullanılan en geçerli yol faktör analizi yapmak ve uzman görüşünü almaktır.

ÖRNEK: Þ 25 maddeden oluşan bir testin bir grup öğrenciye uygulandığını düşünelim. Testin birinci maddesinin testin bütünüyle ilişkili olup olmadığını anlamak için bu maddeye öğrencilerin verdikleri cevaplardan elde edilen puanlar ile bu madde dışında 24 maddeden öğrencilerin elde ettiği puanlar arasındaki korelasyona bakılır. Birinci maddeden elde edilen puanlar ile diğer 24 maddeden elde edilen puanlar arasındaki korelasyon yüksek ise bu madde YAPI GEÇERLİĞİNE sahiptir. Bu işlem testte yer alan her bir madde için ayrı ayrı gerçekleştirilerek her bir maddenin YAPI GEÇERLİĞİ tespit edilir.

 

4) GÖRÜNÜŞ GEÇERLİĞİ Bir testin gerçekten ne ölçtüğü ile değil onun ne ölçüyor göründüğü ile ilgilidir. Bir testin görünüş geçerliği o testin ölçmek istediği şeyi ölçüyor görünmesidir. Görünüş geçerliği olan bir test kapağında ne yazılıysa onu ölçüyor görünür. ÖRNEK: Kapağında İngilizce testi yazılı olan bir testin içinde İngilizce ile ilgili sorular varsa bu testin görünüş geçerliği vardır.

NOT: Þ Testin görünüş geçerliği bazı durumlarda yükseltilmeli bazı durumlarda gizlenmelidir. Eğer bir test piyasaya kabul ettirilmek isteniyorsa görünüş geçerliği yükseltilmelidir. Buna karşılık KİŞİLİK TESTLERİNİN ve kişilik testlerindeki maddelerin görünüş geçerlikleri gizlenmelidir. Yoksa kişiler maddelere doğru cevap vermekten kaçınabilirler.

 

 

 

 

GEÇERLİĞİ ETKİLEYEN FAKTÖRLER: Þ

1) GÜVENİRLİK Þ Güvenirlik, geçerliği etkileyen faktörlerden biridir. Güvenirlik, geçerlik için gerekli ama yeterli bir şart değildir.

2) İSTENMEYEN DEĞİŞKENLERİN ÖLÇÜMLERE KARIŞMASI Þ Sınavın ölçmeyi hedeflediği özelliklerden başka özellikleri ölçmesi geçerliği düşürür. ÖRN: Biyoloji dersinin sınav kağıdında yazının güzelliğinden, kağıt düzeninden veya çizilen grafiğin düzgünlüğünden etkilenerek fazla puan verilmesi geçerliği düşürür.

3) ÖLÇME YÖNTEMİ  Bireyin alacağı puanı etkileyebilir. Bir derste yazılı yoklama, çoktan seçmeli test, yada doğru-yanlış testi gibi yöntemlerden birinin kullanılması öğrencinin alacağı puandaki hata miktarını değiştirir.

4) UYGULAMA YERİ VE BİÇİMİNDEN KAYNAKLANAN HATALAR GEÇERLİĞİ ETKİLER

5) CEVAPLAMA İÇİN VERİLEN SÜREYE DİKKAT EDİLMELİDİR

6) TESTİN ÇOK KOLAY VEYA ZOR OLMASI GEÇERLİĞİ ETKİLER

7) ŞIKLI SORULARDA CEVAPLARIN ALT ALTA GELMESİ (a-a-a-a-a) GEÇERLİĞİ ETKİLER.

8)TEST KAPSAM BAKIMINDAN UYGUN OLMALIDIR. ÇOK DAR VEYA ÇOK GENİŞ KAPSAMI OLAN TESTLERİN GEÇERLİĞİ DÜŞÜKTÜR.

BİR TESTİN GEÇERLİĞİNİ ARTTIRMAK İÇİN DİKKAT EDİLMESİ GEREKEN HUSUSLAR

1) Her soru ölçmek istediğimiz davranışlardan en az birini ortaya çıkarıcı ve ölçücü olacak biçimde hazırlanmalıdır.

2) Her soru ölçtüğümüz davranışa sahip olanlarla olmayanları ayırıcı biçimde hazırlanmalıdır.

3) Güvenirliği artıracak önlemler alınmalıdır. Çünkü bu önlemler geçerliği de artıracaktır.

4) Test ders programını hem kapsayıcı hem de dengeli biçimde temsil edici nitelikte hazırlanmalıdır. Bunun için iyi bir sınav planı yapılmalıdır.

5) Sınavdan önce öğrencilere sorularla ilgili İPUÇLARI verilmemelidir.

6) Her sınavda öğrencilere farklı sorular sorulmalıdır.

ÖRNEK- 2001 KMS  Aşağıdakilerden hangisi sınavın geçerliğini düşürücü etkenlerden biri değildir ?

A) Yanıtların puanlanmasında sübjektif davranılması

B) Sınav soruları

 

Yorum Yaz

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir