EĞİTİM BİLİMLERİ MERKEZİ www.izmirkpsskursu.net 0 232 445 21 25
Transkript
EĞİTİM BİLİMLERİ MERKEZİ www.izmirkpsskursu.net 0 232 445 21 25
Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net EĞİTİM BİLİMLERİ MERKEZİ www.izmirkpsskursu.net 0 232 445 21 25 1 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net EDĠTÖR-HAZIRLAYAN Eğitim Uzm. Ahmet Nafiz DEMĠR 2 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net GENEL YAYIN YÖNETMENĠ-EDĠTÖR Ahmet Nafiz DEMĠR DĠZGĠ Ebim Dizgi Servisi Makbule ERDOĞAN Yağmur ÇAPACI Deniz Can DEMĠR KAPAK-SAYFA TASARIM www.grafiket.net BASKI Ebim Çankaya – ĠZMĠR Tel: 0 232 445 21 25 Faks: 0 232 445 21 27 www.ebimegitim.com © 2011 ebim Bu kitabın her türlü yayın hakkı, Ebim Basın Yayın Dan. Özel Eğitim Hizmetleri San. ve Tic. Ltd. ġti’ne aittir. 5846 ve 2936 sayılı Fikir ve Sanat Eserleri Kanunu hükümleri gereğince; yayıncının izni olmaksızın bu kitabın tamamı veya bir kısmı elektronik ortam dahil kopya edilemez, çoğaltılamaz ve kitaptan alıntı yapılamaz. 3 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net 1. Bölüm. TEMEL KAVRAMLAR lem sürecinde kullanılan araçlar ise “ölçek” kavra- TEMEL KAVRAMLAR mıyla ifade edilir. GerçekleĢtirilen eğitim-öğretim etkinlikleri sonu- Ölçme, bir baĢka ifadeyle “niteliklerin nicelik cin- cunda, belirlenen hedeflere ne derecede ulaĢıldı- sinden ifadesidir.” ğının, öğrencilerin kazanmaları istenen davranıĢlarının kazanılıp kazanılmadığının veya ne derecede Ölçüm: Ölçme iĢlemi sonucunda elde edilen sayı kazanıldığının belirlenmesi gerekir. Bunun için de veya semboldür. öğretmenler tarafından ölçme değerlendirme iĢlemi Örnek: “Ali‟nin boyu 1.60 cm‟dir.” Ali‟nin boyunun yapılması gerekmektedir. uzunluğunun ölçülmesi ve sonucun 1.60 bulunması Ölçme-değerlendirme, eğitim programlarının te- bir ölçme iĢlemidir. Bu ölçme iĢlemi sonucunda elde mel ögelerinden birisidir. edilen 1.60 ifadesi, “ölçüm” olarak adlandırılır. Ölçme Kuralı: Ölçme iĢlemi yapılırken, nitelik ve- ÖLÇME-DEĞERLENDĠRME SÜRECĠNDE ya özelliğin hangi miktarına ne değer verileceğinin TEMEL KAVRAMLAR belirlenmesidir. Ölçme: Nesneleri veya özellikleri gözlemleyerek, ve 5. soruların 15 puan değerinde, 6. sorunun ise sonucu sayı veya sembollerle ifade etmektir. Göz- 25 puan değerinde olduğunun belirlenmesi, ölçme Örnek: 6 sorudan oluĢan bir sınavda, 1. 2. 3. 4. kuralı olarak tanımlanır. Ölçme Değerlendirme Süreci Nesneler ve özellikleri Gözlem Sonucun sayı veya sembolle ifadesi Ölçüt (Kriter) Yargıda Bulunma Karar Verme Değerlendirme Ölçme Ölçme iĢlemi, değerlendirmenin ön koĢuludur. Ölçülecek özellik: Ali‟nin matematik bilgisi Değerlendirme yapılabilmesi için ölçme iĢleminin Ölçme aracı : Test yapılmıĢ ve bir veri elde edilmiĢ olması gerekir. Ölçüm : 70 Ölçme iĢlemi sonucunda elde edilen verilerin, bel- Ölçüt : 50 li bir ölçütle karĢılaĢtırılması sonucunda bir yargıya Yargı : Ali‟nin baĢarılı olması. ulaĢılarak, gözlenen özellikle ilgili karar verilmesi Karar süreci “değerlendirme” süreci olarak kabul edilir. Ölçme süreci Örnek: “Ali, geçme notunun 50 olduğu Matematik : Ali‟nin sınıfını geçmesi. : Ali‟nin Matematik sınavına gire- rek 70 alması. dersinden 70 alarak baĢarılı olmuĢ ve sınıfını geç- Değerlendirme : Ali‟nin puanını geçme notu olan miĢtir.” 50 ile kıyaslayarak baĢarılı bulunması ve sınıfı geçmesine karar verilmesi. 4 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Ölçme-Değerlendirme Süreci: Ölçme-Değerlendirme Süreci Ölçülen özellik Ali’nin Matematik Bilgisi Ölçme aracı Ölçüm Ölçüt (Kriter) Yargı Karar Test 70 50 Başarılı Geçti Ölçme Değerlendirme Ölçme-Değerlendirme Sürecinin AĢamaları: Örnek: Ölçme sonucu, belirlenen ölçütün altında mı, üstünde mi? vb. → Ali‟nin puanı 70, öl- 1. Ölçülmek istenin nitelik veya özelliklerin belir- çütümüz 50 olduğuna göre, bu buan belirlediğimiz ölçütün üzerinde. lenmesi. Örnek: Neyi ölçelim? → Ali‟nin Matematik bil- 6. Yapılan kıyaslama ile ilgili yargıda bulunulması. gisini 2. Ölçülecek nitelik veya özelliklerin hangi sayı Örnek: Ölçme sonucu elde edilen puan, yeterli veya sembollerle ifade edileceğinin belirlen- bir puanmı? Ġyi mi, kötü mü? BaĢarılı mı, mesi. baĢarısız mı? vb. → Ali‟nin puanı (70) ölçütün Örnek: Ölçerken, Ali‟nin bir bilgisine ve topla- üzerinde (50) olduğuna göre, Ali “BaĢarılıdır” mına değer verirken, puanla mı, sembolle mi 7. Ölçme sonucunun ölçüte uygunluğuna göre değer verelim? Bu değerler ne olmalı? → yargıya dayalı olarak karar verilmesi. 100‟lük puan sisteminde olsun, 10 sorunun her Örnek: Ölçme sonucu ile ilgili bir karar veril- bir 10 puan olsun. mesi gerekiyorsa “Seçelim mi, seçmeyelim 3. Ölçülecek nitelik veya özelliklerin, hangi ölçek- mi?, Geçsin mi, kalsın mı? vb. → Ali, ölçütün le ve hangi yöntemle ölçüleceğinin belirlenme- üzerinde puan alarak “BaĢarılı” (yargı) oldu- si. ğuna göre, bu puanla bu dersten sınıfı “Geçer” Örnek: Test mi yapalım, gözlem mi? Bunlar- (Karar). dan hangi türü uygulayalım? → Ali‟nin Matematik bilgisini, açık uçlu sorularla test edelim. Not: Ölçme sürecinin sonunda elde edilen ölçümler (Klasik sınav) üzerinde değerlendirme yapılması, ölçme iĢlemin- 4. Belirlenen kurallara göre, özellik veya nitelik- den hemen sonra olabileceği gibi, belli bir zaman lerle niceliklerin eĢleĢtirilmesi. dilimi içerisinde de gerçekleĢebilir. Değerlendirme- Örnek: Ali‟nin sınav kağıdındaki yazdıkları ile nin, ölçme iĢleminden hemen sonra gerçekleĢtiril- yanıt anahtarını karĢılaĢtırıp her sorunun pu- mesi zorunlu değildir. anlanması ve sınav puanının belirlenmesi. (Ali Örnek; Sürekli gözlem yapılan bir ölçme iĢleminde, 10 sorunun 7‟sini doğru yanıtladı ve 70 aldı) elde edilen veriler kaydedilerek, sürecin sonunda 5. Elde edilen niceliklerin (ölçme sonucunun), be- elde edilen veriler üzerinde belli iĢlemler yapıldıktan lirlenen kriterle karĢılaĢtırılıp kıyaslanması. sonra değerlendirme yapılabilir. (Üniversitede vize ve final uygulaması gibi…) 5 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net ÖLÇME TÜRLERĠ Özellikleri Örnek Temel Ölçme Doğrudan Ölçme Bir sınıftaki öğrenci sayısınin belirlenmesi, bir Ölçülecek değiĢkenin değerlerinin doğrudan Ölçme konusu olan özelliğin kendisinin bir araç kavanoz içerisinde bulunan bilyelerin sayılması, doğruya gözlenebilmesidir. kitaplıkta bulunan öğrenci sayısının belirlenmesi, StandartlaĢtırılmıĢ bir ölçme aracı bulunmaz. bir kitabın sayfa sayısının belirlenmesi, (Her tür sayma iĢlemi, temel ölçmeye örenek oluĢturur.) yardımı ile ölçülmesidir. Doğrudan ölçme sonuçlarının geçerlik ve güvenirliği yüksektir. Öğrencilerin boy uzunluklarını ölçmek, kefeli terazi Ölçme aracının özellikleri ile ölçülen özellik ile ağırlık ölçmek vb. birbiri ile aynıdır. (Uzunluğun, uzunluk aracıyla ölçülmesi gibi…) Bazı nitelik veya özelliklerin doğrudan gözlemlenmesi veya ölçülmesi mümkün olmayabilir. Bu durumlarda bir baĢka değiĢkenden yararlanarak bu nitelik veya özellik ölçülebilir. ĠĢte bunun gibi durumlarda, yani baĢka bir değiĢkenin özelliklerinden Dolaylı Ölçme yararlanarak nitelik veya özelliğin varlık veya yokluğunu, ya da varlık miktarını ölçmeye Ders baĢarısı, zeka, tutum, hava sıcaklığının dolaylı ölçme denir. ölçülmesi vb. Eğitimde insan niteliklerinin ölçülmesinde Yaylı kantar ile ağırlık ölçme, termometre ile ısıyı ölçülecek niteliği ölçme aracı ile doğrudan ölçme iĢlemlerinde göstergelerden yararlanılır. Bu karĢılaĢtırma olanağı yoktur. Bazı durumlarda nedenle, bu tür dolaylı ölçmelere göstergeyle ölçme daha da dolaylı bir Ģekilde ölçme denir. gerçekleĢmektedir. Örneğin, bir ünite veya dersin birkaç ünitelik bir kısmı bitirildiğinde, öğrenciler, dersin bu bölümünde öğrenmeleri beklenen davranıĢları öğrenmiĢlerse bunları kullanarak içinden çıkabilecekleri durumlar, yanıt verebilecekleri sorular, yapabilecekleri iĢler… ile karĢı karĢıya getirilmektedir. TüretilmiĢ Ölçme Örnek: Ankara‟dan Ġzmir‟e giden bir yolcu Nitelik veya özellik, iki değiĢken arasındaki otobüsünün hızını bulmak istiyoruz. Otobüsün matematiksel bir iĢlem sonucunda elde hızını belirleyebilmek için öncelikle yol uzunluğunu edilebiliyorsa, bu tür ölçme iĢlemlerine yani mesafeyi ve bu mesafeyi bilmemiz türetilmiĢ ölçme denir. gerekmektedir. Bu iki iĢlem, doğrudan ölçmeye Bir cismin kütlesi hacmiyle bölünürse birer örnektir. Ancak; Otobüsün hızını bulmak için, yoğunluk bulunur. Yoğunluk ölçme ise mesafeyi otobüsün bu mesafeyi aldığı zamana türetilmiĢ ölçme türüdür. böleriz. Elde ettiğimiz sonuç, otobüsün bir saatte yaptığı hızı verecektir. 6 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net ÖLÇEK VE ÖLÇEK TÜRLERĠ testler, çoklu zekâ ve öğrenme stillerini belirlemek amacıyla kullanılan envanterler… Ölçek: Belirli bir niteliği veya özelliği ölçmek ama- Sayı veya sembollerle ifade edilen ölçme iĢlemi cıyla, belli birimlerle bölümlenmiĢ ölçme araçladır. sonuçlarının neyi ifade ettiği, taĢıdığı anlam daha Örnek; ağırlık ölçmek için kilogram, uzunluk ölç- çok ölçek türleriyle ilgilidir. Ölçek türleri, sınıflama mek için metre, öğrenci baĢarısını ölçmek için kulla- (adlandırma), sıralama, eĢit aralıklı ve eĢit oranlı öl- nılan testler, zekâ düzeyini belirlemek için kullanılan çekler olmak üzere dört grupta toplanmaktadır. Ölçek Türleri ve Özellikleri: Ölçülecek değiĢkenin yalnızca belirli gruplara ayrılabildiği durumlarda kulanılan ölçmelerin ölçeği sınıflama ölçeğidir. Sınıflandırma ölçekleri gözlemlerin en basit biçimi olup, taĢıdığı bilgi en az olan ölçeklerdir. Bu ölçekte ölçme iĢlemi nesneleri belli bir özelliğe göre adlandırma, benzeĢik sınıflara Sınıflama (Adlandırma) Ölçekleri ayırma amaçlarıyla yapılır. Adlandırma iĢlemi bir kodlamadır. Bir okuldaki öğrencilere numara vermek, sokak kapılarını numaralamakbu tür ölçme iĢlemlerine örnek olarak gösterilebilir. Sınıflamada ise, nesneler dikkate alınan özelliğe göre sınıflara ayrılırlar. Nesneleri, belli bir özelliğe göre, gerek adlandırmada gerekse sınıflamada semboller, sıfatlar veya sayılar kullanılabilir. Sayı, sıfat veya sembolden hangisi kullanılırsa kullanılsın, sonuçta elde edilen, sadece nesneleri veya sınıfları birbirinden ayırmaya yarar; baĢka bir anlamda kulanılamaz. Adlandırma-sınıflama ölçeğindeki ölçme sonuçlarına hiçbir matematiksel iĢlem uygulanamaz, uygulansa da anlamlı olmaz. Bu ölçekte sınıflama yapılmıĢ ise aynı özelliğe sahip olan nesneler sayılabilir, frekans tablosu yapılabilir ve mod (tepe değer) bulunabilir. Bu ölçekteki veriler üç özelliğe sahiptirler: Bunlar yansıma, simetri ve geçiĢme özellikleridir. Yansıma: Ölçme konusu özelliğe göre farklı iki nesneye “a” kodu verilmiĢse a=a‟dır. Simetri: Ölçme konusu olan özelliğe göre bir nesneye a, baĢka bir nesneye de b kodu verilmiĢ ise a=b ise b=a‟dır. GeçiĢme: Ölçme konusu olan özelliğe göre, a=b ve b=c ise a=c‟dir. Nesnelerin, dikkate alınan özelliğe göre büyükten küçüğe veya küçükten büyüğe sıraya konmasıdır. Sıralama ölçeğinde kullanılan sayılar sıra sayılarıdır. Örneğin, beden eğitimi dersinde öğrencileri boy sırasına dizip onları bu sıraya göre numaralamak sıralamadır. Seçmenlerin altı partiyi tercihlerine göre sıralaması, bir sınav sonucunda öğrencilerin en çok doğru sayısı olandan en az doğru sayısı olana doğru sıralanması da sıralama iĢlemidir. Sıralama ölçeklerinden elde edilen veriler, sıra sayıları olarak Sıralama Ölçekleri adlandırılan birinci, ikinci vb. sayılarla gösterilir. Sıralama ölçeğindeki ölçme sonuçlarının bir baĢlangıç noktası yoktur, ancak ölçüm sonuçlarına göre birim değerleri farklıdır. Bu nedenle bu ölçekteki verilerle büyüklük-küçüklük karĢılaĢtırmaları yapılabilir; fakat toplama, çıkarma, çarpma ve bölme iĢlemleri yapılamaz; yapılsa da anlamlı olmaz. Bu ölçekteki ölçme sonuçları üzerinde ortalama ve standart kayma da hesaplanamaz. Sıralama ölçeği ile elde edilen veriler üzerinde sınıflama ölçeğinde yapılan iĢlemlere ek olarak ortanca ve yüzdelikler hesaplanabilir. Ters Simetri: Sıralama ölçeğinde iki ölçme sonucu a ve b olduğuna göre a>b‟nin doğru olması halinde b>a doğru değildir. Ali‟nin Eğitim fakültesinin sınıf öğretmenliği anabilim dalına giriĢ ÖSS puanı 360 ve tercih sırası 2, Ahmet‟in giriĢ puanı 356 ve tercih sırası 4 ise 2>4‟tür ve 4>2 doğru değildir. GeçiĢme: Sıralama ölçeğinde üç ölçme sonucu a, b ve c olduğuna göre, a>b ve b>c ise a>c‟dir. (a) Ali‟nin KPSS deneme sınavında aldığı puan 92 ve sıralama derecesi 1., (b) Ahmet‟in aldığı puan 89 ve sırası 5. ve (c) Veli‟nin aldığı puan 82 ve grup sırası ise 16.„dır. Ali‟nin, Ahmet‟in ve Veli‟nin yapılan deneme sınavı sonuçlarındaki sıraları arasında a>b ve b>c iliĢkileri varsa a>c iliĢkisi de vardır. 7 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Bu ölçekteki verilerin bir birimi ve (0) göreli bir baĢlangıç noktası vardır. Aralık ölçeğindeki ölçme sonuçlarında 0 yokluk anlamına gelmez; baĢlangıç anlamında ve bağıldır. Bağıl bir baĢlangıç ve biriminin olması, eĢit aralıklı ölçekteki ölçme sonuçlarıyla miktar karĢılaĢtırmalarının yapılmasını olanaklı EĢit Aralıklı Ölçekler kılar. Farklı sistemlere göre yapılmıĢ termometrelerle yapılan ölçmeler, bir standart testin puanları aralık ölçeğindedir. Deniz düzeyinin sıfır (baĢlangıç) ve metrenin birim olarak alındığı yükseklik ölçümleri, gece yarısının baĢlangıç ve saatin birim olarak alındığı zaman ölçümleri ve takvimlerdeki gün ay ve yıl sonuçları birer eĢit aralıklı ölçme sonuçlarıdır. Eğitimde kullanılan ölçme sonuçları bu tür ölçek niteliğindedir. Örneğin, 80 puan alan bir öğrenci, 40 puan alan bir öğrenciden tam iki kat daha iyi biliyor anlamına gelmez, ya da 50 puan alan iki öğrencinin ikisi birden dersle ilgili her Ģeyi biliyor anlamına gelmez. Aralık ölçeğindeki ölçme sonuçları üzerinde doğrusal dönüĢtürmeler yapılabilir. Örneğin, birim standart test puanları, z standart test puanı yardımıyla T puanlarına dönüĢtürülebilir. Bu eĢitlikteki T puanı ortalaması 50 ve standart kayması 10 olan bir dağılımdır. Bu ölçekteki veriler üzerinde toplama ve çıkarma iĢlemleri yapılabilir. Ayrıca aritmetik ortalama, standart kayma ve pearson momentler çarpımı korelasyon katsayısı gibi istatistiksel tekniklerin kullanılması da olanaklıdır. Bu ölçekteki verilerin baĢlangıç noktası gerçek olmadığından veriler oransal karĢılaĢtırmalar yapmaya uygun değildir. Eğitimde en fazla kullanılan ölçek türü eĢit aralıklı ölçeklerdir. EĢit Oranlı Ölçekler Bir değiĢkenin iki gerçek değerinin birbirine oranının, bu değerlere karĢılık gelen ölçme sonuçlarının birbirine oranına eĢit olmasına, eĢit oranlılık özelliği denir. EĢit oranlılık; a) Varlıkla yokluğu ayıran gerçek bir sıfır noktası vardır. Bunun için sayılar arasındaki oran iliĢkisi ilgili değiĢkene sahip oluĢ derecelerinin oran iliĢkisini yansıtır. b) Ölçekteki birimler, ölçeğin her bölgesinde eĢit ve ölçülen değiĢkenin gerçek değeriyle oranlı olmalıdır. Oran ölçeği en üst düzeydeki ölçektir. Örneğin, masanın boyunun uzunluğu eninin uzunluğunun iki katı ise, gerçekte masanın boyu enin iki katıdır. Oran ölçeğindeki ölçme sonuçlarıyla her türlü karĢılaĢtırmalar yapılabileceği gibi bütün matematiksel iĢlemler de yapılabilir. Bu ölçekteki veriler bütün istatistiksel tekniklere uygundur. Eğitimde oran ölçeğiyle ölçme sonuçları elde etmek olanaklı değildir. Ölçme ĠĢleminde Ölçek Kullanmanın Yararları 1. Doğal Birim: Bir nitelik veya özelliğin ne ka- Ölçme sonuçlarının, yani ölçümün daha du- dardaki miktarına 1 birim denileceğinin bilim adam- yarlı ve güvenilir olmasını sağlar. ları ya da uzmanlar tarafından tanımlanmadığı, ken- Sadece gözlem yoluyla ölçme yapamadığı- diliğinden belli olduğu birimlerdir. Doğal birimlerde, mız durumlarda ölçme yapmamıza olanak değiĢkenin her bir parçası kendiliğinden 1 birim ola- sağlar. rak kabul edilir. Ölçme sonuçlarının belirli standartlarda ger- Örnek: Sınıftaki öğrenci sayısının belirlenmesi, çekleĢmesini sağlar. (Sınıftaki her öğrenci 1 birimdir) Birim: Ölçülmek istenen bir özellik veya niteliğin 2. TanımlanmıĢ Birim: Bir nitelik veya özelliğin tamamının miktarı belirlenirken, onun daha küçük ne kadardaki miktarına 1 birim denileceğinin bilim bir miktarının (biriminin) katları cinsinden ifade edilir. adamları veya uzmanlar tarafından tanımlandığı, ĠĢte bu bütünün, standart kabul edilen küçük par- birimin kendiliğinden belli olmadığı birimlerdir. çasına birim denir. Örnek: Milimetrelerle düzenlen- Örnek: 1 birimlik ders saatinin 45 dakika olması, 1 miĢ 30 cm.lik bir cetveldeki birim, mm. dir. Aynı cet- saatin 60 dakika olması, 1 kilogramın 1000 gram vel sadece 1 cm lik dilimlere bölünmüĢ, yani en kü- olması, uygulanacak 20 soruluk sınavda 1 sorunun çük birim 1 cm ise, birim cm. dir. 5 puan olması… Ancak; ölçmeye konu olan nitelik veya özelliklerin Bu örneklerin hepsinde 1 birim, o alanın uzmanı birimleri her zaman aynı özellikleri taĢımaz. Bu ne- tarafından tanımlanmıĢtır. denle birimler, taĢıdığı özelliklere göre tanımlanmıĢ veya doğal birim olarak adlandırılırlar. 8 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Birimlerde Bulunması Gereken Özellikler: 2. TanımlanmıĢ Sıfır: BaĢlangıç noktasının uzmanlar veya 1. EĢitlik: Aynı nitelik veya özelliklerin ölçülme- bilim adamları tarafından belir- sinde standart kabul edilen birimin, ölçme aracının lendiği ve bu noktaya sıfır nok- her biriminde veya ölçme sürecinde ve ölçme tası denilerek ölçme iĢlemlerinin iĢleminden ölçme iĢlemine değiĢmemesi, her birimin yapıldığı sıfır noktasıdır. aynı miktarı ifade etmesidir. Örnek: Termometredeki sıfır Örnek; cetvel üzerinde her 1 cm. nin birbirine eĢit noktasında; baĢlangıç noktası tanımlanmıĢ bir sıfır olması, cetvelden cetvele 1 cm. lik uzunluk mik- noktasıdır. Sıfır noktasının altında da – (eksi) de- tarının değiĢmemesi… ğerde bir ısı bulunmaktadır. BaĢlangıç noktası olan sıfır noktası, suyun donmaya baĢladığı ısı noktası 2. Genellik: Birimin yaygın olarak kullanımını olarak bilim adamları tarafından tanımlanmıĢtır. ifade etmekle birlikte, bir birimin herkes tarafından Örnek: Sınavda boĢ kağıt veren öğrenciye sıfır aynı anlamı taĢımasını ifade eder. verilmesi. Bu örnekteki sıfır, eğitim uzmanları veya Örnek: 1 km. biriminin Türkiye‟deki yaygınlığı yani öğretmen tarafından tanımlanmıĢ bir sıfırdır. Öğren- genelliği, 1 mil. den daha yaygın, yani daha ge- cinin boĢ kağıt vererek sıfır alması, öğrencinin bu neldir. dersle ilgili bilgilerinin sıfır olduğu anlamına gelmez. Sadece bu sınavdaki soruların cevaplarını bilme- 3. KullanıĢlılık (Amaca Uygunluk): Kulanılan 1 diğini ifade eder. birimin, ölçme iĢlemindeki amacı gerçekleĢtirmeye uygun-luğunu ifade eder. Ölçüt (Kriter): Ölçme iĢlemi sonucu hakkında Örnek: Bir öğrencinin ağırlığının ölçülmesinde yargıda bulunup, karar verebilmek için, ölçme iĢlemi birimin 1 ton olarak alınması birimin kullanıĢlı olma- sonucunda elde edilen verinin karĢılaĢtırılıp kıyas- dığını, 1 kg olarak alınması ise kullanıĢlılığını ifade landığı değerdir. eder. Örnek: “Matematik dersinden baĢarılı sayılabilmesi için öğrencilerin bu sınavdan 50 puan ve üstünde Ölçmede Sıfır Noktası: almıĢ olmaları gerekir.” Örnekteki 50, bu sınavda Sıfır noktası, ölçme iĢlemindeki baĢlangıç nokta- baĢarılı veya baĢarısız öğrencileri belirlemek, yani sını ifade eder. Birimlerde olduğu gibi, sıfır nok- öğrencilerin sınav sonuçlarıyla ilgili bir yargıda tasının belirlenmesinde de baĢlangıç noktasının be- bulunmak için gerekli olan değer, yani ölçüttür. lirlenmesi kendiliğinden, yani doğal olarak veya bir uzman veya bilim adamları tarafından tanımlanmıĢtır. Sıfır noktası, doğal sıfır veya tanımlanmıĢ sıfır ÖLÇÜT TÜRLERĠ olarak gruplandırılır. 1. 1. Mutlak Sıfır: Bir özellik Mutlak Ölçüt: Ölçme değerlendirme iĢlemi- veya niteliğin, gerçek anlamda ne baĢlamadan önce ölçüt belirlenmiĢ ise bu tür yokluğunu ifade eden sıfırdır. ölçütlere mutlak ölçüt denir. Sıfır göreceli değil mutlaktır. Örnek: Bir sınavdan baĢarılı sayılabilmek için ba- Sıfır Ģarı notunun önceden 50 olarak belirlenmesi. öncesinde baĢka bir değer yoktur, yani sıfırın öncesi bir yokluğu ifade Örnek: Okullarımızdaki sınıf geçme ve sınav sis- eder. teminde sınıf geçme puanları, Milli Eğitim Bakan- Örnek: Öğrencinin boy uzunluğunun 1.45 olması. lığı tarafından yönetmeliklerle belirlenmektedir. Buradaki öğrencinin boy uzunluğu ölçümündeki Dolayısıyla okullarda uygulanan ölçme değerlen- baĢlangıç noktası olan sıfır, gerçek bir sıfır nokta- dirme iĢlemlerinde kullanılan ölçütler, mutlak öl- sıdır. Sıfır öncesinde öğrenciye ait bir uzunluk bu- çütlerdir. lunmamaktadır ve sıfır noktası hiç kimse tarafından tanımlanmamıĢtır. 9 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Bağıl Ölçüt: Ölçüt, ölçme iĢlemi sonucunda Değerlendirme, üzerinde çalıĢılan alandaki durum elde edilecek verilerin ortalamalarına göre belirleni- üzerinde tesbit yapmak için gerçekleĢtirilir. Dolayı- yorsa, bir baĢka deyiĢle ölçüt, ölçme iĢleminden sıyla sonra belirleniyorsa bu tür ölçütlere bağıl ölçüt eksiklik ve sorunlar giderilerek durum yeniden dü- denir. zenlenir. Eğitim sisteminde de değerlendirme, girdi- 2. değerlendirme sonucunda ortaya çıkan Örnek: Bir sınavdaki geçme notunun, sınav lerin, sürecin iĢleyiĢinin ve çıktıların değerlendiril- sonuçlarının aritmetik ortalaması olarak belirlen- mesi için gerçekleĢtirilir. mesi. Örnek: ÖSS, OKS, KPSS sınavlarında kullanılan EĞĠTĠMDE DEĞERLENDĠRME VE TÜRLERĠ ölçütler, bağıl ölçütlerdir. Değerlendirmenin Eğitimdeki Önemi Uygulanan eğitim programının baĢarısı hakDEĞERLENDĠRME VE TÜRLERĠ kında bilgi verir. BaĢarılı öğrencileri motive eder. Değerlendirme: Ölçme iĢlemi sonucunda elde Öğrencinin nasıl öğreneceğine dair yol gös- edilen sayı veya sembollerin bir ölçütle karĢılaĢtırılıp terir. kıyaslanarak, bir yargıda bulunma ve karar verme Öğretmenin, öğretim etkinliklerinin ne derece- sürecidir. de etkili olduğu konusunda bilgi verir. Öğrenci hakkında verilecek kararlarda daya- Değerlendirme Sonuçlarını Etkileyen Faktörler nak oluĢturur. Ölçümlerin niteliği, Öğrencileri çalıĢmaya güdüler. Ölçümlerin geçerliliği, Öğrenci geliĢiminin değerlendirilmesini sağlar. Ölçümlerin güvenirliği, Öğrenme-öğretme etkinliklerinde yol gösterici Ölçümlerin kullanıĢlılığı, rol oynar. Ölçütün kullanıĢlılığı, değerlendirmenin amacına uygun olması. UYGULANIġ AMAÇLARINA GÖRE EĞĠTĠMDE KULLANILAN DEĞERLENDĠRME TÜRLERĠ Uygulanış Amaçlarına Göre Değerlendirme Türleri Ölçüte Göre Değerlendirme Öğretimin Değerlendirilmesi Mutlak Değerlendirme Bağıl Değerlendirme Tanıma Yerleştirme Öğrenmeleri İzleme Öğrenme Düzeyini Belirleme Öğretim Programının Değerlendirilmesi 10 Eğitim Sisteminin Değerlendirilmesi Yöneltme (Rehberlik) Amacıyla Yapılan Değerlendirme Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net ÖLÇÜTLERE GÖRE DEĞERLENDĠRME TÜRLERĠ Tanıma yerleĢtirme amacıyla uygulanan sınav türleri, seçme sınavı, tanıma sınavı, düzey be- Mutlak Değerlendirme: Ölçütün önceden belli lirleme sınavı, hazırbulunuĢluk sınavı yetenek ve kesin olduğu değerlendirmelerdir. Okullarda belirleme sınavı gibi çeĢitli isimlerle uygulan- yapılan değerlendirmelerin hepsi mutlak değer- maktadır. lendirmedir. Çünkü; değerlendirmede kullanılan ölçütler önceden yönetmeliklerle belirlenmiĢtir. Biçimlendirme-YetiĢtirme (Öğrenmeleri Ġzle- Örnek: me): Öğrencilerin belli bir konu veya ünitedeki - 100 sorudan 50 sini yapanın sınıfını geçmesi. öğrenme - 500 metreyi 1 dakikada koĢabilen öğrencinin eksikliklerin giderilmesinin amaçlandığı değer- baĢarılı sayılması. eksikliklerinin belirlenerek, bu lendirmelerdir. - Yıl sonu not ortalamasının 3 ve üzerinde olan Bu tür değerlendirmelerde izleme, ünite veya öğrencilerin sınıfını geçmesi. formatif testler kullanılır. Bağıl Değerlendirme: Ölçütün, ölçme iĢlemi Değer Biçme-BaĢarıyı Belirleme (Öğrenme sonucunda grubun baĢarısına göre belirlendiği Düzeylerini Belirleme): Eğitim-öğretim etkinlik- değerlendirmelerdir. Bireyin baĢarısı, grubun ba- lerinin, programın hedeflerine ulaĢma düzeyinin Ģarısına bağlıdır. Değerlendirme, ölçme sonucun- ve öğrencilerin baĢarılarının belirlenmesi ama- da elde edilecek verilerin birbiriyle iliĢkilendirilme- cıyla yapılan değerlendirmelerdir. Bitirme testi, siyle elde edilecek ölçütlerle yapılır. baĢarı testi, yeterlik testi, eriĢi testi gibi testler kullanılır. Örnek: EriĢi Testi: Öğrencinin, bir programdaki giriĢ - Sınavda ilk 10‟a girenlerin baĢarılı sayılması. davranıĢları ile çıkıĢ davranıĢları arasındaki farkı - Sınıfta yapılan sınavda elde edilecek aritmetik belirlemek için uygulanan testlerdir. ortalamanın üstünde alan öğrencilerin baĢarılı sayılması. Yöneltme (Rehberlik) Amacıyla Yapılan De- - Sınıfta en baĢarılı olan üç öğrenciyi tesbit etme. ğerlendirme: Öğrencilerin ilgi ve yeteneklerinin - ÖSS, OKS, KPSS Sınavları. belirlenerek, ilerideki eğitim veya mesleki geliĢim alanlarına yöneltilmesi amacıyla yapılan değerlendirme türüdür. Genellikle okul rehberlik ser- ÖĞRETĠMĠN DEĞERLENDĠRĠLMESĠ visleri tarafından uygulanır. Öğrencilerin meslek seçimleri, üniversite ter- Eğitim programlarında belirlenen hedeflere ulaĢ- cihlerinin oluĢturulması, öğrencinin eğitsel ve ki- ma düzeyini belirleyerek, bu hedeflere ulaĢmak için Ģisel sorunları belirlenerek çözümlenmesi aĢa- düzenlenen eğitim öğretim etkinliklerinin ne derece- masında bu tür değerlendirmeden yararlanılır. de uygun olduğunu değerlendirmeye dönük çalıĢmaları içerir. Bu değerlendirme Ģeklinde öğrenciler değerlendirilmez. Uygulanan testler, eksiklikleri tes- ÖĞRETĠM PROGRAMININ DEĞERLENDĠRMESĠ bit etmeye ve eğitim öğretim etkinliklerinin niteliğini değerlendirmeye yöneliktir. Bir öğretim programının sağlam olması, programa alınan davranıĢların öğrenci düzeyine uygun ol- Tanıma YerleĢtirme: Eğitim-öğretim sürecinin ması, ulaĢılabilmesi, hedef ve davranıĢların tutarlı baĢında, bir kurs, okul, dershaneye baĢlangıçta olmasıyla, davranıĢlar arasındaki örüntünün uygun veya bir konu ya da ünitenin baĢlangıcında, öğ- olmasına bağlıdır. Öğretim programlarının değerlen- renme konularının gerektirdiği ön öğrenmelerin dirilmesi amacıyla yapılan ölçmelerle, programa alı- var olma derecesini belirlemek amacıyla yapılan nan davranıĢların öğrenci düzeyine uygun olup değerlendirmelerdir. olmadığı, ulaĢılabilirliği, hedef ve davranıĢların tu- 11 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net tarlılığı ve de davranıĢlar arasındaki örüntünün uygunluğu sınanır. Bu yolla elde edilen bilgilerle programın sağlamlığı denetlenebildiği gibi, elde edilen bilgilerle programa dönüt sağlanarak gerekli düzeltme çalıĢmaları da yapılabilir. EĞĠTĠM SĠSTEMĠNĠN DEĞERLENDĠRĠLMESĠ (Uluslararası Düzeydeki Durum Belirleme Ölçekleri:PISA, TIMMS, PIRLS) Türkiye‟de eğitimin kalitesinin uluslararası karĢılaĢtırmalardaki yerinin saptanmasında yararlanılabilecek üç ayrı araĢtırma verisi bulunmaktadır. Bunlar: TIMSS, PIRLS ve PISA sonuçlarıdır. Uluslararası ölçme-değerlendirmeler yapan bir kuruluĢ tarafından gerçekleĢtirilen TIMSS fen ve matematik alanında, dört yılda bir yinelenen uluslararası bir düzey belirleme sınavıdır. Uluslararası Eğitim BaĢarılarını Belirleme KuruluĢu‟nun Uluslararası Okuma Becerilerinde GeliĢim Projesi (PIRLS), 35 ülkede ilköğretim 4. sınıf öğrencileri arasında yaptığı “Okuma Becerileri AraĢtırması”dır. En kapsamlı uluslararası değerlendirme projesi olan PISA, OECD ülkelerindeki 15 yaĢ grubu öğrencilerinin zorunlu eğitimin sonunda yeterince yaĢama hazırlanıp hazırlanmadıklarını, matematik, fen ve okur-yazarlık düzeylerini ve problem çözme becerilerini ölçmeyi hedeflemektedir. 12 13 Her hedefle ilgili olarak görülmesi beklenen öğrenme düzeyi (mutlak ölçüt). Bu amaçla birer bağıl ölçüt olan grup normları da kullanılabilir. Test puanları ve alt puanlar, bunların anlamları (nüt değerleri vb.) 1. Öğrenme eksikleri (madde veya madde grubu puanları). 2. Eskillerden her birine yol açmıĢ olması beklenebilecek güçlükler 3. Etkili eksik tamamlama yolları 1. Her yön veya alandaki geliĢim ve kiĢilik veya çevre özelliği ile ilgili alt puanlar. 2. Puan ve alt puanları gösteren profiller. 3. Olanaklı durumlarda, yordama kemerleri. 8. DEĞERLENDĠRME SONUCU 0,50 dolayında yoğunlaĢmak koĢulu ile genellikle 0,30 ile 0,70 arasında, (Hedeflere eriĢme derecelerine bağlı olduğundan önceden bilinemeyeceği de savunulabilir.) Öğrencilerin, ögeleri öğrenme derecelerine bağlı olduğundan önceden bilinemez. Her öge ile ilgili olarak beklenen öğrenme düzeyi (mutlak ölçüt). Ders veya kursun hedeflerinde kapsanmıĢ olan davranıĢsal özellikleri belirleyici kritik davranıĢların yeterli bir örneklemi. Ünitede öğretilmesi planlanmıĢ olan tüm kritik davranıĢlar. Ders veya kurslar için özel olarak hazırlanmıĢ düzey belirleme testleri 7. KULLANILAN ÖLÇÜT 1. Öğrencinin geliĢmesinde etkili olduğu düĢünülen tüm ön öğrenmeler. 2. Öğrenci kiĢiliğinin öğrenmeye iliĢkin tüm yönleri 3. Çevrenin, öğrencinin geliĢmesiyle ilgili yönleri. Kapsamın ilk iki maddesindeki ölçekler için, bu ölçeklerin gereklerine uygun nitelikte (genellikle 0,50 dolayında merkezlenen güçlüklerde). Üniteler için özel olarak hazırlanmıĢ izleme testleri 1. DeğiĢik becerilerde görülmesi beklenen geliĢme düzeyleri (mutlak ölçütler) veya normlar (bağıl ölçütler). 2. KiĢilik ölçekleriyle ilgili normlar 3. Çevre özellikleriyle ilgili normlar 6. ORTALAMA MADDE GÜÇLÜĞÜ 5. ÖLÇME ARAÇLARININ KAPSAMI 1. Standart baĢarı testleri 2. Standart teĢhis testleri 3. Ġzleme ve düzey belirleme testleri 3. ÜZERĠNDE EN ÇOK DURULAN ÖZELLĠKLER 4. KULLANILAN ÖLÇME ARAÇLARI 1. BiliĢsel, duyuĢsal ve devimsel öğrenmeler 2. Bedensel, ruhsal ve çevresel özellikler 2. ZAMAN Ders veya kursun hedeflerinde kapsanmıĢ olan tüm davranıĢsal özellikler (Görülen biçimiyle daha çok biliĢsel davranıĢlar) Öğretimde belli dönem sonları (Öğretimin tamamlayıcısı olarak) Öğrenme ünitesi sonları (Öğretimin bir parçası olarak) Okul, okul yılı, dönem (sömestir) veya ders baĢları. (Öğretime hazırlık olarak) 1. TEMEL AMAÇ Daha çok biliĢsel davranıĢlar (Kuramsal olarak, devimsel davranıĢlar veya duyuĢsal özellikler de olabilir) 1. Hedefler doğrultusunda eriĢilmiĢ olan öğrenme düzeylerini belirleme 2. Öğrenme düzeyini yansıtacak biçimde, a. Not verme, b. Yeterliği belgeleme, c. Gelecekteki baĢarıyı yordama, d. Daha sonraki derste nereden baĢlanacağını belirleme, e. KarĢılaĢtırmalar yapma. ÖĞRENME DÜZEYLERĠNĠ BELĠRLEME 1. Ünitedeki öğrenme eksiklerini belirleme 2. Öğrenme eksiklerine yol açmıĢ olması beklenebilecek güçlükleri belirleme 3. Öğrenciye eksik ve güçlükleri hakkında bilgi vererek onu, tamamlayıcı öğrenmelere sevk etme ÖĞRENMELERĠ ĠZLEME (Biçimlendirme-YetiĢtirme) 1. DeğiĢik alan ve yönlerdeki geliĢimi ve kiĢilik özelliklerini belirleme 2. Belirlenen geliĢim ve özelliklerin belli amaçlara elveriĢliliğini belirleme (öğrenciyi tanıma). 3. Öğrencinin en iyi geliĢerek mutlu olabileceği anları belirleme. TANIMA VE YERLEġTĠRME ÖĞRENMELER ÜZERĠNDEKĠ DEĞERLENDĠRME ÇALIġMALARI Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net ÖZET TABLO ÖLÇME-DEĞERLENDĠRMEDE TEMEL KAVRAMLAR – 1 Ölçme Nesneleri veya özellikleri gözlemleyerek, sonucu sayı veya sembollerle ifade etmektir. Temel Ölçme: Ölçülecek değiĢkenin değerleri doğrudan doğruya gözlenebilmesidir. Doğrudan Ölçme: Ölçme konusu olan özelliğin kendisinin bir araç yardımı ile ölçülmesidir. Ölçme Türleri Ölçme aracının özellikleri ile ölçülen özellik birbiri ile aynıdır. Dolaylı Ölçme: Ölçülecek olan özelliğin kendisinin, baĢka bir özellikten yararlanılarak ölçülmesidir. Ölçme aracının özellikleri ile ölçülen özellik birbirinden farklıdır. TüretilmiĢ Ölçme: Nitelik veya özellik, iki değiĢken arasındaki matematiksel bir iĢlem sonucunda elde edilebiliyorsa, bu tür ölçme iĢlemlerine türetilmiĢ ölçme denir. Ölçüm Ölçme iĢlemi sonucunda elde edilen sayı veya semboldür. Ölçme Kuralı Ölçme iĢlemi yapılırken, nitelik veya özelliğin hangi miktarına ne değer verileceğinin belirlenmesidir. Ölçek Belirli bir niteliği veya özelliği ölçmek amacıyla, belli birimlerle bölümlenmiĢ ölçme araçladır. Sınıflama (Adlandırma) Ölçekleri: Bir özelliğin, var olma veya yok olma durumuna göre gruplandırılması veya adlandırılmasıdır. Sıralama Ölçekleri: Bir özelliğin, varlık veya yokluk miktarına göre büyükten küçüğe veya Ölçek Türleri küçükten büyüğe doğru dizilmesidir. EĢit Aralıklı Ölçekler: BaĢlangıç noktasının göreceli (tanımlanmıĢ) olduğu, ölçek üzerindeki aralıkların birbirine eĢit olduğu ölçeklerdir. EĢit Oranlı Ölçekler: BaĢlangıç noktasının mutlak (doğal) olduğu, sıfır noktasının “yokluğu, hiçliği” ifade ettiği ölçeklerdir. Ölçülmek istenen bir özellik veya niteliğin tamamının miktarı belirlenirken, onun daha küçük bir Birim miktarının (biriminin) katları cinsinden ifade edilir. ĠĢte bu bütünün, standart kabul edilen küçük parçasına birim denir. Doğal Birim: Bir nitelik veya özelliğin ne kadardaki miktarına 1 birim denileceğinin bilim adamları ya da uzmanlar tarafından tanımlanmadığı, kendiliğinden belli olduğu birimlerdir. DeğiĢkenin her Birim Türleri bir parçası kendiliğinden 1 birim olarak kabul edilir. TanımlanmıĢ Birim: Bir nitelik veya özelliğin ne kadardaki miktarına 1 birim denileceğinin bilim adamları veya uzmanlar tarafından tanımlandığı, birimin kendiliğinden belli olmadığı birimlerdir. DeğiĢkenin ne kadar miktarına 1 birim denileceği, bilim adamları veya uzmanlar tarafından tanımlanmıĢ ve belirlenmiĢtir. Mutlak Sıfır Bir özellik veya niteliğin, gerçek anlamda yokluğunu ifade eden sıfırdır. Sıfır göreceli değil mutlaktır. Sıfır öncesinde baĢka bir değer yoktur. Tanımlan- BaĢlangıç noktasının uzmanlar veya bilim adamları tarafından belirlendiği ve bu noktaya sıfır mıĢ Sıfır noktası denilerek ölçme iĢlemlerinin yapıldığı sıfır noktasıdır. Ölçüt Ölçme iĢlemi sonucu hakkında yargıda bulunup, karar verebilmek için, ölçme iĢlemi sonucunda (Kriter) elde edilen verinin karĢılaĢtırılıp kıyaslandığı değerdir. Ölçüt Türleri Mutlak Ölçüt: Ölçme değerlendirme iĢlemine baĢlamadan önce ölçüt belirlenmiĢ ise bu tür ölçütlere mutlak ölçüt denir. Bağıl Ölçüt: Ölçüt, ölçme iĢlemi sonucunda elde edilecek verilerin ortalamalarına göre belirleniyorsa, bir baĢka deyiĢle ölçüt, ölçme iĢleminden sonra belirleniyorsa bu tür ölçütlere bağıl ölçüt denir. Değer- Ölçme iĢlemi sonucunda elde edilen sayı veya sembollerin bir ölçütle karĢılaĢtırılıp kıyaslanarak, lendirme bir yargıda bulunma ve karar verme sürecidir. 14 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net ÖZET TABLO ÖLÇME-DEĞERLENDĠRMEDE TEMEL KAVRAMLAR – 2 DEĞERLENDĠRME TÜRLERĠ Kulanılan Ölçüte Göre Değerlendirme Türleri Mutlak Değerlendirme: Ölçütün önceden belli ve kesin olduğu değerlendirmelerdir. Okullarda yapılan değerlendirmelerin hepsi mutlak değerlendirmedir. Çünkü; değerlendirmede kullanılan ölçütler önceden yönetmeliklerle belirlenmiĢtir. Bağıl Değerlendirme: Ölçütün, ölçme iĢlemi sonucunda grubun baĢarısına göre belirlendiği değerlendirmelerdir. Bireyin baĢarısı, grubun baĢarısına bağlıdır. Değerlendirme, ölçme sonucunda elde edilecek verilerin birbiriyle iliĢkilendirilmesiyle elde edilecek ölçütlerle yapılır. Tanıma YerleĢtirme: Eğitim-öğretim sürecinin baĢında, bir kurs, okul, dershaneye baĢlangıçta veya bir konu ya da ünitenin baĢlangıcında, öğrenme konularının gerektirdiği ön öğrenmelerin varolma derecesini belirlemek amacıyla yapılan değerlendirmelerdir. Biçimlendirme-YetiĢtirme (Öğrenmeleri Ġzleme): Öğrencilerin belli bir konu veya ünitedeki öğrenme eksikliklerinin belirlenerek, bu eksikliklerin giderilmesinin Öğretimin Değerlendirilmesi: Eğitim programlarında belirlenen hedeflere ulaĢma düzeyini belirleyerek, bu hedeflere ulaĢmak için düzenlenen eğitim öğretim etkinliklerinin ne derecede uygun olduğunu değerlendirmeye dönük çalıĢmaları içerir. amaçlandığı değerlendirmelerdir. Değer Biçme-BaĢarıyı Belirleme (Öğrenme Düzeylerini Belirleme): Eğitimöğretim etkinliklerinin, programın hedeflerine ulaĢma düzeyinin ve öğrencilerin baĢarılarının belirlenmesi amacıyla yapılan değerlendirmelerdir. Öğretim Programının Değerlendirmesi: Öğretim programlarının değerlendirilmesi amacıyla yapılan ölçmelerle, programa alınan davranıĢların öğrenci düzeyine uygun olup olmadığı, ulaĢılabilirliği, hedef ve davranıĢların tutarlılığı ve de davranıĢlar arasındaki örüntünün uygunluğu sınanır. Bu yolla elde edilen bilgilerle programın sağlamlığı denetlenebildiği gibi, elde edilen bilgilerle programa dönüt sağlanarak gerekli düzeltme çalıĢmaları da yapılabilir. Eğitim Sisteminin Değerlendirilmesi - Uluslararası Düzeydeki Durum Belirleme Sınavları (PISA, TIMMS, PIRLS): Uluslararası ölçme-değerlendirmeler yapan bir kuruluĢ tarafından gerçekleĢtirilen TIMSS fen ve matematik alanında, dört yılda bir yinelenen uluslararası bir düzey belirleme sınavıdır. Uluslararası Eğitim BaĢarılarını Belirleme KuruluĢu‟nun Uluslararası Okuma Becerilerinde GeliĢim Projesi (PIRLS), 35 ülkede ilköğretim 4. sınıf öğrencileri arasında yaptığı “Okuma Becerileri AraĢtırması”dır. En kapsamlı uluslararası değerlendirme projesi olan PISA, OECD ülkelerindeki 15 yaĢ grubu öğrencilerinin zorunlu eğitimin sonunda yeterince yaĢama hazırlanıp hazırlanmadıklarını, matematik, fen ve okur-yazarlık düzeylerini ve problem çözme becerilerini ölçmeyi hedeflemektedir. Yöneltme (Rehberlik) Amacıyla Yapılan Değerlendirme: Öğrencilerin ilgi ve yeteneklerinin belirlenerek, ilerideki eğitim veya mesleki geliĢim alanlarına yöneltilmesi amacıyla yapılan değerlendirme türüdür. 15 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net GeçmiĢ yıllarda bu konuyla ilgili sorulan bazı KPSS soruları (KPSS - 2002) AĢağıdakilerden hangisi bir ölçme iĢlemidir? A) Bir yazılı yoklamadaki cevaplar için puanlama anahtarının hazırlanması B) Sözlü yoklamada bir öğrencinin verdiği cevapların doğruluk derecesinin bir puanla belirtilmesi C) Sınıfın bir sınavdaki baĢarı ortalamasının bulunması D) Öğrencinin bir dersten baĢarılı sayılıp sayılmayacağına karar verilmesi E) Bir sınavda baĢarılı sayılabilmek için gerekli olan en küçük puanın belirlenmesi Yanıt: B seçeneğindeki ifade, bir özelliğin uygun bir araçla eĢleĢtirilerek sonucun sayı veya sembolle ifade edilmesini, yani ölçmenin tanımını göstermektedir. Yanıt B’dir. (KPSS - 2003) I. ĠĢ deneyimi sekiz yılın üstünde olanlar iĢe alınmıĢtır. II. Ahmet, güreĢten önce tartılmıĢ, 130 kg gelmiĢtir. III. Canan ortalamanın üstünde puan alarak sınıfını geçmiĢtir. IV. Pelin‟in LES puanı 68‟dir. Yukarıdakilerin hangilerinde “değerlendirme” iĢlemi yapılmıĢtır? A) I ve II B) I ve III C) II ve III D) II ve IV E) III ve IV Yanıt: II ve IV öncüller, sadece ölçme iĢlemidir. “Sınıfı geçmiĢtir” ve “iĢe alınmıĢtır” ifadeleri bir karar ifadesi olduğundan değerlendirmedir. Yanıt B’dir. (KPSS - 2005) Öğrencinin notunu belirlemede sınıf ortalamasını ölçüt alan bir öğretmen, ne tür bir değerlendirme yapmaktadır? A) Tanımaya yönelik B) Biçimlendirici C) Düzey belirleyici D) Mutlak E) Bağıl Yanıt: Sınıf ortalamasının ölçüt alınması bağıl değerlendirmeye bir örnek oluĢturur. Çünkü ortalama, sınıftaki diğer bireyler tarafından belirlenir. Yanıt E’dir. (KPSS - 2003) AĢağıdakilerden hangisi “mutlak değerlendirme” ye bir örnektir? A) Bir iĢletmeye, sınavda en yüksek baĢarıyı gösteren beĢ kiĢiyi almak B) Ortalamanın bir standart sapma üstünde puan alanları baĢarılı kabul etmek C) Yüksek lisans programında en baĢarılı üç kiĢiyi doktora programına almak D) Sınıftaki baĢarı sıralamasında en geride kalan on kiĢiyi yetiĢtirme kursuna almak E) Sınavda 65 ya da üstünde puan alanları baĢarılı kabul etmek Yanıt: E seçeneğinde yer alan ifadede ölçüt, gruptaki bireyler yerine programın hedeflerine dayalı olduğundan mutlak değerlendirilmedir. Yanıt E’dir. (KPSS - 2006) ĠĢbirliğine dayalı bir öğrenme uygulamasında gruplar öğrencilerin soyadlarının baĢ harfleri kullanılarak oluĢturulmuĢtur. Bu uygulamadaki gruplara ayırma, bir ölçme iĢlemi olarak kabul edilirse kullanılan ölçek türü aĢağıdakilerden hangisidir? A) Sıralama B) EĢit oranlı C) Sınıflama D) Dereceleme E) EĢit aralıklı Yanıt: Gruplara ayırmada öğrencilerin soyadları kullanıldığından bir büyüklük ifadesi yoktur. Yani öğrencinin soyadı diğerinden daha büyük vs. olamayacağından, burada yapılması gereken sınıflama iĢlemidir. Yanıt C’dir. 16 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net (KPSS – 2007) AĢağıdaki örneklerden hangisinde sözü edilen ölçme iĢlemine bağıl (keyfi, itibari) sıfır söz konusu değildir? A) Ankara ile Çankaya ilçesinin deniz seviyesinden yüksekliği 870 metredir. B) Öğrencilerin felsefe dersine karĢı tutum puanları ortalaması 207‟dir. C) Tarih sorularından en az dört tanesine doğru cevap vermeyenler sıfır puan almıĢtır. D) Bugün hava sıcaklığı 15˚C‟dir. E) Bu kitabın ilk dört sayfasında kitabın kapsamı tanıtılmaktadır. Yanıt: A,B,C,D seçeneğinde belirtilen ifadeler, birileri tarafından tanımlanmıĢ, bağıl bir sıfıra örnek iken, E seçeneğindeki bir kitabın sayfa sayısındaki sıfır ise gerçek (mutlak) sıfır örneğidir. Çünkü “0” sayfa kitap gerçekten de hiçbir sayfanın bulunmadığını gösterir. Yanıt E’dir. . (KPSS - 2008) AĢağıdakilerden hangisi ölçülürken dolaylı ölçme yapılır? A) Park yerlerindeki araçların sayısı B) Bilgisayar masasının yüksekliği C) Bir sepet elmanın kütlesi D) Öğrencilerin dört iĢlem becerileri E) Koridorun uzunluğu Yanıt seçeneğidir. Yanıt: D Uzunluk, kütle ve saymalar, doğrudan ölçme, biliĢsel özellikler ise dolaylı ölçme ile ölçülebilir. Yanıt D’dir. (KPSS - 2008) Değerlendirme, ölçme sonuçlarının bir ölçütle karĢılaĢtırılarak bir yargıya varılması iĢidir. AĢağıdakilerden hangisi “mutlak ölçüt”ün kullanıldığı değerlendirmeye örnektir? A) Bilgi yarıĢmasında en az puanla elenen kiĢi olma B) Yüksek atlamada en iyi dereceyi yapma C) Sınıfta baĢarı açısından ilk yüzde yirmilik grupta olma D) 100 sorudan 50 sini doğru cevaplama E) Grup ortalamasının üzerinde performans gösterme Yanıt: D seçeneğinde ölçüt önceden belirlenmiĢtir. Diğerlerinde ise ölçüt, ölçme iĢlemi bittikten sonra ortaya çıkacaktır. Ölçütün önceden belli olduğu D seçeneği doğru seçenektir. Yanıt D’dir. (KPSS - 2009) Arif Öğretmen, öğretim yılının baĢında, öğrencilerinin matematik dersine karĢı tutumlarının nasıl olduğunu belirlemek ve elde edilen sonuçlardan hareketle öğretim uygulamalarına yön vermek istemektedir. Bu amaçla 10 maddeden oluĢan bir tutum ölçeğini öğrencilerine uygulamıĢ ve onların matematik dersine karĢı tutumlarını ölçmüĢtür. Arif Öğretmen bu uygulamasında hangi ölçme ve değerlendirme türlerini kullanmaktadır? A) B) C) D) E) Ölçme Dolaylı Doğrudan TüretilmiĢ Dolaylı Doğrudan Değerlendirme Tanılayıcı Biçimlendirici Tanılayıcı Düzey belirleyici Düzey belirleyici Yanıt: Ġli, tutum, yetenek, baĢarı gibi alanları ölçmek amacıyla kullanılan testler, “dolaylı ölçme” kapsamında ele alınır. Öğretmenin, öğrencilerin matematik dersine karĢı tutumunu belirlemedeki amacı ise, öğrencileri tanıyabilmektir. Bu durum ise “tanılayıcı (tanımaya dönük) değerlendirme” olarak adlandırılır. Yanıt A’dır. 17 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net (KPSS - 2009) AĢağıdaki değerlendirme süreçlerinin hangisinde bağıl ölçüt kullanılmıĢtır? A) B) C) D) E) Mezun olmak için diploma notunun 4 üzerinden en az 2 olması Ortalamanın 10 puan üzerinde alanların sınıfı geçmesi Askere ağırlığı 150 kg‟nin altındaki erkeklerin alınması Soruların % 80‟ini doğru cevaplayanların bilgi yarıĢması elemelerine katılması Yüksek lisansa girebilmek için yabancı dil sınavından en az 70 puan alınması Yanıt: Ölçütün ölçme iĢlemi sonucunda elde edilen verilerin belli bir ağırlık noktasının alınması sonucunda elde edilmesi, “bağıl ölçüt” kavramı ile ifade edilir. Dolayısıyla ölçütün, ölçme iĢlemi yapıldıktan sonra elde edilecek verilere göre belirlenmesi gerekir. B seçeneğinde “Ortalamanın 10 puan üzerinde alanları sınıfı geçmesi” ölçütünde, ölçüt ancak sınav uygulandıktan sonra elde edilecek puanların aritmetik ortalaması belli olduktan sonra belirlenebilir. Dolayısıyla yanıt B’dir. (KPSS - 2010) Bir öğretim programına öğrenci seçmek için mülakat yapılacaktır. Bu mülakata bir genel yetenek testinden 50 ve daha üstü standart T puanı alanlar baĢvurabilecektir. Yetenek testinden elde edilen puanlar normal dağılım göstermektedir. Bu ön koĢul iĢlemiyle ilgili olarak, I. Bağıl ölçüt kullanılmıĢtır. II. Adayların % 50‟si ön koĢulu sağlamaktadır. III. Soruların en az yarısnı doğru cevaplayanlar ön koĢulu sağlamaktadır. ifadelerinden hangileri doğrudur? A) Yalnız I B) I ve II C) I ve III D) II ve III E) I, II ve III Yanıt: Normal dağılım gösteren yetenek testindeki 50 T puanı 0 Z puanına eĢittir. Bu da dağılımın tam orta noktasıdır. Katılımcıların yarısı bu noktanın sağında, diğer yarısı da solunda toplanır. Yani burada yapılan sınıfın yarısının baĢarılı sayılmasıdır. Bu nedenle bağıl ölçüt kullanılmıĢtır. Puanlamayla ilgili net bir bilgi verilmemiĢtir. I. ve II. Ġfadeler doğru olduğundan Yanıt B’dir. (KPSS - 2011) Bir Kuzey Avrupa ülkesinde hemĢirelik lisans programı mezunlarının çalıĢmaya baĢlayabilmeleri için yeterli düzeyde bilgi ve beceri sahibi olduklarını çoktan seçmeli bir testle göstermeleri gerekmektedir. Bu testte adayların baĢarılı sayılmaları için doğru cevaplamaları gereken soru sayıları meslek standartları doğrultusunda belirlenir ve yeterlik düzeyi için bir kesme puanı oluĢturulur. Testten baĢarılı olan adaylar, çalıĢmaya baĢlamak için gerekli olan sertifikalarını almaya hak kazanırlar. Yapılan değerlendirmenin amacına ve ölçütüne göre türü aĢağıdakilerin hangisinde doğru olarak verilmiĢtir? Amacına göre Ölçütüne göre A) Biçimlendirme ve yetiĢtirme Mutlak B) Tanıma ve yerleĢtirme Bağıl C) Değer biçme Bağıl D) Tanıma ve yerleĢtirme Mutlak E) Değer biçme Mutlak Yanıt: Soruda, lisansını tamamlayan mezunların çalıĢabilmek için sertifika alabilmaları gerektiği, yani bir bitirme sınavına tabi tutuldukları görülmektedir. Bir eğitim programı uygulandıktan sonra öğrenci yeterliğini belirlemek amacıyla yapılan değerlendirmeye “Değer biçmeye dönük değerlendirme” denir. Değer biçme iĢleminde önceden bir “kesme puanı” yani ölçüt belirlenmiĢtir. Ölçütün ölçme iĢlemi sonuçlarına bağlı olmaksızın önceden belirlenmesi, ölçütün “mutlak” olduğu anlamına gelir. Yanıt E’dir. 18 2. Bölüm. ÖLÇME ARAÇLARINDA BULUNMASI GEREKEN ÖZELLĠKLER ÖLÇME ARAÇLARINDA BULUNMASI Ölçme aracı gerçeğe yakın, tutarlı ve kararlı so- GEREKEN ÖZELLĠKLER nuçlar verdiğinde, ölçme aracının güvenilir olduğu söylenebilir. Ölçme araçlarında (ölçeklerde) bulunması gereGüvenirlik ken üç temel özellik vardır. Bu özellikler, ölçme aracının amacına hizmet etmesini, gerçeğe uygun ölçümler yapmasını, ölçme iĢleminin istenilen yeter- Duyarlılık-Tutarlılık-Kararlılık likte ve rahatlıkla gerçekleĢtirilmesini sağlayan özel- (Hatalardan arınıklık) liklerdir. Ölçme Araçlarında Bulunması Gereken Özellikler Sabit Hata: Doğrudan geçerliği etkiler. Rastlantısal Hata: Öncelikle güvenirliği, dolaylı Güvenirlik Geçerlik olarak geçerliği etkiler. KullanıĢlılık Sistematik Hata: Doğrudan geçerliği etkiler. GÜVENĠRLĠK Puanlama Güvenirliği: Ölçülen puanların gerçek puanlara yakınlığını, puanlara karıĢan hata Ölçme değerlendirme iĢlemlerindeki en önemli so- miktarının az veya fazla olmasını ifade eder. run, ölçümlerimizin gerçeği ne derecede yansıttı- Puanlama Objektifliği: Puanlamaya, puanlama ğıdır. Ölçümlere hata karıĢmıĢ olması, hatanın mik- yapan kiĢinin kiĢisel düĢünce ve görüĢlerinin tarı, ölçme değerlendirme iĢleminin güvenirliği ile karıĢmasıdır. doğrudan ilgilidir. Ölçme iĢlemine karıĢan hata miktarı arttıkça ölçmenin güvenirliği düĢerken, hata miktarı azaldıkça Puanlamada Güvenirliği Sağlama Yolları ölçme iĢleminin güvenirliği yükselir. Ölçme aracının belirli aralıklarla aynı kiĢi Eğitimde de öğretmenlerimiz ölçme yaparken te- tarafından tekrar puanlanarak aritmetik mel amacı, hatasız ölçme sonuçları elde etmektir. ortalamasının alınması. Güvenirlik en genel tanımıyla; ölçme sonuçları- Ölçme aracının, puanlayan kiĢiden baĢka nın tesadüfi hatalardan arınıklık derecesidir. birkaç uzman tarafından da puanlanarak aritmetik Teorik anlamda güvenirlik ise; ölçme iĢlemi so- ortalamasının alınması. nucunda elde edilen sonuç ile gerçek sonuç arasındaki korelasyonun karesine eĢittir. 2 Güvenirlik = r tx Güvenirlik, ölçme aracının tutarlılığı, duyarlılığı ve kararlılığı ile ilgilidir. Bir baĢka deyiĢle ölçme aracının, birden fazla ölçme iĢleminde aynı, benzer, birbirine yakın sonuçlar ortaya koymasıdır. Yani, ölçme aracının gerçeği yansıtma derecesidir. 19 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Güvenirlik Katsayısı: ÖLÇMEDE HATA VE HATA TÜRLERĠ Güvenirlik teorik tanımıyla; gerçek puanlar ile göz- Ölçmede Hata: Gerçek değer ile ölçme iĢlemi so- lenen puanlar arasındaki korelasyon olarak ifade nucunda elde edilen değer arasındaki fark, ölçmede edilir. Güvenirlik katsayısı, 0 ile 1 arasında değer hata olarak tanımlanır. Her ölçme iĢlemine bir miktar alır. Katsayı 1‟e yaklaĢtıkça güvenirliğin yüksek ol- hata karıĢabilir. duğunu, 0‟a yaklaĢtıkça düĢük olduğunu ifade eder. Dolayısıyla her ölçme iĢleminde bir hata payı var- 2 Güvenirlik = r tx dır. Ölçme iĢlemlerinde, kullanılan birimin yarısı kadar miktar, ölçmede hata payı olarak kabul edilir. Örnek: Ali‟nin boyunun uzunluğunu 1 cm. lik bi- 2 t rimlere ayrılmıĢ bir metreyle ölçerken, buradaki hata 2 r tx = 2 x payı, 1 cm.‟nin yarısı kadardır. Yani 0,5 cm. dir. Ölçme iĢleminde meydana gelecek hatalar, farklı nedenlerle farklı durumlardan kaynaklanabilir. Ölç- 2 r tx = Gerçek puan ile gözlenen puan arasındaki mede hatanın kaynakları arasında Ģunlar sıralana- korelasyonun karesi, güvenirlik katsayısı. bilir: 1. 2 t = Gerçek puan varyansı. 2 x Ölçülen özelliklerin niteliğinden kaynaklanan hatalar. 2. Ölçme aracından kaynaklanan hatalar. 3. Ölçme iĢlemi yapan kiĢiden kaynaklanan hatalar. = Gözlenen puan varyansı. 4. Ortamdan kaynaklanan hatalar. Ölçmede Hata Türleri: Sabit Hatalar Hata miktarının ölçümden ölçüme değiĢmediği, her ölçme iĢleminde aynı miktarda hatanın meydana geldiği hata türüdür. Ölçmenin geçerliği ile ilgilidir. Örnek: - Terazinin ölçtüğü her Ģeyi 50 gram eksik tartması. - Öğretmenin, okuduğu her sınav kağıdına 5 puan fazla vermesi. Hata miktarının, ölçümden ölçüme belli bir oranda az veya fazla olduğu, daha çok ölçme iĢlemini Hatalar Sistematik yapanın subjektifliğinden kaynaklanan hata türüdür. Ölçmenin öncelikle geçerliği ile ilgilidir. Örnek: - Terazinin 1 kg.‟ı 100 gr., 2 kg.‟ı 200 gr., 3 kg.‟ı 300 gr. Eksik ölçmesi. - Öğretmenin 50 puan alan öğrenciye 5, 60 puan alan öğrenciye 10, 70 puan alan öğrenciye 15 puan fazla vermesi. - Öğretmenin erkek öğrencilere, kız öğrencilerden 15 puan daha fazla puan vermesi. - Öğretmenin, sınav kağıdında yazıları güzel olan öğrencilere 5 er puan fazla vermesi. Hatalar (Random) Rastlantısal Hata miktarının ölçmeden ölçmeye, kuralsız ve tamamen rastlantısal bir Ģekilde değiĢtiği, hatanın kaynağının bilinmediği hata türüdür. Ölçme iĢleminin güvenirliği ile ilgilidir. Örnek: - Terazinin, her ölçme iĢleminde farklı miktarlarda hata vermesi. - Öğrencinin sınav günü rahatsız olması, kopya çekmesi, Ģans baĢarısı, sınav salonunun çok sıcak olması… 20 GÜVENĠRLĠK KESTĠRME YÖNTEMLERĠ 1. Testi Yarılama Yöntemi: Aynı davranıĢları ölçmek amacıyla hazırlanan iki paralel test birleĢtirile- Güvenirliğin kestirilmesinde kullanılan yöntemler, rek tek formmuĢ gibi uygulanır. Tek form olarak ölçme aracının uygulanıĢ biçimi, puanlamada kulla- uygulanmasına karĢın uygulanan test aslında iki nılan yöntemler ve ölçülen değiĢkenin boyut sayısı paralel testten oluĢur. Ġki paralel formdaki sorular tek gibi özelliklere göre farklılıklar gösterir. formda birleĢtirilirken ilk testteki sorular tek numa- Güvenirliğin belirlenmesinde kullanılan baĢlıca ralarla, ikinci testteki sorular çift numaralarla sırala- yöntemler Ģunlardır: nabileceği gibi, sorular konulara göre de dağıtılabilir. Test uygulandıktan sonra paralel testler tekrar GÜVENİRLİK KESTİRME YÖNTEMLERİ eski haline, yani iki paralel form haline getirilerek değerlendirme yapılır. Öğrencilerin iki paralel testten aldıkları puanlar arasındaki korelasyon katsayısı DıĢ Tutarlılık Kestirme Yöntemleri hesaplanarak testlerin güvenirlik katsayısı olarak Ġç Tutarlılık Kestirme Yöntemleri alınır. Elde edilen güvenirlik katsayısı, her iki testin de güvenirlik katsayısını ifade eder ve r11 simgesiyle götserilir. Yapılan iĢlemin, testlerin iç tutarlılığını Test-Tekrar Test (Tek Form) Paralel Testler (Alternatif Form) Testi Yarılama Kuder Richardson (KR 20-21) Cronbach Alpha ( ) ortaya koyması nedeniyle elde edilen katsayıya iç tutarlılık katsayısı denir. Elde edilen katsayı her iki alt formun katsayısını DıĢ tutarlılık kestirme yöntemleri: verdiği için her iki test bütününün güvenirlik katsayısını vermez. Testin bütününün güvenirlik katsayı- 1. Test – Tekrar Test (Tek Form) Yöntemi: Bir sını elde etmek için Sperman Brown formülü ku- testin, aynı gruba belirli aralıklarla tekrar uygulana- llanılır. Testin bütününün güvenirlik katsayısı rx sim- rak iki ölçüm arasındaki korelasyonun belirlenmesi gesiyle gösterilir. ve testin güvenirliğinin kestiril mesi yöntemidir. Her iki yarıdan elde edilen katsayılarla testin gü- Testin tutarlılığını ortaya koyduğundan ortaya çıkan venirliği aĢağıdaki formülle hesaplanır. sonuç, tutarlılık veya kararlılık katsayısı olarak da ifade edilir. Ġki farklı Ģekilde uygulanabilir. Aynı test 2r 11 rx = 1 r11 formunun, belli bir aralıkla aynı öğrenci grubuna uygulanmasını ifade eder. Ġki ölçüm arasındaki korelasyonun test formunun güvenirliğini ortaya koyar. r11 = Alt testlere ait güvenirlik katsayıları. rx 2. Alternatif Form (Paralel Testler) Yöntemi: = Testin bütününe ait güvenirlik katsayısı. Tek form yönteminden farklı olarak, ikinci uygulamada, ilk uygulamadaki teste paralel yeni bir test Örnek: Testi yarılama yönteminin uygulandığı bir formuyla ikinci bir uygulama yapılır. Hazırlanan ikin- testten elde edilen güvenirlik katsayısı 0,85 tir. Bu ci (paralel) test, birinci testte ölçülmek istenen dav- durumda testin bütününün güvenirlik katsayısı kaç- ranıĢları ölçecek nitelikle ancak, farklı sorulardan tır? oluĢur. Ġki test uygulaması arasındaki korelasyonun Çözüm: Verilen güvenirlik katsayısı iki paralel tes- yüksek olması, güvenirliğin kestirilmesiyle birlikte, iki te ait güvenirlik katsayısı olduğundan testin bütünü- testin eĢdeğer olduğunu da ortaya koyar. Bu nede- nün güvenirlik katsayısını ifade etmez. Bu nedenle nle, bu yöntemle elde edilen güvenirlik katsayısı Sperman Brown formülü kullanılarak test bütününün eĢdeğerlik katsayısı olarak adlandırılır. güvenirlik katsayısı hesaplanmalıdır. Ġç tutarlılık kestirme yöntemleri: rx = Ġç tutarlılık, testteki soruların birbiriyle uyumunu, anlamlı bir bütün olup olmadığını ortaya koyar. 21 2.(0,85) = 0.92 1 0,85 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net 2. Kuder-Richardson (KR20 ve KR21) Güvenirlik GÜVENĠRLĠK KATSAYISINI ĠSTENĠLEN Katsayısı: Bir kerede uygulanan ölçme aracının iç SEVĠYEYE YÜKSELTME tutarlılığını hesaplamada kullanılan bir yöntemdir. KR20 Güvenirlik Katsayısının hesaplanabilmesi için Bir testin güvenirlik katsayısı yeterli görülmezse, puanlamada her bir soru maddesinin güçlük dere- soru sayısı arttırılarak güvenirlik sayısı arttırılabilir. cesinin hesaplanmıĢ olması ve puanlamada doğru Ölçüm sonuçları ortada olan bir teste kaç soru ek- cevapların 1, yanlıĢ cevap ve boĢ bırakılan soruların lendiğinde güvenirliğin ne kadar artacağı ise Sper- ise 0 ile (hiç puan verilmeden) hesaplanmıĢ olması man Brown 23 formülü ile hesaplanabilir. gerekir. Eğer, madde istatistikleri belli olan bir test için tutarlılık katsayısı hesaplanacaksa KR20, ham puan- n.r 1 (n 1)r Sperman Brown 23 ( rn ) = lardan hareketle iç tutarlılık katsayısı hesaplanacaksa KR21 formüllerinden yararlanılır. K KR 20 K 1 k j 1 rn : yeni testin güvenirlik katsayısı. p1 p n : Yeni testin madde sayısının, eski testin madde S2x sayısına oranı. r : Ġlk testin güvenirlik katsayısı. KR 21) K K 1 X K X 1 Örnek: KS2X Güvenirlik katsayısı 0,60 olan bir testin madde sayısı iki katına çıkarıldığında, yeni testin güvenirlik katsayısı kaç olur? K: Madde Sayısı Pi: i maddesinin güçlük indeksi Çözüm: S2: test puanlarının varyansı r = 0,60 n=2 3. Cronbach Alpha ( ) Güvenirlik Katsayısı: Dereceleme veya ağırlıklı puanlama yöntemiyle pu- Sperman Brown 23 ( rn ) = anlama iĢlemi yapılan değerlendirmelerde kullanılan bir iç tutarlılık katsayısı belirleme yöntemidir. Genellikle ilgi, tutum ve psikomotor becerilerin ( rn ) = ölçülmesinde kullanılan ve 0‟ dan 4‟e, 1‟den 5‟e kadar gibi dereceli (rubric) ölçeklerin kullanıldığı ölçme n.r 1 (n 1)r 2.0,60 1 (2 1)0,60 ( rn ) = 0,75 araçlarından elde edilen puanlara ait güvenirlik katsayısının hesaplanılmasında kullanılır. Örnek: Güvenirlik katsayısı 0,60 olan bir testin güvenirlik kat sayısını 0,75‟e çıkarabilmek için soru sayısı ne kadar arttırılmalıdır? K = K-1 1- Σ Sj2 Çözüm: S.x2 rn ( 1 – r ) n= : Testin güvenirlik katsayısı. K : Puan sayısı (n) Σ Sj: Madde puanlarına ait varyans. n= r . ( 1 – rn ) 0,75 (1 – 0,60) 0,60 . (1 – 0,75) Sx : Standart sapma. n=2 22 ÖLÇMEDE STANDART HATA (Se) Çözüm: Se: ? Her ölçme iĢlemine belli bir miktarda hata karıĢa- Sx : 4 bileceği daha önce belirtilmiĢti. Her ölçme iĢlemine r x : 0;91 belirli bir miktarda hata karıĢtığına göre, gözlenen miktar ile gerçek arasındaki fark ölçme iĢlemindeki Se = 4 1– 0,91 hata miktarını ortaya koymaktadır. Dolayısıyla göz- Se = 1,2 lenen ölçüm, aĢağıdaki Ģekilde formüle edilebilir. Örnek: X=T-E AĢağıdaki testlerin hangilerinde standart hata en düĢük ve yüksektir? X : Gözlenen ölçüm T : Gerçek durum TEST rx 1 0,50 Yani; gözlenen ölçüm, gerçek ile hata miktarının 2 0,20 toplamı sonucunda elde edilen miktarı ifade etmek- 3 0,60 tedir. 4 0,90 5 0,75 E : Hata miktarı Ölçmenin güvenirliği ile standart hatası ara- Çözüm: sında ters yönlü bir iliĢki vardır. Hata miktarı Hata miktarı, güvenirlikle ters orantılı olduğuna azaldıkça güvenirlik artarken, hata miktarı göre, en yüksek hata yapıldığında güvenirlik en arttıkça güvenirlik düĢer. Güvenirlik en yük- düĢük düzeydedir. Bu durumda güvenirliği en düĢük sek (r = 1.00) iken standart hata en düĢük olan 2. testte standart hata en yüksek seviyededir. En düĢük standart hata ise, güvenirliğin en yüksek (Se = 0) olur. olduğu 4. testtedir. Güvenirlik en düĢük (r = 0) iken ise standart hata en yüksektir. (Standart sapmaya eĢittir.) Güvenirliği Etkileyen Faktörler (Güvenirliği Artırma Yolları): Standart hata en yüksek olduğunda standart sapmaya eĢit olur. Standart sapma mitarı 1. Kopya çekme: Öğrencinin, yapılan sınavda büyüdükçe, ölçmenin standart hatasının da kopya çekerek elde ettiği puan, öğrencinin gerçek yüksek olması beklenir. Yani; standart hata bilgisinin miktarını göstermez. Elde edilen sonuç, ile standart sapma arasında doğrusal bir hatalı bir sonuçtur. iliĢki vardır. 2. Testin uzunluğu: Testte uygulanan soru sayısı arttıkça, testin güvenirliği de artar. Çünkü; soru sa- Bir ölçme iĢleminin standart hatasının bulunma- yısı arttıkça, birim küçülür. Birim küçüldükçe de hata sında aĢağıdaki formül kullanılır. payı azalır. Hata payı azaldığı için güvenirlik artar. 3. Süre-Zaman: Testin uygulanması sırasında Se = Sx 1 - rx verilen sürenin gereğinden uzun veya kısa olması, testin güvenirliğini düĢürür. Se: Standart hata. 4. ġans puanı: Öğrencinin, cevabını bilmediği S x: Test puanlarının standart sapması. r x : Testin güvenirliği. sorulara Ģans eseri doğru cevap verebileceği sınav Örnek: yanlıĢ v.b tipi sınavlar) güvenirlik düĢer. Bu nedenle Standart sapması 4, güvenirlik katsayısı 0,81 olan Ģans baĢarısını ortadan kaldıracak önlemler alınma- türlerinin uygulanmasında (çoktan seçmeli, doğru- lıdır. (Belli sayıda yanlıĢ cevabın, bir doğru cevabı ölçme iĢleminin standart hatası kaçtır? götürmesi gibi…) 23 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net 5. Uygulama koĢulları: Öğrencinin, katıldığı sı- 12. Test maddelerinin ayırıcılık gücü: Ayırt edi- navdaki uygulama koĢullarından dolayı soruları ve cilik gücü yüksek olan sorulardan oluĢan testin gü- yönergeleri anlayamaması güvenirliği düĢürür. Öğ- venirliği yüksek olur. rencinin sınav anında rahatsız veya yorgun olması, 13. Deneme grubunun yapısı: Bir ölçme aracı- okuma ve anlama becerilerinin yetersiz olması hata nın güvenirliğini kestirmek amacıyla seçilen deneme yapma olasılığını yükseltir. Bu da doğrudan güve- grubunun, ölçülen özellikler bakımından heterojen nirliği düĢürür. bir dağılım göstermesi gerekir. Heterojen gruplardan 7. Ortam: Sınavın uygulandığı ortamdaki ısı, ıĢık, elde edilen güvenirlik katsayıları, homojen gruplara havalandırma, gürültü gibi etkenler, sınav sonucun- oranla daha yüksektir. da elde edilen puanların güvenirliğini düĢürür. 14. Test Yönergesinin ve Testteki Maddelerin 8. Testin güçlük düzeyi (Ranjda daralma): Bir Ġfadesi: Testin baĢında yer alan yönergede; yanıt- sınavda kullanılacak sorular, o sınavı yanıtlayacak lama iĢleminin nasıl yapılacağı, nasıl puanlanacağı, bireylerin yaklaĢık yarısı tarafından doğru yanıtlan- Ģans baĢarası için düzeltme yapılıp yapılmayacağı, dırılabilecek güçlükte olmalıdır. Sınav sorularının testte kaç soru bulunduğu ve yanıtlanması için ne çok zor ya da çok kolay olması, sınavın güvenirliğini kadar zaman verildiği bilgileri yer almalıdır. düĢürücü rol oynar. Soruların çok zor olması, bir 15. Testi Alan Öğrenci ve Testin Uygulandığı yandan öğrencinin sınav kaygısını artırırken diğer Grup Ġle Ġlgili Etkenler: Testin güvenirliğini etkile- yandan da geliĢigüzel yanıt vermesine neden ola- yen etkenlerden biri de testi alan öğrencinin ölçülen bilir. Sınavın kolay olması ise herkes tarafından özellik bakımından her zaman aynı olmamasıdır. doğru yanıtlandırılmasına ve bu nedenle, ölçme Belli bir testi alan bir öğrencinin test puanının değiĢ- sonuçlarının bilen öğrenciler ile bilmeyen öğrencileri mesine neden olan bireysel etkenleri Ģunlardır: birbirinden ayırt edememesine neden olur. a) Bireyin Sürekli ve Genel Özellikleri: Hızlı okuya- 9. Test maddelerinin homojenliği: Uygulanan bilme ve okuduğunu anlayabilme, test yönerge- testteki maddeler (sorular) ne kadar birbirine yakın sini doğru anlama, problem çözme gücü, tutum veya benzer özellikleri ölçerse, güvenirlikte o kadar ve alıĢkanlıkları, kendine olan güveni, heyecan yüksek olur. ve kaygı durumu gibi özellikleri test puanını et- Örnek: 40 soru maddesinden oluĢan testte karıĢık kiler. bir Ģekilde Türkçe ve Sosyal Bilgiler konularından b) Bireyin Sürekli ve Özel Özellikleri: Testteki soru- soru sorulması güvenirliği düĢürür. Bu nedenle, öl- lara benzer soruları önceden çözmesi, testte yer çülecek farklı özellikler, farklı test formlarıyla ölçül- alan bazı maddelerdeki ifadelerin öğrenciyi rahatsız etmesi. melidir. 10. Puanlamada nesnellik: Bir testin güvenirli- c) Bireyin Geçici ve Genel Özellikleri: Sınav günü ğini, onun puanlamasının nesnel olup olmayıĢı bü- öğrencinin sinirli olması, güdülenmiĢlik durumu, yük ölçüde etkiler. Bir testin değiĢik kiĢilerce ya da önceden alıĢtırma yapmıĢ olma durumu, sınav aynı kiĢi tarafından değiĢik zamanlarda puanlanma- ortamındaki ısı, ıĢık ve havalandırma durumu. sından elde edilen puanlar arasındaki tutarlılığa o d) Bireyin Geçici ve Özel Özellikleri: Öğrencinin testin puanlama güvenirliği denir. bilmediği soruları tahminle bulma Ģansı, sınavda Her sınav nesnel yollarla puanlanabilmelidir. Eğer cesaretinin kırılması, uygulanan teste hazırlan- sınavlar nesnel puanlamaya uygun ise puanlamaya ma durumu gibi etkenler ölçme sonuçları üzerin- tesadüfî hataların dıĢında hata karıĢması beklene- de etkili olmaktadır. mez. Yapılan sınav nesnel puanlamaya uygun de- Sınava giren öğrencilerin her soruyu dikkatle ve ğilse, ölçmecinin öznel puanlama yapması kaçınıl- hızla yanıtlaması özendirilmelidir. Öğrencilerin yete- mazdır. rince güdülenmediği sınavlarda sorular geliĢigüzel 11. Soru sayısı: Soru sayısı arttıkça, ölçme iĢ- yanıtlanacağı için sınav puanlarının güvenirliği dü- lemindeki birim sayısı azalır ve ölçme daha duyarlı Ģer. Öğrencinin sınav kaygısı arttıkça ve heyecan- hale gelir. Ölçme aracının duyarlılığı, hata miktarını landıkça, doğru olarak bildiği soruları yanlıĢ yanıt- azaltacağından güvenirlik artar. landırmasına neden olabilir. 24 GEÇERLĠK 1. Kapsam Geçerliği: Bir ölçme aracının, ölçmek istediği özellikleri veya Ölçme araçlarında bulunması gereken bir diğer te- bir dersin hedef davranıĢlarını ne düzeyde kapsa- mel özellik de geçerliktir. dığını gösterir. Ölçme aracında bulunması gere- Geçerlik: Bir ölçme aracının, ölçmek istediği özel- ken en önemli geçerlik türüdür. likleri baĢka özelliklerle karıĢtırmadan ölçebilme dü- Örnek: Türkçe dersinden iĢlenen 12 konuda bu- zeyine geçerlik denir. Ölçülmek istenilen özellikleri lunan 44 hedef davranıĢı ölçmek amacıyla yapılan ölçerken elde edilen puanlara, baĢka özelliklerin pu- bir sınavda, sadece 8 konuyu kapsayan veya sade- anlarının da karıĢmıĢ olması, ölçme aracının kulla- ce 30 hedef davranıĢı ölçebilecek yeterlikte soru nılma amacına hizmet etmediğini de gösterir. Bu sorulması, test sorularının tüm konuları veya tüm nedenle geçerlik, ölçme aracının kullanılıĢ amacına hedef davranıĢları kapsamadığını gösterir. Böyle bir hizmet etme düzeyi olarak ta tanımlanabilir. +1 ile -1 ölçme aracı veya ölçme iĢleminin kapsam geçerliği arasında değer alır. düĢüktür. Örnek: Tarih sınavında öğretmenin yazısı güzel Kapsam geçerliğinin yüksek olması için ölçme olan öğrencilere 10‟ar puan daha fazla vermesi, bu iĢlemi yapılırken aĢağıdaki aĢamalı sıralama takip ölçme iĢleminin geçerliğiyle ilgilidir ve geçerliği dü- edilmelidir: Ģürür. Ölçülecek özelliklerin veya hedef davranıĢların Bir ölçme aracının geçerli olabilmesi için, ön- belirlenmesi. celikle güvenilir olması gerekir. Bir ölçme aracının Ölçme aracını oluĢturacak özelliklerin veya dav- geçerliğinden bahsedebilmek için ön koĢul güvenir- ranıĢların belirlenmesi. liktir. Güvenirlik olmadan geçerlik olmaz. Ancak, Ölçme aracını oluĢturan özelliklerin ya da dav- güvenilir olan bir ölçme aracı geçerli olmayabilir. ranıĢların, evreni (ölçülmek istenen özellikleri Örnek: Ali‟nin boyunun, 5 cm eksik bir metreyle 6 veya davranıĢları) temsil etme düzeyinin belir- kez ölçülmesi sonucunda, 6 ölçme iĢleminde de lenmesi. aynı sonuç elde edilir. Her ölçme iĢleminde aynı so- Ölçme aracındaki özelliklerin veya soruların, nuç elde edildiğinden, yapılan ölçme iĢleminde gü- ölçmeye uygunluğunun kontrol edilmesi. venirlik vardır. Ancak; bu ölçme aracının, amacına hizmet etmemesi nedeniyle geçerlik düĢüktür. 2. Yapı Geçerliği: Örnek: Matematik öğretmeninin uyguladığı sınav- Ölçme aracının veya ölçme iĢleminin, bir teorik ya- da yazısı güzel olan öğrencilere 5 puan fazla ver- pıyı ölçüp ölçmediğinin belirlenmesidir. Teorik yapı mesi, her ölçme iĢleminde aynı Ģeyi tekrarladığın- olarak kastedilen Ģey, yaratıcılık, zeka ve kiĢilik gibi, dan güvenilirdir. Ancak; ölçmeye, ölçülmek istenen bireyin doğasında var olan özelliklerdir. niteliklerin dıĢında özellikler karıĢtığı için geçerlik Teorik yapılar, soyut değiĢkenlerdir ve ölçülmeleri düĢüktür. zordur. Bu nedenle genellikle dolaylı olarak, gözlem yoluyla ölçülmeleri gerekir. GEÇERLĠK TÜRLERĠ Yapı geçerliğinde ortaya konulmak istenen Ģey; bir teorik yapıya yüksek düzeyde sahip olan grup ile Kapsam Geçerliği düĢük düzeyde sahip olan gruba aynı testlerin uygulanarak, bu testin grupları olması gerektiği Ģekilde Yapı Geçerliği ayırıp ayırmadığını belirlemektir. Yapı geçerliğini beGörünüĢ Geçerliği lirlemek amacıyla kullanılan teknikler “faktör çözümlemesi” olarak adlandırılır. Sonuçsal Geçerlik Örnek: Güzel Sanatlar Fakültesi Müzik Bölümüne girmek isteyen öğrencilere uygulanacak bir testin, Ölçüt Geçerliği müzik yeteneğine sahip olanları ayırıp ayıramayacaYordama Geçerliği ğını belirlemek amacıyla, test öncelikle bölümü ka- Uygunluk Geçerliği zanan öğrencilere uygulanır. Test puanlarının yük- 25 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net sek çıkması durumunda testin yapı geçerliğinin yük- elde edilen puanın gelecekte ne olacağını gösterme sek olduğu kabul edilerek seçme sınavlarında kulla- gücü önem taĢımaktadır. Testten elde edilen puan- nılabilir. Teste katılan öğrencilerden yeterlikleri olan- ların gelecekte baĢarılı olması bekleneni diğerlerin- lar sadece olumlu sonuç alabileceklerdir. den ayırma gücü önemlidir. Yetenek sınavı ile öğ- Yapı geçerliği, bazı kaynaklarda ise, bir testte yer renci alan resim-iĢ ve müzik bölümü öğrencilerinin alan her bir soru maddesinin, testin bütünü ile iliĢkili bölümlerindeki alan derslerinde de baĢarılı olmala- olması Ģeklinde açıklanmaktadır. Her bir soru mad- rının beklenmesidir. Bir zeka testinden alınan puana desi, testin ölçmeyi hedeflediği en az bir tanesi ile bakılarak öğrencinin matematik testinden de benzer iliĢkili olmalıdır. Testin bütününün amacından ba- puanlar alması beklenebilir. Bir lise öğrencisinin ğımsız bir madde olmamalıdır. ÖSS sınavlarına hazırlık yaptığı dershanedeki deneme testi sonuçlarına bakılarak ÖSS sınavında 3. GörünüĢ Geçerliği: kaç puan alabileceğinin kestirilmesi, bu sonuca göre Ölçme aracının, ölçülmek istenen özellikleri ne öğrencinin tercih yapması yordama geçerliği ile iliĢ- derecede ölçebilir göründüğünün belirlenmesidir. kilidir. Ölçme aracının bir üst düzeyde baĢarılı ola- Testteki soruların, herhangi bir iĢleme tabi tutulma- cak öğrencileri seçme özelliğinin incelenmesi yorda- dan, herhangi bir istatistiki iĢlem yapmadan, ölçmek ma geçerliği ile ilgilidir. istediği özelliği ölçüp ölmediğinin gözlenmesidir. b) Uygunluk (Uyum) geçerliği: Amaç bir ünitede 4. Sonuçsal Geçerlik: veya dersin bir bölümünde gerçekleĢen öğrenmeleri Yapılandırmacı felsefenin, öğrenme-öğretme sü- ölçmekse, ölçme aracı ile elde edilen ölçüler ile üni- reçleri üzerindeki etkisine bağlı olarak ortaya çıkmıĢ tede veya dersteki öğrenme düzeyini gösteren baĢ- yeni bir kavramdır. Sonuçsal geçerlik, değerlendir- ka ölçüler varsa bunlar arasındaki iliĢki (korelasyon) menin öğrenme üzerindeki etkisine dayanır. Eğer hesaplanabilir. Bu iliĢki yüksekse testin diğer ölçü- aktif öğrenme sürecinde kullanılan alternatif değer- lerde yansıyan öğrenme düzeyini ölçme açısından lendirme yaklaĢımları, öğrencilerin öğrenmeleri üze- geçerliğinin, iliĢkinin büyüklüğü ölçüsünde yüksek rinde beklenen etkiyi sağlıyorsa, uygulanan yakla- olduğu düĢünülür. Uyum geçerliğinin bulunmasında Ģım veya yaklaĢımların geçerliğinden söz edilebilir. en pratik yol olarak belirlenen ünite ile ilgili uzman- Daha çok, değerlendirme iĢleminin geçerliğini sor- ların hazırladığı test ile öğretmenin hazırladığı test gular. bir grup öğrenci üzerinde uygulanır. Örneğin; Tarih dersindeki baĢarıyı ölçmek için uzmanlarca hazır- 5. Ölçüt Geçerliği: lanmıĢ bir test ile öğretmenin kendi hazırladığı testin Geçerliğin belirlenmesinde, geçerli olduğu bilinen kısa bir zaman aralığı içersinde arka arkaya aynı bir baĢka test ya da puanlar ölçüt olarak kullanıl- sınıfta uygulanmıĢ ve sınav sonuçları arasında po- maktadır. Ölçüt geçerliği, geçerliği kanıtlanacak olan zitif bir korelasyonun olduğunu saptamıĢtır. Uyum testin puanlarıyla ölçüt olarak alınacak puanların geçerliğinde ölçme sonuçları üzerinde yapılan analiz benzerliğidir. iĢlemlerinde her iki aracın aynı kapsamı ne düzeyde Geçerli olduğu kabul edilen bir ölçme aracıyla, ölçebildiğine (öğrenmenin ölçüsüne) bakılır. geçerliği araĢtırılan bir ölçme aracının aynı gruba uygulanarak elde edilen korelasyon ölçüt geçerliği Geçerliği Etkileyen Faktörler (Geçerliği Artırma olarak tanımlanır. Bir baĢka ifadeyle; ölçülmek iste- Yolları): nen nitelikler için, ölçüt kabul edilebilecek baĢka bir 1. Güvenirlik: Güvenirlik, geçerliğin ön koĢuludur. Güvenirliği etkileyen bütün faktörler geçerliği de doğrudan etkiler. 2. Ölçme araçlarından kaynaklanan hatalar: Ölçme iĢleminde uygulanacak testin türü ve niteliği (çoktan seçmeli test, yazılı yoklama, sözlü yoklama gibi.) sonucu doğrudan etkileyebilir. değiĢkenden faydalanarak ölçmeye konu olan değiĢken üzerindeki sonucun tahmin edilmesidir. Ġki tür ölçüt geçerliği vardır. a) Yordama geçerliği: Yordama; eldeki sayısal verilerden yola çıkarak geleceğe yönelik tahminde bulunma iĢlemidir. Seçme amaçlı testlerde, testten 26 3. Ġstenmeyen değiĢkenlerin ölçümlere karıĢ- Hazırlayıcı ve uygulayıcıların nitelikleri: Ölçme ması: Ölçülmek istenen özelliklere baĢka özelliklerin araçlarının bazıları, hazırlayıcıda ve uygulayıcıda karıĢması ölçme iĢlemindeki hata oranını yükselte- bazı özel bilgi ve beceriler bulunmasını gerektirir. Bu ceğinden ölçmenin geçerliğini düĢürür. bilgi ve becerilere sahip olmayan kiĢilerin hazırla- 4. Uygulamadan kaynaklanan hatalar: Ölçme dıkları araçlardan, uyguladıkları sınavlardan çoğu iĢleminin uygulanmasında ortaya çıkan hatalar da zaman hatalı sonuçlar elde edilir. ölçümlerin geçerliğini düĢürür. Yanıtlayıcıların nitelikleri: Öğrenciler yanıtlama Örnek: Ölçme araçlarının farklı formlar hazırlan- yönergesini kolayca anlayabilir ve yanıtlarını kolay- madan, tüm öğrencilere aynı formların dağıtılması. ca kaydedebilirlerse, o araç kullanıĢlıdır. Soruların sınav ortamında yazdırılması vb. Uygulama kolaylıkları: Testlerde sayfa düzeni, 5. Soru belirsizliği: Soruların açık seçik, net, her- yanıt kağıdının düzeni, yazılı yoklamalarda soruların kes tarafından aynı Ģekilde anlaĢılabilir olması, ölç- yazılı verilmesi, vb. gibi konular uygulama kolaylık- me iĢleminin geçerliğini yükseltir. Örnek; Soruda ya- ları sağlar; bu yollarla da araçların kullanıĢlılığı artı- zım yanlıĢlığı, bilinmeyen, yeni sözcükler kullanılma- rılabilir. sı, gereksiz kelimelerin bulunması vb. Puanlama kolaylıkları: Testlerde yanıt kağıdının 6. Aynı soruların kullanımı: Soruların hiç değiĢ- testten ayrılması, yanıt kağıdının iyi düzenlenmesi, tirilmeden, aynı Ģekilde her yıl tekrar sorulması, o yanıtların makineyle puanlanabilmesi, diğer ölçme soruların öğrenciler tarafından edinilmesi, testin araçlarında ve yöntemlerde puanlama anahtarı gibi amacına hizmet etmesini engeller ve geçerliği dü- yardımcı araçların kullanılması puanlama kolaylıkla- Ģürür. rı sağlar. 7. Puanlama yanlılıkları: Özellikle sözlü ve yazılı Puanları yorumlama kolaylıkları: Bir ölçme ara- sınavlarda, puanlayıcının öğrenci özelliklerine göre cı yorumlamaya yardımcı, yorumlamayı kolaylaĢtırı- puanlama yapması, sistematik hatalara neden olur cı ve yorumda hatayı azaltıcı araçlarla ya da ölçüt- ki, bu da geçerliğin düĢmesine neden olur. Bu ne- lerle desteklenmesi kullanıĢlılığını artırır. denle iyi bir sınav planı ve cevap anahtarı hazırlanmalıdır. KULLANIġLILIK Bir ölçme aracının hazırlanması, uygulanması, puanlanması ve değerlendirilmesinin kolay ve ekonomik olması demektir. Ölçme araçlarının kullanıĢlılığında Ģu noktalar önem taĢımaktadır. Ekonomi: Ölçme araçlarının maliyeti ekonomik olmalıdır. Hazırlanan bir araç bir özelliği bir defa ölçebiliyorsa ekonomik değildir. Benzer özellikleri birden fazla ölçen bir ölçme aracı kullanıĢlıdır. Hazırlama süresi: Bir ölçme aracını hazırlama süresi o aracın puanlama süresi ile birlikte ele alınmalıdır. Uygulama süresi: Bir yöntemin kullanıĢlılığı, verdiği puanın önemine oranla, uygulamada gerektirdiği zaman azaldıkça artar. Öğrencilerin sahip olduğu bilgilerin en kısa zamanda açığa çıkartan ölçme aracının kullanıĢlı olduğu söylenebilir. 27 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net ÖĞRETMENDEN ÖNERĠLER Hepsi: Eğer bir hata sonucunda diğer öğrencilerin veya ölçme sonuçlarının “hepsi” etkileniyorsa Ölçme araçlarında bulunması gereken özelliklerle hata türü sabit veya sistematiktir. Sabit ise, herkes ilgili her yıl soru sorulur. Çok kolay bir konu olmasına aynı Ģekilde (miktarda) etkilenmiĢtir, sistematik ise rağmen bu sorular sık sık yanlıĢ yapılmaktadır. Bu ya oranlılık vardır, ya da yanlılık. Bu da ölçme soruların yanlıĢ yanıtlanmasının temelinde, geçerlik iĢleminin doğrudan geçerliğini etkiler. ve güvenirlik kavramlarının tam anlaĢılamaması, hata Bazı: Eğer bir hata sonucunda sadece “bazı” öğ- türleri ile geçerlik ve güvenirlik arasındaki iliĢkinin renciler veya öğrenciler ya da “bazı” ölçme sonuç- tam olarak kurulamaması yatmaktadır. ları etkileniyorsa, burada bir “tesadüfi”lik vardır. Ve Öncelikle Ģunu çok iyi bilmek gerekir. Güvenir- tesadüfi hatalar öncelikle “güvenirliği” etkiler. liği etkileyen her Ģey, geçerliği de etkiler. Ayrıca; bazı durumlar vardır ki, belli durumlar- Bir örnek de hata türeri için verelim: da güvenirliği etkilerken, belli durumlarda doğ- Mahallenizde üç ayrı bakkal var. Ve siz bu üç ayrı rudan geçerliği etkiler. bakkaldan aĢağıdaki alıĢveriĢleri yapıyorsunuz. Her Bu durumu daha iyi anlayabilmek için aĢağıdaki üç bakkaldan da aynı Ģeyleri alıyorsunuz. Eve gelip örnekler biraz daha açıklayıcı olacaktır. kendi doğru tartan tartınızla tartıyorsunuz. Bakkal Örnek: Bakkal Bakkal Temel Veli ÖkkeĢ I. Durum: Bir KPSS Kursunda, Ocak ayında bir 1 Kg Bulgur 0,900 Kg 0,900 Kg 0,900 Kg deneme sınavı yapılıyor. Gündüz olmasına karĢın 2 Kg Şeker 1,900 Kg 1,800 Kg 2,150 Kg hava kapalı. Sınav sırasında elektrikler kesiliyor. 3 Kg Yağ 2,900 Kg 2,700 Kg 3,000 Kg Bazı öğrenciler testteki soruları okumakta zor- 4 Kg Un 3,900 Kg 3,600 Kg 3,950 Kg landıkları için, bildikleri bazı soruları yanlıĢ yapı- Sorularımız Ģunlar: yorlar. 1. Her üç bakkalın yaptıkları hata türleri nelerdir? Bu durumda ortaya çıkan hata türü nedir? 2. Her üç bakkalın yaptığı hatalar, ölçmenin han- Bu hata testin hangi özelliğini olumsuz yönde gi özelliklerini etkiler? etkiler? Yanıt I. Bazı öğrenciler ıĢık faktöründen etkilenerek Yanıtlar: Yanıt II. Elektriklerin kesilmesi tüm öğrencileri etkilemiĢtir. Sınav iptal olmuĢtur. 28 -100 1,800 Kg -200 2,150 Kg +150 2,900 Kg -100 2,700 Kg -300 3,000 Kg 0 3,900 Kg -100 3,600 Kg -400 3,950 Kg -0,50 Sistematik Tesadüfi Güvenirlik de anahtar kelimeler “Hepsi” ve “Bazı” kelimeleridir. 1,900 Kg Geçerlik çerliği mi yoksa güvenirliği mi etkilediğini belirleme- -100 Sabit Hata türlerinin belirlenmesinde ve bir hatanın ge- 0,900 Kg Geçerlik liği” kalmamıĢtır. -100 Hata Türü “sabit”tir ve sınav iptal olduğuğu için bir “geçer- 0,900 Kg Etkilenen Özellik Hata Şekli Dolayısıyla; hata tüm öğrencileri etkilediği için Fark etkiler? -100 Ölçülen miktar artıyor, hata miktarı belli belirsiz değişiyor. Tesadüfilik var. Bu hata testin hangi özelliğini olumsuz yönde Bakkal Ökkeş Bu durumda ortaya çıkan hata türü nedir? Fark Sınav yarıda kalıyor ve iptal ediliyor. 0,900 Kg Ölçülen miktar arttıkça hata miktarı oranlı olarak artıyor. Oranlılık var. pılıyor. Gece, karanlık. Birden elektrikler kesiliyor. Bakkal Veli 1 Kg Bulgur 2 Kg Şeker 3 Kg Yağ 4 Kg Un II. Durum: Aynı sınav, akĢam gruplarında da ya- Fark fi”dir. Ve Tesadüfi hatalar “Güvenirliği” etkiler. Ölçülen miktar artıyor, hata miktarı değişmiyor. Sabitlik var. rencileri etkilememiĢtir. Yani hata türü “tesadü- Bakkal Temel bazı soruları yanlıĢ yapmıĢtır. Bu durum tüm öğ- ÖZET TABLO ÖLÇME ARAÇLARINDA BULUNMASI GEREKEN ÖZELLĠKLER / 1 GÜVENĠRLĠK Güvenirlik Ölçme sonuçlarının tesadüfi hatalardan arınıklık derecesini ifade eder. DıĢ tutarlılık kestirme yöntemleri 1. Test – Tekrar Test (Tek Form) Yöntemi: Bir testin, aynı gruba belirli aralıklarla tekrar uygulanarak iki ölçüm arasındaki korelasyonun belirlenmesi ve testin güvenirliğinin kestiril mesi yöntemidir. 2. Alternatif Form (Paralel Testler) Yöntemi: Aynı hedefleri ölçen iki ayrı testin aynı gruba uygulanarak güvenirliğin belirlenmesidir. Güvenirlik Ġç tutarlılık kestirme yöntemleri Kestirme 1. Testi Yarılama Yöntemi: Aynı hedefleri ölçen iki testin tek form haline dönüĢtürülerek bir Yöntemleri kerede uygulandıktan sonra ayrıĢtırılarak (iki eĢ yarıya bölerek) testin iç tutarlılığının belirlenmesidir. 2. Kuder-Richardson (KR20 ve KR21) Güvenirlik Katsayısı: Bir kerede uygulanan ölçme aracının iç tutarlılığını hesaplamada kullanılan bir yöntemdir. 3. Cronbach Alpha ( ) Güvenirlik Katsayısı: Dereceleme veya ağırlıklı puanlama yöntemiyle puanlama iĢlemi yapılan değerlendirmelerde kullanılan bir iç tutarlılık katsayısı belirleme yöntemidir. Ölçmenin güvenirliği ile standart hatası arasında ters yönlü bir iliĢki vardır. Hata miktarı Standart Hata azaldıkça güvenirlik artarken, hata miktarı arttıkça güvenirlik düĢer. Güvenirlik en yüksek (r = 1.00) iken standart hata en düĢük (Se = 0) olur. Güvenirlik en düĢük (r = 0) iken ise standart hata en yüksektir. Puanlama Ölçülen puanların gerçek puanlara yakınlığını, puanlara karıĢan hata miktarının az veya Güvenirliği fazla olmasını ifade eder. Puanlama Objektifliği Puanlamaya, puanlama yapan kiĢinin kiĢisel düĢünce ve görüĢlerinin karıĢmasıdır. Gerçek değer ile ölçme iĢlemi sonucunda elde edilen değer arasındaki fark, ölçmede hata olarak tanımlanır. Her ölçme iĢlemine bir miktar hata karıĢabilir. Sabit Hata: Hata miktarının ölçümden ölçüme değiĢmediği, her ölçme iĢleminde aynı Ölçmede Hata miktarda hatanın meydana geldiği hata türüdür. ve Türleri Sistematik Hata: Hata miktarının, ölçümden ölçüme belli bir oranda az veya fazla olduğu, daha çok ölçme iĢlemini yapanın subjektifliğinden kaynaklanan hatalardır. Rastlantısal Hata: Hata miktarının ölçmeden ölçmeye, kuralsız ve tamamen rastlantısal bir Ģekilde değiĢtiği, hatanın kaynağının bilinmediği hata türüdür. Kopya çekme Puanlamada nesnellik Testin uzunluğu Soru sayısı Süre-Zaman Güvenirliği ġans puanı Etkileyen Uygulama koĢulları Faktörler Ortam Test maddelerinin ayırıcılık gücü Deneme grubunun yapısı Test Yönergesinin ve Testteki Maddelerin Ġfadesi Testin güçlük düzeyi (Ranjda Testi Alan Öğrenci ve Testin Uygulandığı daralma) Grup Ġle Ġlgili Etkenler Test maddelerinin homojenliği 29 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net ÖZET TABLO ÖLÇME ARAÇLARINDA BULUNMASI GEREKEN ÖZELLĠKLER / 2 GEÇERLĠK Geçerlik Ölçme aracının, amacına hizmet etme derecesini, ölçmek istediği özellikleri baĢka özelliklerle karıĢtırmadan ölçüp ölçmediğini ifade eder. Kapsam Geçerliği: Ölçme aracının, ölçmek istediği özellikleri ne düzeyde kapsadığını gösterir. En önemli geçerlik türüdür. Yapı Geçerliği: Ölçme aracının veya ölçme iĢleminin, bir teorik yapıyı ölçüp ölçmediğinin belirlenmesidir. Teorik yapı olarak kastedilen Ģey, yaratıcılık, zeka ve kiĢilik gibi, bireyin doğasında var olan özelliklerdir. GörünüĢ Geçerliği: Ölçme aracının, ölçülmek istenen özellikleri ne derecede ölçebilir göründüğünün belirlenmesidir. Testteki soruların, herhangi bir iĢleme tabi tutulmadan, herhangi Geçerlik bir istatistiki iĢlem yapmadan, ölçmek istediği özelliği ölçüp ölmediğinin gözlenmesidir. Türleri Sonuçsal Geçerlik:. Değerlendirmenin, öğrenme üzerindeki etkisine dayanır. Daha çok, değerlendirme iĢleminin geçerliğini sorgular. Ölçüt Geçerliği: Geçerliği kanıtlanacak olan testin puanlarıyla ölçüt olarak alınacak puanların benzerliğidir. a) Yordama geçerliği: Eldeki sayısal verilerden yola çıkarak geleceğe yönelik tahminde bulunma iĢlemidir. b) Uygunluk (Uyum) geçerliği: Yapılan bir ölçme iĢleminin ölçüt alınarak, önceki ölçmelerle uygunluğunun analiz edilmesidir. Geçerliği 1. Güvenirlik Etkileyen 2. Ölçme araçlarından kaynaklanan hatalar Faktörler 3. Ġstenmeyen değiĢkenlerin ölçümlere karıĢması (Geçerliği 4. Uygulamadan kaynaklanan hatalar Arttırma 5. Soru belirsizliği Yolları) 6. Aynı soruların kullanımı 7. Puanlama yanlılıkları ÖZET TABLO ÖLÇME ARAÇLARINDA BULUNMASI GEREKEN ÖZELLĠKLER / 3 KULLANIġLILIK Bir ölçme aracının hazırlanması, uygulanması, puanlanması ve değerlendirilmesinin kolay ve ekonomik olması demektir. Ölçme araçlarının kullanıĢlılığında Ģu noktalar önem taĢımaktadır. KullanıĢlılık Ekonomi Yanıtlayıcıların nitelikleri Hazırlama süresi Uygulama kolaylıkları Uygulama süresi Puanlama kolaylıkları Hazırlayıcı ve uygulayıcıların nitelikleri Puanları yorumlama kolaylıkları 30 GeçmiĢ yıllarda bu konuyla ilgili sorulan bazı KPSS soruları (KPSS - 2003) AĢağıdakilerden hangisi bir baĢarı testinden elde edilen puanların güvenirliğinin tanımı olabilir? A) Soruların, testin amacına hitmet etme derecesi B) Test puanlarıyla, öğrencinin gelecekteki baĢarısının yordanabilmesi C) Soruların konulara uygun Ģekilde dağıtılmıĢ olması D) Test puanlarının tesadüfi hatalardan arınık olma derecesi E) Soruları, sadece yoklanan davranıĢı öğrenmiĢ olanların cevaplayabilmesi Yanıt: Testin tesadüfi hatalardan arınıklığı, güvenirliğin tanımıdır. Yanıt D’dir. (KPSS - 2004) AĢağıdakilerden hangisi bir ölçme aracının yordama geçerliğini belirlemeye yönelik bir uygulamadır? A) Bir testi, ölçülmek istenen özelliğe sahip oluĢ dereceleri farklı iki gruba uygulama ve bu uygulama sonucunda elde edilen puanların gruplar arasındaki farkı yansıtıp yansıtmadığını belirleme. B) Aynı davranıĢları ölçtüğü düĢünülen iki ölçme aracını aynı gruba aynı koĢullarda uygulayıp bu uygulama sonucunda elde edilen puanlar arasındaki korelasyonu hesaplama C) Öğrencilerin belirli bir öğretim programı sonundaki baĢarıları ile bu öğretim programına seçme amacıyla kullanılan ölçme arasından elde ettikleri puanlar arasındaki korelasyonu hesaplama D) Bir grubun belirli bir testten elde ettiği puanlarla, geçerliği daha önceden belirlenmiĢ baĢka bir testten elde ettiği puanlar arasındaki korelasyonu hesaplama E) Bir ölçme aracından elde edilen aritmetik ortalama ile aynı amaçla hazırlanmıĢ farklı bir ölçme aracından elde edilen aritmetik ortalama arasında fark olup olmadığını belirleme. Yanıt: Öğretim programına öğrenci seçme amacıyla kullanılan bir ölçme aracından elde edilen puanlar ile bu program süresince elde edilen puanlar arasındaki iliĢki, bir yordama geçerliği çalıĢması örneğidir. Yanıt C’dir. (KPSS - 2006) Bir firmaya eleman almak amacıyla yapılan bir sınav için “oldukça geçerli bir sınav oldu” diyen bir uzman sınavın hangi özelliğini ifade etmektedir? A) Objektif olduğunu B) Kolay olduğunu C) ĠĢteki baĢarıyı yansıtacak yapıda olduğunu D) Zor olduğunu E) Adayların yeteneklerine uygun olduğunu Yanıt: Ölçme aracının ölçlmek stenen özellikleri ölçmesi; geçerlik olarak tanımlanır. Seçme sınavında geçerli olan bir test, iĢteki baĢarıyı yansıtacak yapıda olduğunu ifade eder. Yanıt C’dir. (KPSS - 2007) Pazarlama elemanları seçiminde kullanılmak üzere bir test geliĢtirilmiĢ ve iĢe alımlarda bu test uygulanmıĢtır. Daha sonra, iĢe alınan elemanların ilk aydaki baĢarılı satıĢ sayıları ile iĢe giriĢte aldıkları test puanları arasındaki uyum incelenmiĢtir. Yukarıda belirtilen inceleme, uygulanan testin hangi özelliği hakkında bilgi verir? A) Yordama geçerliği B) Kapsam geçerliği C) Yapı geçerliği D) Ġç tutarlılık E) Puanlayıcılar arası güvenirlik Yanıt: Gelecekteki bir durumu kestirmek amacıyla uygulanan testlerin, gelecekteki durumla karĢılaĢtırılarak, istenen amaca hizmet edip etmediğini belirlemek, yordama geçerliği olarak tanımlanır. Yanıt A’dır. (KPSS - 2008) Bir sınavda her öğrenciye 5 puan fazla verilmesi ……… hataya örnektir. Öğrencilerin puanlarını, aldıkları puanların yüzde 10‟u kadar artırmak ise ……….. hataya örnek olabilir. Bu parçadaki boĢluklara, aĢağıdakilerin hangisindeki sözcükler sırasıyla getirilmelidir? A) Rastgele – sabit B) Rastgele – sistematik C) Sabit – sistematik D) Sabit – rastgele E) Sistematik – sabit Yanıt: Her öğrenciye sabit miktarda (eĢit) ek puan verilmesi sabit hata, her öğrenciye puanıyla orantılı (% 10 gibi) ek puan verilmesi ise sistematik hataya örnektir. Yanıt C’dir. 31 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net (KPSS - 2009) Bir araĢtırmacı çoklu zekâ alanlarını ölçmek amacıyla geliĢtirdiği çok boyutlu testi, dil bilimi, matematik, resim, heykel, müzik, beden eğitimi, iletiĢim, psikoloji bölümlerindeki öğrencilere uygulamıĢtır. Uygulama sonucunda farklı bölümlerdeki öğrencilerin kendi alanıyla ilgili sorulardan yüksek, diğer alanlardaki sorulardan ise daha düĢük puan aldıklarını saptamıĢtır. Buna göre, ölçme aracı için aĢağıdakilerden hangisi söylenebilir? A) Amaca hizmet etme derecesi düĢüktür. B) Hata düzeyi düĢüktür. C) Geçerliği yüksektir. D) KullanıĢlılığı yüksektir. E) Güvenirliği düĢüktür. Yanıt: Bir ölçme aracının, ölçmek istediği teorik yapıyı (yetenek, ilgi, tutum vb.) ayırıp ayırmadığı, o testin “yapı geçerliği” ile ilgilidir. Sorudaki uygulama sonucunda, uygulanan testin bu özellikleri ayırabildiği ortaya konulmuĢtur. Dolayısıyla bu testin “geçerliğinin yüksek” olduğu sonucuna ulaĢılabilir. Yanıt C’dir. (KPSS - 2009) Öğretmenler genellikle söz dinleyen ve kurallara uygun davranan öğrencilere sempati duyarlar. Yapılan araĢtırmalar, öğretmenlerin tepkilerinin, öğrencilerin derslerdeki baĢarısızlıklarından çok, kurallara uymamalarına yönelik olduğunu ortaya koymaktadır. Öğrencilere bu konuda bir açıklama yapılmasa da onlar, kurallara uygun davrandıklarında bunun baĢarı olasılığını etkileyebileceğini, sınavda doğru yanıtlar vermeseler de iyi not alabileceklerini düĢünürler. Bu durumda, kurallara karĢı çıktıklarında cezalandırılabileceklerini ya da öğretmenleri tarafından dıĢlanabileceklerini öğrenirler. Kurallara uyan öğrencilere daha yüksek puan vererek gerçekleĢtirilen bu ölçmelerde aĢağıdakilerden hangisi yapılmıĢ olur? A) Rastlantısal hata B) Gözlem yetersizliği C) Sabit hata D) Mantık hatası E) Sistematik hata Yanıt: Soruda, ölçme iĢleminde öğrencilerin baĢarı puanlarına öğretmenlerin, öğrencilerin kurallara uyma davranıĢları ile ilgili görüĢleri karıĢmıĢ, puanlamada bir “yanlılık” oluĢmuĢtur. Yanlılık ise, “sistematik hata” ile ilgilidir. Yanıt E’dir. (KPSS - 2010) Osman Öğretmen‟in elinde her bir konu için güçlük ve ayırt edicilikleri belirlenmiĢ maddeler yer almaktadır. Osman Öğretmen uygulayacağı sınavda dört konudan beĢer madde kullanmayı planlamaktadır ancak ikinci konuyla ilgili elinde yeterli ayırıcılıkta madde olmadığını görür. Bunun üzerine ikinci konuya iliĢkin sorular yerine, üçüncü konu kazanımlarını ölçmek üzere yazılmıĢ ve yüksek ayırt edicilik sağlayan maddeleri kullanır. Osman Öğretmen’in bu kararı sınavın güvenirliğini ve geçerliğini nasıl etkilemiĢtir? A) Güvenirliği etkilememiĢ, geçerliği artırmıĢtır. B) Güvenirliği artırmıĢ, geçerliği etkilememiĢtir. C) Güvenirliği artırmıĢ, geçerliği azaltmıĢtır. D) Güvenirliği ve geçerliği azaltmıĢtır. E) Güvenirliği azaltmıĢ, geçerliği etkilememiĢtir. Yanıt: Öğretmenin 2. Konudan soru sormaması testin geçerliğini düĢürür. Ancak, ayırtediciliği düĢük soru sormak yerine yüksek soru sorulduğu için testin güvenirliği artar. Yanıt C’dir. (KPSS - 2011) BaĢarı testi geliĢtiren bir uzman, pilot uygulama için on öğrenciyi tek tek sınava almıĢtır. Bu uygulamada öğrencilerden maddeleri sesli olarak çözmelerini isteyen uzman, öğrencilerin maddeleri çözerken kullandıkları biliĢsel süreçleri açığa çıkarmayı amaçlamıĢtır. Uzmanın bu çalıĢması, geliĢtirilen testin en çok hangi özelliği hakkında bilgi sağlar? A) Ġç tutarlılığı B) Objektifl iği C) KullanıĢlılığı D) Yapı geçerliği E) Yordama geçerliği Yanıt: Uzman, öğrencilerin “soru çözerken kullandıkları biliĢsel süreçleri” açığa çıkarmayı amaçlamıĢ. Dolayısıyla; öğrencilerle ilgili teorik yapıyı (ilgi, tutum, yetenek, zeka vb. özellikler) ölçebilen testlerin “yapı geçerliği”nin yüksek olduğu söylenir. Yanıt D’dir. 32 3. Bölüm. EĞĠTĠMDE KULLANILAN ÖLÇME ARAÇLARI VE ÖZELLĠKLERĠ EĞĠTĠMDE DEĞERLENDĠRME YAKLAġIMLARI Klasik Yöntemler ÇağdaĢ Yöntemler Kriterler (ölçütler) önceden bellidir. Rekabetçi bir anlayıĢtadır. Kağıt – kalem testleri veya standart testler uygulanır. Üst düzey zihinel becerileri değerlendirmede yetersizdir. Testler sonunda geribildirim not olarak verilir. Ezberlemeye dayalıdır. Sonuç (ürün) odaklıdır. Öğretmen merkezli eğitimin mantığına dayalıdır. Değerlendirme de öğretmen merkezlidir. Öğrencinin düzeyi notla ifade edilir. Yargılayıcıdır. (summatif-özetleyici) Süreç odaklıdır. Değerlendirme sürecinde öğretmen de öğrenci de aktiftir. Öğrenme sürecindeki ürün veya performansı değerlendirmeye dayanır. Geribildirim, değerlendirme sürecinde öğrenciye ulaĢtırılır. Ölçüt, öğrencilerle birlikte değerlendirme sürecinde belirlenir Grubun baĢarısı öğrencinin baĢarısını da etkiler. Ölçme değerlendirme iĢleminin süreçte gerçekleĢtirilmesinin temel amacı, eksikliklerin süreçte belirlenerek giderilmesidir. Değerlendirmenin sürece dönük olması, öğrencinin öğrenme çabalarına olumlu yönde etki ettiğinden, sonuçsal geçerliği yüksektir. Rekabetçi anlayıĢtan uzak, iĢbirlikli öğrenmeye dayalıdır. Üst düzey zihinsel becerileri ölçmede yeterli yöntemler kullanılır. Geleneksel ölçme araçlarından çok dereceleme ölçekleri (rubric) kullanılır. Sonuç sayılarla değil, cümle veya metinlerle açıklanır. GeliĢtiricidir. (formatif) Psikometrik YaklaĢım Öğrencilerin, belli özelliklere sahip olma derecelerinin belirlenip sonucun sayılarla ifade edilmesi yaklaĢımıdır. Objektif bir yaklaĢımdır. Standart (yapılandırılmıĢ) testler kullanılır. Değerlendirme, biliĢsel alan becerilerinin ölçülmesi sonucunda yapılır. Sonuca (ürüne) odaklıdır. Üst düzey zihinsel becerilerin ölçülmesinde yetersizdir. Ġzlenimci YaklaĢım Öğrencilerin belli özelliklere sahip olma derecelerinin betimlenmesi ile yapılan değerlendirmelerdir. DavranıĢlar puanla değerlendirilmez. Ġyi, orta, kötü, yeterli, yetersiz gibi betimlemeler yapılır. Yarı yapılandırılmıĢ gözlem araçları kullanılır. (Gözleme dayalı, nitel ölçme araçları) Üst düzey zihinsel becerilerin (sentez, değerlendirme) değerlendirilmesinde kullanılır. Süreç odaklıdır. Değerlendirme subjektiftir. Eklektik (UzlaĢtırıcı) YaklaĢım ÖĞRENCĠ ÖZELLĠKLERĠNĠ DEĞERLENDĠRME YAKLAġIMLARI Üst düzey zihinsel becerilerin objektif olarak değerlendirilmesini sağlayan bir ölçme yaklaĢımıdır. Klasik ölçme yaklaĢımlarına alternatif olarak geliĢtirilmiĢtir. En yaygın uygulama tekniği, portfolyo uygulamasıdır. (Tümel değerlendirme) Öğrencilerin, öğrenme sürecinde gerçekleĢtirdiği etkinliklerin değerlendirildiği yaklaĢımdır. Ġzlenimci yaklaĢıma göre daha objektif, psikometrik yaklaĢıma göre daha subjektiftir. En büyük sınırlılığı, objektifliği sağlamanın zor olmasıdır. 33 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net BĠREY HAKKINDA BĠLGĠ TOPLAMA YOLLARI Testler: Bireylerin belli özelliklerini ölçmek amacıyla dü- Birey hakkında bilgi toplama yolları, testler ve test zenlenen, katılan herkes için aynı maddelerden olu- dıĢı teknikler olmak üzere iki baĢlık altında topla- Ģan ölçme araçlarıdır. nabilir. Testler Tipik DavranıĢ Testleri KiĢilik Testleri Ġlgi Ölçekleri Maksimum Yeterlik Testleri Tutum Ölçekleri BaĢarı Testleri Yetenek Testleri Özel Yetenek Testleri Genel Yetenek Testleri Standart Testler Öğretmen Yapımı Testler Test DıĢı Teknikler: Test Dışı Teknikler Gözlem Bireyin Kendi Hakkında Bilgi Vermesi SoruĢturma değiĢebilirlik derecesi bakımından ikiye ayrılır. Bu TESTLER testler ise yetenek testleri ve baĢarı testleridir. Test: Bireylerin belli özelliklerini ölçmek için düzenlenen ve onu alan herkes için aynı olan sorular 2.1. ya da iĢlerden oluĢan bir ölçme aracıdır. Yetenek Testleri: Zihinsel gücü ölçen testlerdir. Yetenek testleri de kendi içinde iki alt sınıfa ayrılabilir. Bunlar genel yetenek ve özel ye- TESTLERĠN SINIFLANDIRILMASI tenek testleridir. a) Ġçerik Bakımından: 2.1.1. Genel Yetenek Testleri: Bireyin kalıtsal gizil-güçleriyle çevresel etmenlerin etkileĢimi sonun- 1. Tipik DavranıĢ Testleri: KiĢinin günlük ya- da oluĢan ve kiĢinin yapmaya çalıĢtığı her iĢin baĢa- Ģamında gösterdiği olağan ya da tipik davranıĢın bir rılmasında aynı derecede kendini ortaya koyan zihin göstergesi elde edilmek istenilir. Bu tür testlerde gücünü ölçmek için hazırlanmıĢ testlerdir. Bu tür amaç, kiĢinin belli bir durumda nasıl davrandığını testlerde ise sözel yeteneği, sayı iliĢkilerini ve prob- ortaya çıkarmaktadır. Tutum ölçekleri, ilgi ölçekleri lem çözme gücünü ve Ģekiller arası iliĢkileri görme ve kiĢilik ölçekleri bu gruba girerler. Bu tür testlerde gücünü ölçen sorular yer alır. tek bir doğru yanıt anahtarı yoktur. 2.1.2. Özel Yetenek Testleri: Bireyin sınırlı ve 2. Maksimum Yeterlik Testleri: Bir kiĢinin bir dar bir alanda sahip olduğu zihin gücünü ölçen test- iĢi belli bir durumda ne denli iyi ya da doğru yapa- lerdir. Müzik yeteneği, sekreterlik yeteneği testleri bildiği belirlenmeye çalıĢılır. Maksimum yeterlik test- gibi. leri kendi içinde ölçülen özelliğin çevresel etkilerle 34 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net 2.2. BaĢarı Testleri: Bireyin bir eğitim süreci testler, bir öğretim döneminin baĢında, ortasında ya içinde ya da çevre koĢulları altında ne kadar öğren- da sonunda uygulanabilir. diğini ölçen testlerdir. Bu testler, bireylerin ileride ne 2.2.1. Standart Testler: Belli bir forma sokul- kadar öğrenebileceğini değil, ne kadar öğrendiğini muĢ, geçerliği ve güvenirliği yüksek testlerdir. ortaya çıkarmak için kullanılır. Öğretmenlerin dersle- 2.2.2. Öğretmen Yapımı Testler: Öğretmenler rinde uyguladığı testler, baĢarı testleridir. Bu tür tarafından hazırlanan testlerdir. Öğretmen Yapımı Testler ile Uzman Yapımı (Standart) Testlerin KarĢılaĢtırılması: Öğretmen Yapımı Testler Uzman Yapımı (Standart) Testler Bir sınıftaki ya da okuldaki öğretim sonuçlarını ölçmek Testin kapsamına giren öğretmenin belirlediği konuların hedef davranıĢları oluĢturur. Ülke ya da belli bir bölgedeki öğretim etkililiğini ölçmek Ders Programındaki konuların analiz edilmesiyle belirlenen konuların kritik davranıĢları oluĢturur. Soru tipi Soruların hazırlayıcısı Karma soru tekniği Öğretmen ya da okuldaki öğretmenler grubu Çoktan seçmeli soru tekniği Madde analizi StandartlaĢtırma ve normlar Genellikle hiç yapılmaz Form sayısı Bir tanedir Testin dıĢında yardımcı materyal Genellikle açıklama ve puanlama anahtarı vardır. Madde analizi yapılır Geçerlik ve güvenirlik açısından standartlar aranır Ġki ya da daha çok paralel (eĢdeğer) takım hazırlanır Testin uygulanması, puanlanması için gerekli yönerge ile birlikte hazırlanmıĢ bir el kitabı vardır. Boyutlar Testin Amacı Testin Ġçeriği StandartlaĢmaya gidilmez Soruların hazırlandığı alanın uzmanları Eğitimde sıkça kullanılan ölçme araçları sözlü Bu tür testlerde ürün gözlenebilir, süreç yani dav- testler, yazılı testler, kısa yanıtlı testler, doğru-yan- ranıĢın ortaya çıkması gözlenemez. Sınıfta öğret- lıĢ, eĢleĢtirmeli, çoktan seçmeli testlerdir. Öğrencile- menlerce kullanılan yazılı sınavlar bu gruba girer. rin ölçülecek olan davranıĢ düzeyleri, ölçülecek olan Ayrıca ÖSS, OKS, LGS sınavlarında kullanılan test- konu kapsamı, ölçmenin amacı, öğrenci sayısı, ola- ler de bu grupta yer alır. naklar gibi etmenler, bu araçlardan hangilerinin kullanılacağını belirlemede rol oynar. c) Zamanın Uzunluğu Bakımından: 1. Hız Testleri: Kolay maddelerden oluĢur. Bi- b) KiĢi sayısı bakımından: reylerin kendilerine verilen süre içinde yanıtlayabil1. Bireysel Testler: Bir uygulayıcı tarafından dikleri kadar soruyu çözmeleri istenir. Hız testlerine bir defada yalnız bir kiĢiye uygulanabilen testlerdir. örnek olarak genel ya da özel yetenek testleri gös- Örneğin, kiĢinin okuma, konuĢma ve Ģarkı söyleme- terilebilir. deki durumunu belirlemek için bireysel test yapmak 2. Güç testleri: TanımlanmıĢ bilgi ve beceri zorunludur. Bireysel testlerde ürünle birlikte süreç bakımından kiĢilerin baĢarı düzeyini ölçmeye yöne- de gözlenebilir. liktir. Güç testlerinde, zaman sınırlaması yoktur. Güç 2. Grup Testleri: Bir uygulayıcı tarafından bir testinde bir yanıtlayıcının aldığı puan, onun çalıĢma defada birçok kiĢiye uygulanabilir. Bu tür testler, da- hızına bağlı olmaksızın kaç maddeyi doğru yanıtlan- ha çok okuduğunu anlama gücüne dayanır. Ge- dırabildiğine bağlıdır. Genellikle baĢarı testleri, güç nellikle kağıt-kalem testleri bu grupta yer alır. Uygu- testi olurlar. lanması ve puanlanması oldukça kolay ve ucuzdur. 35 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net SINAVLAR 4. Ölçülmek istenen davranıĢı ölçebilecek nitelikte birden fazla sorudan bir soru bankası Sınavlar öğrenci davranıĢlarının gözlenip nicelen- oluĢturularak, bu sorular diğer sınavlarda so- dirilmesi amacıyla hazırlanmıĢ ölçme durumları ola- rulmalıdır. Böylece aynı sorunun birden fazla rak tanımlanabilir. Eğitimde sınav yapma zorunlulu- sınavda sorulması önlenmelidir. ğu, aslında ölçme zorunluluğundan doğar. Sınavlar, 5. eğitimdeki kararlar için veri toplamak amacıyla ka- Bir soru maddesiyle birden fazla bilgi yoklanmamalıdır. sıtlı olarak hazırlanmıĢ ölçme durumlarıdır. Sınav- 6. Puanlamanın objektifliği sağlanmalıdır. larla eğitim sistemi arasında sıkı bir iliĢki vardır. Bu 7. Sorularda, cevap olabilecek veya cevabı a- iliĢkinin eğitim sisteminin yapısına ve uygulanan çıkça çağrıĢtıracak ipuçları bulunmamalıdır. programların hedeflerine uygun olması beklenir. Sı- 8. Soru sayısı, ölçmenin amacına uygun miktar- navların zamanları, süreleri, kapsamları, uygulama da, öğrenme ünitelerini kapsayacak sayıda yöntemleri ve sonuçlarının kullanılıĢ biçimleri eğitim olmalıdır. Sınavda mümkün olduğunca fazla felsefesince ve müfredat programlarının hedeflerin- soru sorulmaya çalıĢılmalıdır. ce belirlenir. 9. Sorular, öğrencilerin öğrenme düzeyleri hakkında bilgi verecek nitelikte olmalıdır. Sınavlara Soru Hazırlanmasında Genel Ġlkeler: 10. Sınavın süresi ne gereğinden fazla, ne de yetiĢtirilemeyecek kadar az olmamalıdır. 1. Kullanılacak ölçme aracı, ölçülmek istenen 11. Soru hazırlanırken öğrencilerin öğrenme dü- davranıĢları ölçebilecek nitelikleri taĢımalıdır. 2. zeyleri dikkate alınmalıdır. Sınav öncesinde mutlaka bir sınav planı 12. Sınav, bilen öğrencilerle bilmeyen öğrencileri hazırlanmalıdır. 3. ayırt edici nitelikte olmalıdır. Sorular açık seçik, net ve herkes tarafından 13. Soruların yazımındaki dil basit ve anlaĢılır ol- aynı anlaĢılır nitelikte olmalıdır. malıdır. SINAV TÜRLERĠ VE ÖZELLĠKLERĠ SINAV TÜRLERİ Sözlü Sınavlar Yazılı Sınavlar Kısa Cevaplı Testler Eşleştirmeli Testler SÖZLÜ SINAVLAR Doğru-Yanlış Testleri Çoktan Seçmeli Testler Performans Testleri a) Özellikleri: 1. Yanıtlar sözlüdür, Öğrenci baĢarılarının bileĢenlerinden biri de sözel 2. Sınav bireyseldir, iletiĢim becerisi ise, sözlü sınavların kullanılması ka- 3. Soru sayısı azdır, çınılmazdır. Sözlü sınavlar, soruların ve yanıtların 4. Her öğrenciye farklı sorular olacağından ağır- sözlü olarak verildiği sınavlar olarak tanımlanmak- lıkları eĢit olmayabilir, tadır. Öğrencinin güzel konuĢma, kelimeleri düzgün 5. Yanıtlama iyice düĢünülmeden yapılır, ifade edebilme becerileri ancak sözlü sınavlarla öl- 6. Puanlaması genel izlenime göre yapılır, çülebilir. Bazen, laboratuar gibi uygulama gerektiren 7. bireysel özellikler yanıtlama davranıĢını etkiler, derslerde sözlü sınavların kullanılması uygun ola- 8. Puanlamaya öğrencinin konuĢması, giyimi gibi nedenler karıĢabilir. bilir. 36 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net b) Soru Yazımında Dikkat Edilecek Noktalar: a) Uzun Yanıtlı Maddelerin Özellikleri: 1. AnlaĢılır ve açık yazılmalıdır, 1. Yanıtlar yanıtlayıcı tarafından düĢünülüp yazıl- 2. Sorular sınavdan önce hazırlanmalıdır, mak durumundadır, 3. Puanlama anahtarı önceden hazırlanmalıdır, 2. Soru ve yanıtlar yazılıdır, 4. Yanıtlama anında uyulması gereken davranıĢ- 3. Yanıtlama zamanı uzundur, lar önceden bildirilmelidir. 4. Yanıtlayıcı istediği yanıtı verebilir (yoruma açık), 5. Kısmi puanlama verilebilir, YAZILI SINAVLAR 6. Puanlaması daha çok özneldir, (ESSEY, KOMPOZĠSYON TĠPĠ YAZILILAR) 7. Puanlaması güç ve uzun zaman alır, 8. Ġleri düzey davranıĢlarının ölçülmesine uygun- Yazılı olarak verilen birkaç sorunun yine yazılı dur, olarak yanıtlandırılması istenilen sınavlara yazılı 9. ġans baĢarısı yoktur. yoklamalar adı verilmektedir. Yazılı yoklamalar hem soruların hem de yanıtların yazılı olarak verildiği ve b) Uzun Yanıtlı Madde Yazımında Dikkat Edile- soru sayısının çok fazla olmadığı görülmektedir. cek Noktalar: Yanıtlar yazılı olarak verildiğinden yanıtlayıcı istediği 1. AnlaĢılır olmalıdır. yanıtı verebilir; yanıtlar yoruma açıktır. Ayrıca puan- 2. Yanıtlar sınırlandırılmalıdır, lamasının uzun zaman alması ve güç olması önemli 3. Uzun yanıtlı ve az soru yerine kısa yanıtlı ve puanlama hatasına neden olur ve puanlayıcıya tak- çok soru sorulmalıdır, dir hakkı bırakır. Bunlar, yazılı yoklamaların istenil- 4. Kitaptan olduğu gibi yazılmamalıdır, meyen özellikleridir. 5. Sorular birbirinden bağımsız yanıtlandırılma- Yazılı sınavlar; sınav sorularını hazırlamak için lıdır, zaman az olduğunda, dil ve imla bilgileri ölçülmek 6. Olanak olursa denenmelidir. istendiğinde, öğrencilerin uygulama, sentez ve değerlendirme becerileri ölçülmek istendiğinde, öğren- c) Yazılı Yoklamanın Puanlaması: ci sayısı az olduğu durumlarda kullanılabilir. 1. Genel izlenimle puanlama; öğretmen bir kâğı- Bununla birlikte, yazılı yoklamalar ile daha ileri dü- dın tüm sorularına verilen yanıtları okur ve sınav zeydeki ve köklü davranıĢların ölçülmesi önemli bir kâğıdına toplam bir puan verir. avantajdır. Yazılı yoklamalar belirtilen özellikleri ne- 2. Sınıflama yoluyla puanlama; öğrencilerin yanıt- deniyle daha çok sınıf ortamlarında kullanılabilecek ları okunduktan sonra sınav kâğıtları iyi, orta, zayıf bir sınavdır. Özellikle kalabalık gruplardan öğrenci olmak üzere üç gruba ayrılır. Her gruptaki sınav kâ- seçiminde kullanılması doğru olmaz. Çünkü soru sa- ğıtları tekrar okunur ve birbirleriyle karĢılaĢtırılarak yısının azlığı, daha dar bir alanı yoklamasına neden puanlanır. olurken puanlamasının zor olması, hem puanlama 3. Sıralama yoluyla puanlama; okunacak kâğıt sa- zamanını uzatır ve hem de önemli puanlama hata- yısı az olduğu durumlarda tüm sınav kâğıtları birbir- sına neden olur. BaĢka sınav türlerinin kullanılması leriyle karĢılaĢtırılarak en iyiden en kötüye doğru sı- belirtilen olumsuzlukları azaltabilir. raya konur ve puanlanır. 4. Yanıt anahtarıyla puanlama; sınav sorularını Yazılı Sınavlarında Dikkat Edilecek Noktalar: hazırlayan öğretmen uygulama yapmadan önce sı- Çok genel sorular sorulmamalı, aracın kapsam navdaki soruların yanıtlarını ve yanıtlara verilecek geçerliği düĢünülerek seçmeli sorular verilmemeli, puanları belirler. Öğrencilerin sınav kâğıtlarını hazır- sorular açık ve anlaĢılır olmalı, yanıt ve puanlama ladığı bu anahtarla okur ve puanlar. Anahtarla puan- anahtarı hazırlanmalı, dersin hedef davranıĢları için- lama, yazılı yoklama puanlamasında en nesnel ola- de olmadığı sürece imla, yazı güzelliği gibi durum- nıdır. lara puan verilmemeli, sınav kâğıtları soru soru okunmalıdır. 37 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net d) Yazılı Sınavlarda Güvenirlik: Yazılı sınavlar- KISA CEVAPLI TESTLER da sorulabilecek soru sayısının sınırlı oluĢu, güvenirliği sınırlayan önemli bir etkendir. Yazılı sınavlar- Yanıtlayıcının bir rakam, bir kelime ya da en çok da güvenirliği düĢüren etkenlerden biri de soru bir cümle ile yanıtlandırdığı sorulardan oluĢan sınav- belirsizliğidir. Soruda ne istendiğini kesinlikle anla- lardır. Kısa yanıtlı testler iki madde formunda yazı- mayan bir öğrenci, istenen yanıtı değil, kendi yo- labilir. Bunlardan biri, boĢluk doldurma olarak bilinen rumuna göre bir yanıt verecektir. Yanıtın soruda eksik köklü maddelerdir. Öğrencinin vereceği yanıt- istenenden farklı olması halinde puanlama güçlük- ların soru kökünde bırakılan boĢluğa yazılması iste- leri doğar. Puanlayıcı, bu tür yanıtları puanlamada nir. Diğeri ise kökü, soru ifadesiyle biten madde- tutarlı olamaz. Yazılı sınavlarda puanlama iĢlemi her lerdir. yanıtın okunması ve doğruluk derecesinin kestirilip Yanıtlar kısa olduğundan, yanıtlama zamanı çok ona göre puan verilmesi gerektirir. Dikkatsizce değildir. Bu nedenle de soru sayısı yazılı yoklama- okunmuĢ ve geliĢi güzel puanlanmıĢ yazılı sınavlar- lara göre daha çoktur. Soru sayısının çok olması dan alınan sonuçların güvenirliği çok düĢük olur. ölçülecek olan konunun her yerinden daha çok dav- Yazılı sınavlar nesnel yöntemlerle puanlanamadı- ranıĢın yoklanmasına fırsat verir. Kısa yanıtlı olma- ğından, puanlama güvenirliği hemen hiçbir zaman sı, yoruma açıklığı azaltır. Yanıtlar yoruma açık ol- mükemmel olmaz. Yazılı sınavlarda güvenirliğin dü- madığı sürece puanlayıcıya daha az takdir hakkı bı- Ģük olmasının diğer bir nedeni de soru güçlüğünün rakır. Bu da puanlama hatasının azalmasını sağlar. sınavın amacına göre ayarlanamamasıdır. Yazılı sınavlarda sorunun güçlüğü kabaca yapılabilir. Bir sı- a) Özellikleri navın güvenirliği, diğer etkenler sabit kalmak koĢu- 1. Yanıtlar kısadır, luyla, ancak her soru, sınıfın yüzde ellisi tarafından 2. Yanıtlayıcı istediği yanıtı verebilir, doğru yanıtlandığında en büyük değerini bulur. 3. Soru sayısı çoktur, 4. Puanlaması daha çok nesneldir, 5. Yanıtlar öğrenci tarafından düĢünülüp bulun- e) Yazılı Sınavlarda Geçerlik: Bir yazılı sınavda mak durumundadır, sorulabilecek soru sayısının sınırlılığı, sınavın kapsamını daraltır. Yazılı sınavlarda geçerliği düĢüren 6. ġans baĢarısı yok denecek kadar azdır, en önemli etken, derste iĢlenen birçok konunun 7. Puanlaması kolaydır. sınava alınmamasından doğar. Ayrıca sınavda so- b) Soru Yazımında Dikkat Edilecek Noktalar: rulan soruların derste iĢlenen konuları temsil etme 1. AnlaĢılır ve açık yazılmalıdır, oranı küçüldükçe sınav puanlarının geçerliği düĢer. 2. Her madde ile önemli bir bilgi yoklanmalıdır, Bir sorunun yalnız konusu değil, soruluĢ tarzı da 3. Bilinen bir kaynaktan olduğu gibi alınmama- geçerliği etkiler. Yanıtlayıcılar, iyi anlayamadıkları lıdır, so-rulara kendi yorumlarına göre yanıt verirler. 4. Sorunun ifadesinde ipucu bulunmamalıdır, Yazılı sınavlarda soruların belirsizleĢtiği oranda ge- 5. Eksik cümle yapısında olan sorularda bırakılan çerlik düĢtüğü gibi, yanıtların sınırlanmadığı oranda boĢluklar ipucu vermemelidir, da geçerlik düĢer. Yazılı sınavlarda yanıtların yazıl- 6. Biri diğerinin yanıtını içeren sorular bulunma- ması sırasında, ölçülmek istenen bilgi ve becerilere malıdır, baĢka beceriler de karıĢır. Okunaklı yazabilmek, iyi 7. Eksik bırakılan yerler aynı uzunlukta olmalıdır. kompoze edebilmek, kısa ve kesin yazabilmek, çabuk yazabilmek bu tür becerilerin en önemlilerindendir. Bu becerilerin puanlara karıĢması ölçmenin DOĞRU-YANLIġ TESTLERĠ geçerliğini düĢürür. Puanlayıcının bazı yanıtlayıcılara karĢı ve bazılarından yana davranması, bazı Eğitimde öğrenci baĢarılarının belirlenmesinde yanıtlara gereğinden fazla ve bazılarına gereğinden çok sıkça olmasa da, sınıflama gerektiren (doğru- az puan takdir etmesi gibi puanlama yanlılıkları her yanlıĢ) testlere de baĢvurulur. Sınıflama gerektiren zaman geçerliği düĢürücü etkenlerdir. testler, doğru ya da yanlıĢ olarak verilen önerme- 38 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net lerin kapsamındaki fikre göre, doğru ve yanlıĢ olarak rı, yazarlarla onların eserleri, tarihi olaylarla tarihleri, sınıflandırılması istenilen sınavlardır. problemlerle onların çözümleri vs. Yanıtlama, sadece iki sınıftan birini seçme ge- EĢleĢtirmeli maddeler, çoktan seçmeli maddelerin rektirmektedir. Bu yönüyle Ģans baĢarısı oldukça değiĢtirilmiĢ biçimi olarak görülebilir. EĢleĢtirmeli yüksektir. Ancak, yanlıĢ verilen yanıtlardan düzelt- maddelerde geniĢ bir soru yönergesini ile birlikte me puanı uygulaması Ģans baĢarısını azaltabilir. birinci sütunda soru kökleri, yanıtları ise ikinci sütun- Doğru-YanlıĢ testlerinde açıkça bir soru ifadesi de- da verilir. Seçenekler soru sayısından en az üç fazla ğil, yalnızca, doğru ve yanlıĢ önermeler bulunmak- olmak zorundadır. Öğrencilerden birinci sütundaki tadır. Bu nedenle de oldukça fazla soru sorulabilir. sorular ile ilgili ikinci sütunda verilen bilgilerin eĢleĢ- Soru sayısının çok olması, konu kapsamının her tirmesi istenmektedir. yerinden davranıĢların ölçülmesine fırsat verebilir. EĢleĢtirmeli maddeler, kim?, ne?, nerede?, ne za- Yanıtlama, çok fazla zaman almadığı için sürenin man? Sorularını oluĢturan olgusal bilgilerin ölçülme- büyük bir kısmı verilen maddelerin okunmasına ay- sinde daha kullanıĢlıdır. rılır. Bu da uygulama süresinin kısa olmasını sağlar. EĢleĢtirme Maddelerinin Yazımında Dikkat Edi- Puanlamanın tamamen nesnel olması, puanlayı- lecek Noktalar: cıdan kaynaklanan puanlama hatasını en aza indirir. 1. a) Özellikleri: Bir eĢleĢtirme maddesi grubunda yer alan öncüller listesi ile yanıtlar listesi benzeĢik öğe- 1. Yanıtlar D – Y halindedir, lerden oluĢmalıdır. 2. Zamanın çoğu okumaya ve yanıtlamaya ayrılır, 2. 3. Soru sayısı çoktur, Bir eĢleĢtirmeli maddeler grubundaki madde sayısı en az 6,en çok 15 olmalıdır. 4. Puanlaması nesneldir, 3. Uzun ifadeler öncül olarak kullanılmamalıdır. 5. ġans baĢarısı yüksektir, 4. Puanlamada kolaylık sağlaması açısından 6. Puanlaması kolaydır. boĢluklar öncüllerden önce gelmelidir. 5. b) Soru yazımında Dikkat Edilecek Noktalar: Bir eĢleme takımı oluĢturan maddelerin tümü aynı sayfada bulunmalıdır. 1. Her madde ile sadece bir ana fikir yoklanma- 6. lıdır, Yanıt sütunundaki ifadeleri belirtmek için, onların baĢında büyük harfler (A B C D) gibi 2. Her madde kesinlikle doğru ya da yanlıĢ ol- kullanılmalıdır. malıdır, 7. 3. Bir maddenin yanlıĢlığı önemsiz bir ayrıntıda Yanıtların seçileceği sütun, bir kelime listesi ise alfabetik sıraya göre, rakam ya da tarih- olmamalıdır, lerden oluĢuyor ise büyüklük sırasına göre 4. Madde kısa ve açık olmalı ayrıntılarla ĢiĢirilme- düzenlenmelidir. melidir, 8. Yönergede eĢleĢtirmenin neye göre yapıla- 5. Olumsuz ifade bulunmamalıdır, cağı, yanıtların nasıl iĢaretleneceği açık ve 6. Kanı ifadeleri bir kaynağa dayandırılmalıdır, anlaĢılır bir dille belirtilmelidir. 7. D-Y önermelerin sayıları yaklaĢık olarak eĢit olmalıdır, 8. D-Y önermeler test formu içerisinde belirli bir ÇOKTAN SEÇMELĠ TESTLER örüntüyle yerleĢtirilmelidir. Sorulan bir sorunun yanıtını, verilen yanıtlar arasından seçme gerektiren maddelerden oluĢan test- EġLEġTĠRMELĠ SINAVLAR lerdir. Diğer sınav türlerine göre birçok avantajlı yönEĢleĢtirmeli (DenkleĢtirmeli) Maddeler: leri bulunması çoktan seçmeli testlerin kullanıĢlılı- EĢleĢtirmeli maddeler, iki grup halinde verilen ve ğını artırmıĢtır. Özellikle çok adayın baĢvurduğu birbiriyle ilgili olan bilgi öğelerinin belli bir açıklama- seçme ve yerleĢtirme gerektiren sınavlarda, çoktan ya göre eĢleĢtirilmesidir. Terimlerle onların tanımla- seçmeli testler kullanılmaktadır. 39 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Soru sayısının çok olması, güvenirliliğini ve geçer- 6. Puanlama süresi kısadır. Puanlamanın kısa ol- liliğini yükseltirken, puanlamasının nesnel olması ve ması, puanlamadaki tesadüfî hataları azaltır. makine ile puanlama fırsatı vermesi kullanıĢlılığını 7. Ġleri düzeydeki davranıĢların ölçülmesi zordur. artırmaktadır. Çoktan seçmeli testlerde daha karmaĢık olan Çoktan seçmeli test oluĢturan maddeler, değiĢik ve zor gibi görülen sorular sorulması zordur. öğelerden oluĢmaktadır. Bu öğelerden birincisi, 8. Uygulaması kolaydır. Uygulamasının kolay ol- madde köküdür. Madde kökü ile ne sorulduğunu ması her türlü eğitim basamağına rahatlıkla uy- ifade eden ve sorunun çözümü için gerekli bilgileri gulanabilmesini sağlar. veren kısmıdır. 9. Test süresinin önemli bir kısmı maddeyi oku- Ġkinci öğesi ise seçeneklerdir. Seçenek, madde maya ve doğru yanıtı bulmaya ayrılır. Soru kökündeki soruya olası doğru yanıt olarak verilen sayısının artması güvenirliği ve diğer yandan ifadelerdir. AnahtarlanmıĢ doğru yanıt, madde yaza- da geçerliği artırıcı rol oynar. rı tarafından doğru olarak belirtilen seçenek olarak 10. Yanıtlama sadece iĢaretleme ile yapılmaktadır. belirtilmektedir. Birçoktan seçmeli test maddesi öğe- Yanıtlamanın iĢaretleme ile yapılması uygula- si ise çeldiricilerdir. Çeldirici, bir maddenin anahtara ma zamanının kısalmasına neden olur. göre yanlıĢ olan seçenekleridir. Çoktan seçmeli tes- 11. Çoktan seçmeli testlerin özelliklerinin çoğunun, tin belirtilen dört öğesiyle beraber tamamına madde önemli olan güvenirlik ve geçerlik niteliklerini formu adı verilmektedir. artırıcı yönde olduğu görülmektedir. Özelikle kalabalık gruplarda kullanıĢlı olması da bu sı- a) Çoktan Seçmeli Testin Özellikleri navların niteliğini artırmaktadır 1. Doğru yanıt çoğu zaman maddenin içinde veb) Çoktan Seçmeli Testlerde Madde Tipleri rilir. Doğru yanıtın madde formu içerisinde verilmesi, soruyla ölçülen davranıĢa yeterince sa- 1. Doğru Yanıta Göre Sınıflama: hip olmayanların da doğru yanıtı görünce tanı- Doğru yanıtı kesin ve biricik olan maddeler: Mad- masını sağladığı için ileri düzeydeki davranıĢ- denin seçeneklerinden sadece bir tanesi doğru, di- ları ölçmede yetersiz kaldığı belirtilmektedir. ğerleri ise yanlıĢ olan maddelerdir. Sıkça kullanılan 2. Puanlaması nesneldir. Nesnel puanlama ise, bir madde tipidir. puanlayıcıdan kaynaklanan bir hatanın olmadı- AnahtarlanmıĢ yanıtı en doğru olan maddeler: Se- ğı, değiĢik puanlayıcıların aynı yanıt kâğıdına çeneklerin tümü kısmen doğru olan, fakat bir tanesi aynı puan vermesi demektir. diğerlerinden daha doğru olan medde tipidir. Bu 3. ġans baĢarısı vardır. ġans baĢarısının olması, madde türü ile daha ileri düzey davranıĢlar ve kar- yanıtı bilmeyen öğrencilerin tahminle doğru ya- maĢık bilgiler ölçülmeye çalıĢılır. Bu tür maddelerde nıtı bulmasını sağlar. Yanıtın bilinmediği halde çeldiriciler doğru yanıta yakındır. tahminle bulunması, ölçme sonuçlarına hata AnahtarlanmıĢ yanıtı birden fazla olan maddeler: karıĢmasına ve dolayısıyla güvenirliğin düĢme- Maddenin birden fazla seçeneği doğru yanıttır. Pu- sine neden olur. Ancak düzeltme formülleri kul- anlaması ve madde istatistiklerinin hesaplanmasının lanılarak, öğrencinin kesin doğru yanıtını bil- güçlüğü nedeniyle kullanıĢlı bir madde tipi değildir. mediği sorulara tahminle yanıtlama davranıĢın- Mümkün olduğunca testlerde kullanılmamalıdır. dan vazgeçirebilir. BirleĢik yanıt gerektiren maddeler: Bir maddenin 4. Hazırlama süresi uzundur. Hazırlama süresi di- birden fazla doğru yanıtı olduğunda kullanılan mad- ğer sınav türlerine göre en uzun olan sınavdır. de formudur. Bu yönüyle kullanıĢlılığını düĢürmektedir. Doğru yanıtı gizli olan maddeler: Çoktan seçmeli 5. Soru sayısının çokluğu hem güvenirliği ve hem maddelerin zayıf yönlerinden biri, kiĢinin doğru ya- de geçerliliğini artırır. Soru sayısıyla birlikte nıtı bilmediği halde verilen seçenekler arasında, onu ölçülecek olan konu kapsamından daha fazla gördüğünde tanımasıdır. Bunu önlemenin bir yolu davranıĢ yoklanmıĢ olacak ve böylece kapsam sorunun doğru seçenekler arasında gizleyerek yer- geçerliği da artma gösterecektir. leĢtirmektir. 40 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net 2. Madde Köküne Göre Sınıflama: 10. Seçeneklerin ifade, tarz, uzunluk ve kapsamı Kökü soru kipinde olan maddeler: Madde kökü birbirine benzer olmalıdır. 11. Çeldiriciler bilmeyeni ve yanlıĢ bileni yanıltma- soru ile ifade edilmektedir. Kökü eksik cümle yapısında olan maddeler: Bu lıdır. türdeki maddelerde madde kökü yarım bırakılmakta 12. ”Yukarıdakilerin hepsi” seçeneği dikkatli kulla- ve seçenekler bu kökü uygun bir Ģekilde tamam- nılmalı, en doğru yanıtı gerektiren maddelerde lamaktadır. Gramer ve dil bakımından seçeneklerin kullanılmamalıdır. tamamı cümleyi düzgün bir Ģekilde tamamlamalıdır. 13. ”Yukarıdakilerin hiçbiri”, seçeneği dikkatli kulla- Kökü olumsuz maddeler: Madde kökünün olum- nılmalı, en doğru yanıtı gerektiren maddelerde suz ifade edildiği madde yapısına olumsuz form kullanılmamalıdır. denir. Olumsuz madde bir sorunun birkaç doğru ya- 14. ”Yukarıdakilerin hepsi” ve “yukarıdakilerden nıtı bulunduğu durumda kullanılır. hiçbiri” seçenekleri aynı anda kullanılmamalıdır. 3. Maddelerin GruplanıĢlarına Göre Sınıflama: 15. Çeldirici bulmada güçlükle karĢılaĢıldığında Ortak köklü maddeler: Bir paragraf, bir tablo, bir madde formu değiĢtirilmelidir. 16. Anlamlı bir sıraya konulabilecek seçenekler grafik ya da harita gibi ortak bir materyalden iki ya da daha fazla sorunun sorulduğu maddelerdir. sıraya göre yerleĢtirilmelidir. Ortak seçenekli maddeler: Seçeneklerin ortak 17. Bir testteki seçenek sayısı yanıtlayıcıların dü- madde köklerinin farklı olduğu madde tipidir. Bu zeyine göre ayarlanmalıdır. madde tipinin avantajı her soru için seçeneklerin 18. Bir testin bütün maddeleri aynı sayıda seçe- tekrar yazılmasının gerekmemesinden dolayı az yer neğe sahip olmalıdır. kaplamasıdır. 19. Doğru yanıtlar test formu içerisine belirli bir örüntüyle yerleĢtirilmemelidir. c) Madde Yazımında Genel Ġlkeler 20. Doğru yanıtlar seçeneklere yaklaĢık olarak eĢit 1. Maddeler anlaĢılır olmalı, ”çoğunlukla”, ”ba- dağıtılmalıdır. zen”, ”nadiren” gibi sözcükler kullanılmamalı- 21. Seçenekleri belirtmede büyük harfler kullanıl- dır. malıdır. 2. Uygulama zamanının çoğu okumaya ayrıldığı 22. Maddelerin seçenekleri mümkünse alt alta ge- için, her madde mümkün olduğunca az kelime lecek sıralarda verilmelidir ile yazılmalıdır. 23. Olumlu maddeler arasına dağıtılan olumsuz 3. Test maddelerinin dil düzeyi yanıtlayıcıların dil maddeler, dikkat dağıldıkça öğrenciler tarafın- düzeyinin altında olmalıdır. dan olumlu gibi algılanabilir. Bu nedenle mad- 4. Test maddeleri bir kaynaktan olduğu gibi alın- de kökünde mümkün olduğunca olumsuz ifade mamalıdır. kullanılmamalıdır. Olumsuz madde formu kul- 5. Her test maddesi diğerlerinden bağımsız yanıt- lanılacak ise, olumsuz ifadenin dikkat çekecek landırılmalıdır. Ģekilde belirtilmesi uygun olur. 6. Maddenin noktalama ve yazım kurallarına uy- 24. Ortak köklü ve ortak seçenekli soruların diğer gun olarak yazılması farklı Ģekillerde algılan- sorularla karıĢtırılmaması için baĢlangıcında ve masını önler. bitiminde bir çizgi ile ayrılması uygun olabilir. 7. Bir maddede verilen bilgi baĢka bir sorunun ya- 25. Bir testteki bütün maddeler, aynı düzen içeri- nıtını açıklamamalıdır. sinde verilmelidir. Madde kökü ile seçenekler 8. Bir maddenin yarısı bir sayfada, diğer yarısı ise arasında her maddede aynı ayarda boĢluk bı- baĢka bir sayfada olmamalıdır. rakılmalıdır. 9. Ġyi birçoktan seçmeli test maddesinin, madde 26. Madde köküne verilen olası seçeneklerde ya- kökü okunduğunda seçeneklere bakılmadan zım yanlıĢlığı yapılarak çeldirici yazılmamalıdır. doğru yanıt verilmelidir. 41 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Seçmeli Soru Yazma ve Ġncelemede Göz C) Kökte sorulan sorunun cevabı tek midir; Önünde Tutulacak Noktalar bu cevap seçenekler arasında verilerek doğru yanıt Ģeklinde belirlenmiĢ midir? I. Soru Yazma Tekniği Yönünden: D) Çeldiricilerin tümü kendi baĢlarına doğru A) Sorunun tümüyle ilgili olarak: fakat kökteki sorunun yanıtı olmayan 1. Soruyla yoklanan davranıĢ önemli midir? ifadeler midir? 2. DavranıĢın en geçerli yoklanma yolu bu E) Çeldiriciler, soruyla yoklanan davranıĢı öğrenmemiĢ olanlara doğru gözükebile- mudur? 3. Sorunun cevaplanma kolaylığı, yoklanan cek nitelikte midir? davranıĢın öğrenilme derecesine uygun mudur? Ġġ-PERFORMANS TESTLERĠ B) Sorunun köküyle ilgili olarak: 1. Anlatım, açık seçik ve sınırlı mıdır? Özellikle psikomotor becerilerin ölçülmesinde kul- 2. Gerekli bilgiler tam verilmiĢ, gereksiz bilgi- lanılır. Belli bir psikomotor becerinin öğrencide var lerden kaçınılmıĢ mıdır? olup olmadığının veya ne derecede var olduğunun 3. Soruda okuma güçlüğü, ilgili yaĢ-sınıf se- ortaya konmasını sağlayan testlerdir. Üç bölümden oluĢur; viyesine uygun mudur? Becerinin veya iĢin yapılmasında izlenen yol, C) Sorunun seçenekleriyle ilgili olarak: Becerinin veya iĢin yapılma hızı, 1. Anlatım paralelliği sağlanmıĢ mıdır? Becerinin veya iĢin kalitesi. 2. Anlatım, açık seçik ve sınırlı mıdır? 3. Anlatım kökle bağlantılı mıdır? 4. Birbirinden bağımsızlık sağlanmıĢ mıdır? TESTLERĠN ÖZELLĠKLERĠ Özellik D) Doğru cevapla ilgili olarak: Sınav Türü 1. Belli ve tek doğru cevap var mıdır? Geçerliği ve güvenirliği en yüksek Çoktan 2. Doğru cevap olarak sorunun bu cevabı mı sınav türü seçmeli beklenmiĢtir? Geçerliği ve güvenirliği en düĢük 3. Çeldiriciler, doğru cevap olamayacak ifade- sınav türü ler midir? Objektifliği en yüksek olan sınavlar 4. Doğru cevabı bulma kolaylığı, yoklanan davranıĢta aranacak düzeye uygun mudur? II. Anlatım Yönünden: A) Soru, Türkçe yazım kurallarına uygun bi- anlatımla sunulmuĢ mudur? C) Soruda yararlanılan anlatım biçimi, ilgili ġans baĢarısının en yüksek olduğu Doğru- sınavlar YanlıĢ Sözlü Hazırlanması en kolay sınav türü Yazılı yeterli sınav türü Üst düzey becerileri ölçmede en III. Bilimsel Doğruluk Yönünden: yetersiz sınav türü A) Soru kökünde verilen bilgiler doğru mudur? B) Soru kökünde, açık, belirgin ve cevaplanabilir bir soru mu sorulmaktadır? 42 Kısa yanıtlı Uygulaması en zor olan sınav türü Üst düzey becerileri ölçmede en yaĢ veya sınıf düzeyine uygun mudur? seçmeli Sözlü sınavlar B) Soru, olabildiğince yalın ve doğrudan bir Çoktan Objektifliği en düĢük sınavlar ġans baĢarısının en düĢük olduğu çimde sunulmuĢ mudur? Sözlü Yazılı Kısa yanıtlı Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net 2005 ĠLKÖĞRETĠM PROGRAMININ GETĠRDĠĞĠ Performansın belirli bölümlerine odaklanıldığın- YENĠ ÖLÇME DEĞERLENDĠRME YÖNTEMLERĠ dan öğretmenin her bir parçayı gözlemleyebilmesini ve değerlendirebilmesini sağlar. Aynı değerlendirme aracı, öğrencinin zaman PERFORMANS DEĞERLENDĠRME içindeki geliĢimini bir çizelge olarak kullanarak Öğrencilerin bilgi ve becerilerini ortaya koyarak izleyebilir. oluĢturdukları çalıĢma, ürün ya da etkinliklerin değerlendirilmesi süreci, “performans değerlendirme” PERFORMANS VE PROJE ÖDEVLERĠ olarak ifade edilebilir. Bunun yanında performans değerlendirme, öğrencilerin gerçek yaĢam problem- Bir konu hakkında derinlemesine inceleme ya- lerine akademik bilgilerini uygulayabilme ve bunu pılması amacıyla verilen soru veya sorular, ödev problem üzerinde gösterebilmeleri ile ilgilenir. Ög- veya proje olarak adlandırılmaktadır. Performans rencilerin ögrendiklerini gerçek durumlarda göster- ödevleri, öğrencinin sahip olduğu bilgi ve becerileri melerini sağlar. Performans değerlendirmenin belli günlük yaĢamla da iliĢkilendirerek ortaya koymasını aĢamaları vardır. Bu aĢamalar: gerektiren kısa dönemli çalısmalardır. Amacın belirlenmesi: Performans değerlendir- Projeler, geniĢ içerikli ve uzun süreli performans mede sürecin mi, sonucun mu yoksa her ikisinin ödevleridir. Proje çalıĢmaları, ünitelerde yer alan birlikte mi değerlendirileceğine karar verilmelidir. kazanımları kapsayan ayrıntılı ödevlerdir. Bireysel Performans ölçütlerinin belirlenmesi: Perfor- ya da grup olarak yapılabilir. Proje konusu, öğrenci mansın ölçütleri, öğrencinin bir etkinliği tam ve tarafından veya öğretmenin hazırlayacağı listeden doğru bir Ģekilde yapması için göstermesi gere- seçme yoluyla belirlenebilir. Öğrenci, projenin ama- ken belli davranıĢları tanımlar. Performans ölçüt- cını, izlenecek yolları, kullanılacak malzemeleri ve lerinin belirlenmesi aĢamasında, önce değerlen- karĢılaĢılabilecek durumları önceden planlar. Gerek- dirilecek performansın belirlenmesi gerekmekte- tiğinde öğretmeninden yardım alabilir. dir. Ardından, belirlenen performansın özellikleri tanımlanmalıdır. Bunlar, gözlenebilir davranıĢ ÖĞRENCĠ ÜRÜN DOSYASI veya ortaya çıkacak ürün Ģeklinde açık ifadelerle (TÜMEL DEĞERLENDĠRME)-(PORTFOLYO) belirtilmelidir. Performansın ya da ürünün gözlemlenebile- Ürün dosyası, öğrencinin çalıĢmalarının toplandığı ceği ortam oluĢturma: Öğrencinin performan- bir dosyadır. Bu dosya, öğrencinin, yüksek kalitede sını doğru ve güvenilir biçimde değerlendirmek bir düzen içinde oluĢturulmuĢ anlamlı ödevlerini için gözlemlerin birden fazla tekrarlanması ge- içerir ve öğrencinin en iyi çalıĢmalarının bir yansı- rekmektedir. Gözlem sayısı, yapılacak değerlen- masıdır. dirmenin önemine ve gözlem için gereken sü- Performansın değerlendirilmesinde dereceli puan- reye göre belirlenmelidir. lama anahtarları (Rubric), kontrol listeleri, görüĢme Performansın puanlanması: Performansın de- ve gözlem formları, öz-akran-grup değerlendirme ğerlendirilmesi, dereceli puanlama anahtarı, kon- formları vb. kullanılabilir. trol listesi ve hikâye kayıtlarıyla yapılır. Perfor- Öğrencinin, öğrenme sürecindeki geliĢiminin, bu mans değerlendirmede puan belirleme son süreçte ortaya koyduğu ürünlerin ve performansının adımdır. takip edilerek, öğrencinin çalıĢma örnekleri üzerinden ölçme değerlendirme yapılması yöntemidir. De- Performans Değerlendirmenin Yararları: ğerlendirme, öğrenci ile birlikte yapılır. Öğrencinin Öğrencinin bilgiyi kullanmasını ve gerçek yaĢam öğrenme sürecinde sorumluluk alma, grupla çalıĢ- durumlarına yakın ürünler ortaya koymasını sağ- ma, çalıĢmalarında bilimsel tutum ve bilimsel süreç- lar. leri uygulama, araĢtırma inceleme yapabilme, dü- Performans değerlendirme kaynakları tekrar tek- Ģünce geliĢtirme gibi özelliklerinin dikkate alınması rar kullanılabilir. temeline dayanır. 43 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Öğrenci GeliĢim Dosyasında (Portfolyo‟da) aĢağı- DERECELĠ PUANLAMA ANAHTARI (RUBRĠK) daki incelemeler yapılarak değerlendirme yapılır: Gözlemlere ait puanları tanımlanmıĢ kategoriler- Öğrenci ne öğrendi? Değerlendirmede hangi yollar izlendi? den (ölçüt ya da ölçütler) uygun düĢen boyuta kay- Nasıl düĢündü? detmemizi sağlayan bir değerlendirme aracıdır. De- Nasıl analiz yaptı? receli puanlama anahtarı üç bölümden olusur; 1) Değerlendirme ölçütleri: Kabul edilebilir cevap- Hangi sorulara cevap aradı? ları kabul edilemez cevaplardan ayırmak için kula- Bilgiyi nasıl yapılandırdı? nılır. Örneğin, öğretmenler yazılı kompozisyonları değerlendirirken organizasyon, yapısal içerik, söz- Portfolyo’nun Kullanılma Amaçları: Klasik ölçme araçlarının yanında, ölçme iĢle- cük seçimi vb. gibi değerlendirilebilir ölçütler kul- mine yenilikler katmak, lanırlar. 2) Ölçüt tanımlamaları: Öğrencilerin değerlendiril- Öğrencilerde grupla çalıĢma alıĢkanlığı geliĢtirmek, mek istenen cevaplardaki niteliksel farklılıkları ta- Öğrencinin öğrenme-öğretme sürecindeki per- nımlama yolunu ifade eder. Örneğin; bir kompozis- formansını görmek, yonda organizasyon değerlendirilecekse bu ölçüt- Değerlendirme sürecine öğrenciyi de katmak. lerden en yüksek puanı alan öğrencinin kompozis- Öğrencinin üst düzey zihinsel becerilerinin geli- yonu organizasyon açısından hiç hata içermeme- Ģimine katkıda bulunmak, lidir. 3) Puanlama stratejisi: Puanlama bütünsel ya da Öğrencinin gerçek öğrenme düzeyini belirlemek, analitik biçimde olabilir. Hangisinin kullanılacağı de- Öğrencinin, öğretim sürecindeki geliĢim süreci- ğerlendirmenin amacına bağlıdır. Hazırlanan dere- ni izlemek, celi puanlama anahtarı ödevlerle birlikte örgencilere Öğrencinin öğrenme sürecine aktif olarak katı- verilmelidir. Öğrenci çalısmasının hangi ölçütlere lımını sağlamak, göre değerlendirilecegini önceden bilmelidir. Bütüncül (holistik) ve analitik (tahlili) olmak üzere Öğrencinin, program dıĢı etkinliklerini de kap- iki biçimi vardır. sayın çok yönlü geliĢimi ile ilgili bilgi edinmek, Öğrencilerin etkinliklere katılımını sağlamak, Öğrencilerin ilgi ve yetenek alanlarını ortaya çıkarmak, Öğrencilerin özgüvenini arttırmak. Öğrencilerde sorumluluk duygularının geliĢmesini sağlamak, Öğrencilerin biliĢsel, duyuĢsal ve psikomotor becerilerinin birlikte geliĢimini sağlamak, Eğitim ve öğretim etkinliklerini öğrenci merkezli bir duruma getirmek. Portfolyo Yönteminin Sınırlılıkları: Objektif değerlendirme yapılabilmesine rağmen, objektifliği sağlamak zordur, Öğrenciler arasındaki rekabeti ortadan kaldırır. Bu nedenle öğrencilerin birbirlerinin çalıĢmalarını kopya etmeleri gözlenebilir. 44 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Bütüncül rubrik: Analitik (tahlili) rubrik: Öğretmenin genel süreci veya ürünü bir bütün Önce performans veya ürünün parçalarını ayrı olarak parçalarını dikkate almadan puanlamasını ayrı puanlamasını sonra da bu bireysel puanları içerir. Örneğin, bütüncül rubriklerde bir öğrencinin toplayarak toplam puanı hesaplamasını gerektirir. cevabındaki genel yeterlilik veya kalite çok iyi, yeterli, kısmen yeterli ve yetersiz olmak üzere dört Örnek: genel kategoride değerlendirilebilir. ANALĠTĠK DERECELEME ÖLÇEĞĠ Örnek: Puan 5 4 Yukarıdaki resimde verilen yörede yaĢamak zorundasınız. Evinizi bu yörede nereye yapardınız, burayı “x” ile iĢaretleyiniz. Evinizi yaptığınız yerin olumlu ve olumsuz yönlerini yazınız. 1. Olumlu: 2. Olumsuz: 3 BÜTÜNCÜL DERECELEME ÖLÇEĞĠ Puan 5 4 3 2 1 Ölçütler Öğrenci, evini yapacağı yeri işaretlemiştir. Bu yerin olumlu ve olumsuz yönleri konusunda doğru çıkarımlarda bulunmuştur. Öğrenci, evini yapacağı yeri işaretlemiştir. Bu yerin olumlu veya olumsuz yönlerinden birisi konusunda doğru çıkarımda bulunmuştur. Öğrenci, evini yapacağı yeri işaretlemiştir. Bu yerin olumlu veya olumsuz yönlerinden birisini belirtmiştir. Öğrenci, evini yapacağı yeri işaretlemiştir. Bu yer hakkında konunun amacına uygun çıkarımlarda bulunmamıştır. Öğrenci, evini yapacağı yeri işaretlemiştir. Bu yerin olumlu ve olumsuz yönleri konusunda herhangi bir çıkarımda bulunmamıştır. 2 1 Ölçütler Öğrenci, hayatında her yıla ait önemli bir olay belirlemiştir. Her olayla ilgili kanıt kullanmıştır. Olayları tarihlerine göre sıralamıştır. Olayları zaman şeridine uygun şekilde yerleştirmiştir. Öğrenci, hayatındaki bazı önemli olayları belirlemiştir. Bu önemli olayların bazıları ile ilgili kanıtlar kullanmıştır. Bu önemli olayları tarihlerine göre sıralamıştır Bu önemli olayları zaman şeridine uygun şekilde yerleştirmiştir. Öğrenci, yahatındaki bazı önemli olayları belirlemiştir. Bu önemli olaylarla ilgili kanıtlar kullanmamıştır Bu önemli olayları tarihlerine göre sıralamıştır Bu önemli olayları zaman şeridinde uygun şekilde yerleştirmiştir. Öğrenci, hayatındaki önemli birkaç olayı belirlemiştir. Bu önemli olaylarla ilgili kanıt kullanmamıştır. Bu önemli olayların bazılarını tarihlerine göre sıralamıştır. Bu önemli olayları zaman şeridine uygun şekilde yerleştirememiştir. Öğrenci, yahatındaki bir iki önemli olayı belirlemiştir. Bu olaylarla ilgili kanıt kullanmamıştır. Bu olayları tarihlerine göre sıralamıştır. Bu olayları zaman şeridinde doğru yerleştiememiştir. Benzetme: Klasik matematik sınavlarında, bazı öğretmenlerin sadece “sonuca”, bazılarının ise “gidilen yola” da puan verdiğini hatırlayınız. Benzer bir durum. Bütüncül rubrikte davranıĢın bütününe, analitik rubrikte davranıĢın her aĢamasına ayrı puan verilir. 45 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net KONTROL LĠSTELERĠ Örnek: Açıklama: AĢağıdaki ifadelerin gerçekleĢtirilme Gözlenen performansın ya da ürünün belirlenen düzeylerini, ifadenin karĢısında bulunan yere performans ölçütlerine ne derece uyumlu oldugu çarpı (x) koyarak iĢaretleyiniz. kontrol listeleri kullanılarak belirlenebilir. Kontrol listeleri, öğrenciden beklenen davranıĢın özellikleri- Öğrencinin Adı-Soyadı:…………………….. ne iliĢkin detaylı bilgileri içeren ve öğrenci perfor- Tarih: …………… mansının eksik noktalarını belirleme amacıyla kulla- Ödev için uygun kağıt ve resimler kullanılmıştır. Ödeve uygun kapak sayfası hazırlanmıştır. maĢık davranıĢları belirlemek için uygundur. Örnek: “Sözlü sunum becerileri” ne ait bir kontrol listesi örneği. Öğrencinin Adı-soyadı: Farklı kaynaklardan bilgi toplamıştır. Metne aktarılan tüm bilgilerde Türkçe’yi doğru,düzgün ve etkili kullanmıştır. Hazırlanan rapor, resimler, gazete haberleri, çizimler, tablo, grafik ve istatistiklerle desteklenmiştir. Toplanan bilgiler uygun biçimde düzenlenmiştir. Ödevin son sayfasına yararlanılan kaynaklar yazılmıştır. Ödevin, kağıt düzeni, yazıların sayfaya yerleştirilmesi güzel bir biçimde yapılmıştır. ……………………… Tarih: …………….. Ölçütler Evet Zayıf (1) genellikle, daha küçük parçalara ayrılabilen ve kar- Orta (2) ÖLÇÜTLER davranıĢ, özellik veya nitelik bulunur. Kontrol listeleri İyi (3) evet veya hayır Ģeklinde puanlanabilen bir dizi Çok İyi (4) DERECELER nılan araçlardır. Kontrol listelerinde var veya yok, Hayır Dinleyiciyle göz teması kuruyor. Beden dilini etkili kullanıyor. AnlaĢılır bir tonda konusuyor. Yerinde vurgulamalar yapıyor. Akıcı konusuyor. Gereksiz sesler çıkarmıyor. Düzgün ifadeler seçiyor. Ödev zamanında teslim edilmiştir. Alınan Puanlar Gereksiz tekrar yapmıyor. DüĢüncelerini ifade edebiliyor. TOPLAM PUAN: ……………… Bilgiyi organize edebiliyor. Sonuç bölümünde özetleyebiliyor GÖZLEM FORMLARI DERECELENDĠRME ÖLÇEKLERĠ Çıktıların görülebildiği bazı alanlarda bu yöntem Kontrol listeleri performansa iliĢkin belirli ölçütlerin oldukça önemlidir. Gözlemler, öğrenciler hakkında karĢılanıp karĢılanmadığıyla ilgili olan sınırlı durum- doğru ve çabuk bilgiler sağlar. Öğretmen öğrencile- larda değerlendirme için uygun seçimdir. Fakat per- rin; formans düzeylerini tanımlayan bir yapıya sahip de- Soru ve önerilerine verilen cevapları, ğildir. Derecelendirme ölçekleri ise ölçülen özelliğe Sınıf içi tartısmalarda katılımlarını, iliĢkin performansı çeĢitli düzeyleriyle tanımlayabilir Grup çalısmalarında ve tartıĢmalarında katı- ve ölçütlerin ne dereceye kadar karĢılandığını gör- lımlarını, meye olanak sağlar. Öğrenmeyle ilgili yaptığı görevler ve mater- Derecelendirme ölçekleri, performansın değiĢen yallere öğrencinin gösterdiği tepkiyi gözlem- boyutlarını dikkate alarak puanlamak amacı kulanı- ler. lan puanlama yönergeleridir. 46 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net ÖZ DEĞERLENDĠRME AKRAN DEĞERLENDĠRME Bir grup içinde yer alan bireylerin akranlarını Öz değerlendirme, bireysel veya kendini değer- değerlendirmeleridir. Bu değerlendirme sırasında lendirme olarak da adlandırılabilir. Öğrencilerin ken- öğrencilerin becerileri de geliĢtirilir. Akran değerlen- di öğrenme süreçlerini, özellikle baĢarı düzeylerini dirme, öğrencilerin kendilerine olan güvenlerinin ve öğrenme sonuçlarını yargılamaları olarak açık- artmasını da sağlar. KiĢinin öğretmen dıĢında baĢka lanabilir. Temel amaç, öğrencilerin öz değerlendir- birinden de dönüt almasına yardımcı olur. Değer- me becerilerini geliĢtirmektir. Değerlendirme süreci, lendirmeye temel oluĢturan beceriler ve ölçütlerin öğrencinin öğrenmeye yaklaĢımı, öğrencinin kendi saptanması konusunda öğrenciye bakıĢ açısı sağ- güç ve zayıflıkları ve becerileri hakkında değerlen- lar. Fakat bu değerlendirmenin de bazı sakıncaları dirme yapmasını sağlar. Öğrencinin kendi düĢünce- vardır. Örnegin; akranlar arasında arkadaĢlık duru- lerini kontrol edebilme, yani kiĢinin planlama ve mu, birbirlerine yüksek veya çok düĢük puan ve- problem çözme becerisini geliĢtirir. rilmesine neden olabilir. Kendi aralarında anlaĢarak birbirlerine yüksek puan verebilirler. Fiziksel güçten Örnek: kaynaklanan nedenlerden dolayı akranlar yüksek puanlama yapabilirler. Ayrıca akranlar öğretmen ka- ÖZ DEĞERLENDĠRME FORMU dar bilgili ve bilinçli değillerdir. Bu form kendinizi değerlendirmek amacıyla hazırlanmıştır. Çalışmalarınızı en doğru yansıtan seçeneğe (x) işareti Örnek: koyunuz. Adı-Soyadı:…………………….. Sınıf: …………… AKRAN DEĞERLENDĠRME FORMU No: ……… Bu form, gruptaki çalışmalarınızı değerlendirmek üzere DERECEL hazırlanmıştır. Arkadaşlarınızın bu konudaki görüşlerini ER almak için formu doldurunuz. Size ayrılan son sütunda da kendinizi değerlendiriniz. Sorulara cevabınız “evet” ise E, Hiçbir Zaman (1) DAVRANIġLAR Bazen (2) DEĞERLENDĠRECEĞĠ Her Zaman (3) ÖĞRENCĠLERĠN “bazen” ise B, “hayır” ise H harfi yazınız. Grubun Adı: ............................. Öğrencinin Adı-Soyadı: ..................................... 1. Arkadaşıma göre ben 2. Arkadaşıma göre ben 3. Arkadaşıma göre ben 4. Arkadaşıma göre ben 5. Arkadaşıma göre ben 6. Bana göre ben 1. Başkalarının anlattıklarını ve önerilerini dinledim. 2. Yönergeyi izledim. 3. Arkadaşlarımı incitmeden teşvik ettim. 4. Ödevlerimi tamamladım. 5. Anlamadığım yerlerde sorular sordum. 6. Grup arkadaşlarıma çalışmalarında destek oldum. 7. Çalışmalarım sırasında zamanımı akıllıca kullandım. 8. Çalışmalarım sırasında değişik materyaller kullandım. 9. Bu etkinlikten neler öğrendim? ……………………………………………………………………… ……………………………………………..…………………. 10. Bu etkinlik sırasında grubumdaki arkadaşlarıma nasıl yardım ettim:?………………………………………………….. …………………………………………………………………... 11. Bu etkinlik sırasında en iyi yaptığım şeyler ………….…. …………………………………………………………………... …………………………………………………………………… Çalışmalara gönüllü katılır. Bildiklerini arkadaşlarıyla paylaşır. Gerektiğinde arkadaşlarına yardım eder. Aldığı görevi zamanında yerine getirir. Arkadaşlarının görüşlerine saygılıdır. Tartışmalarda kırıcı olmadan konuşur. 47 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net YAPILANDIRILMIġ GRĠD TANILAYICI DALLANMIġ AĞAÇ YapılandırılmıĢ grid alternatif ölçme değerlendirme Belli bir konuda öğrencinin neleri öğrendiğini ve tekniklerinden biridir. Bu teknik uygulanırken yaĢa neleri öğrenemediğini belirlemek için kullanılabilir ve seviyeye bağlı olarak dokuz ya da on iki kutu- değerlendirme araçlarından biridir. Bu teknikte, te- cuktan oluĢan bir tablo hazırlanır. melden ayrıntıya giden bir sıraya göre doğru ve 1 2 3 4 5 6 yanlıĢ ifadeler seçilerek öğrenciden doğru seçimi yapması istenir. Böylece, 8 veya 16 seçimlik bir ifadeler listesi ile sonlanan bir dallanmıĢ ağaç oluĢturulur. 7 8 9 Grid tekniğinin genel yapısı Konu ile ilgili kavramlar, resimler, sayılar, eĢitlikler, tanımlar veya formüller geliĢigüzel kutucuklara yerleĢtirir. Kutucukların içeriğinin değiĢtirilebilmesi hem görsel hem de analitik düĢünebilme olanağı sağlar. AĢamaları: Her sorunun cevabı için uygun kutucuklar seçilir. AĢağıdaki formülle puanlar hesaplanır. C1 C3 C2 C4 C1 = Seçilen doğru kutucuk sayısı C2 = Toplam doğru kutucuk sayısı C3 = Seçilen yanlıĢ kutucuk sayısı C4 = Toplam yanlıĢ kutucuk sayısı Bu formüle göre öğrencilerin puanları –1, 0 ve +1 arasında değiĢir. Bu puanı on üzerinden değerlendirmek için önce negatifliği ortadan kaldırmak amacı ile 1 ile toplanır ve elde edilen sayı 5 ile çarpılır. 48 49 KONTROL LĠSTELERĠ YAZILI SINAVLAR KISA CEVAPLI TESTLER ÇOKTAN SEÇMELĠ TESTLER EġLEġTĠRMELĠ SORULAR DOĞRU-YANLIġ TESTLERĠ Araç veya Yöntemleri Puanlanması zaman alır ve ögretmenin öznel yargıları puanlamaya karısabilir. Açık uçlu sorularla hazırlanan bir sınavda sınırlı sayıda soru sorulabileceğinden kapsam gecerliği düĢüktür. Puanlaması kolay ve objektiftir. Kısa sürede çok sayıda davranıĢ ve beceri ölçülebilir. Puanlanması kolay ve objektiftir. Daha çok bilgi, zihinsel beceriler ve yeteneklerin ölçülmesinde kullanılır. Hazırlanması ve puanlanması kolaydır. GeniĢ bir kapsam örneklenebilir. Hazırlanması kolaydır. Üst düzey düsünme becerilerin ölçülmesinde, öğrencilerin kavramları bir bütün olarak kavrama yeteneklerinin ve yazılı anlatım becerilerinin ölçülmesinde kullanılır. Ġki grup hâlinde verilen ve birbirleriyle ilgili olan bilgi ögelerinin, belli bir açıklamaya göre eĢleĢtirilmesini gerektiren soru tipleridir. Bir sorunun cevabını, verilen seçenekler arasından bulmayı gerektiren sorulardır. Öğrencilerin bir sayı, bir kelime veya bir cümle ile cevaplayabilecekleri sorulardır. Öğrencinin veya öğretmenin gözlemlerini önceden belirlenen ölçütlere göre yapmalarına olanak sağlar. Ögrencinin performansı hakkında, eksik noktaların Öğrenciden beklenen davranıĢın belirlenip, telafi edilmesi adına, detaylı bilgiler Özelliklerine iliĢkin detaylı bilgileri içeren ve içerir. öğrenci performansının eksik noktalarını Performans ölçütlerini belirttiği için, beklenen belirlemek amacıyla kullanılan araçlardır. davranıĢın özelliklerine dair bilgiler verir. Kontrol listesi, birçok kez kullanılabilir, farklı ya da aynı örğencinin davranıĢını gözlerken, bir önceki ile karĢılaĢtırılabilir. Öğrenciden sorunun cevabını düĢünüp hatırlaması ve bulduğu cevabı yazılı olarak ifade etmesini gerektiren sorularıdır. Üst düzey becerilerin ölçülmesinde yetersiz kalır. Puanlaması kolay ve objektiftir. Verilen bir cümlenin, mevcut olan bilgilere bağlı olarak doğru mu yanlıĢ mı olduğunun belirlenmesini gerektiren sorulardır. Öğretmeni bir davranıĢla ilgili sadece gözlemlenen veya gözlemlenemeyen Ģeklinde iki ölçüte göre karar vermeye zorlar. Performans sürecine iliĢkin ayrıntı bilgi elde edilemez. Özellikle üst düzey zihinsel becerilerin ölçülmesine yönelik çoktan seçmeli soruların hazırlanması zordur. Yazılı anlatım vb. becerilerinin ölçülmesine imkan vermez. Üst düzey becerilerin ölçülmesinde yetersizdir. Yazılı anlatım gerektiren becerilerin ölçülme olasılığı yoktur. Üst düzey becerilerin ölçülmesinde yetersizdir. Yazılı anlatım gerektiren becerilerin ölçülme olasılığı yoktur. KullanılıĢ Amacı ve Yararları Tanımı ve Özellikleri Olumsuz Yönleri ve Sınırlılıkları ÖLÇME – DEĞERLENDĠRME YÖNTEMLERĠ, ARAÇLARI VE ÖZELLĠKLERĠ Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net ÖZET TABLO 50 Bir çalıĢmanın, ürünün ya da cevabın niteliğinin değerlendirilmesinde kullanılan puanlama rehberidir. ÖĞRENCĠ ÜRÜN DOSYALARI DERECELĠ PUANLAMA ANAHTARLARI (RUBRĠK) ÖZDEĞERLENDĠRME Öğrencinin bir öğrenme alanındaki çaba, baĢarı ve geliĢimini kanıtlayan, belirli bir zaman dilimindeki (bir dönem, bir yıl) çalıĢmalarının, organize edilmiĢ sistemli bir koleksiyonudur. Belli bir konuda bireyin belli ölçütler çerçevesinde kendini değerlendirmesidir. Genis içerikli, uzun süreli performans ödevleridir. Öğrencilerin kendi öğrenme süreçlerine aktif olarak katılmalarını, kendilerini sürecin bir parçası olarak görmelerini sağlar. Ayrıca öğrencilerin kendi güçlü ve zayıf yönlerini tanımalarına, kendilerine dıĢarıdan bakma yetilerinin geliĢmesine katkıda bulunur. Öğretmenin öğrencilerden beklentilerini somut ve anlaĢılır hâle getirir. Öğrencilerin kendilerinden beklenenin ne olduğunu bilmelerini ve kabul edilebilir bir performans görevinin hangi ölçütleri karĢılaması gerektigini anlamalarını sağlar. Ġnsanların bilgiyi kullanmasını ve gerçek yaĢam durumlarına yakın ürünler ortaya koymasını sağlar. Performans değerlendirme kaynakları tekrar tekrar kullanılabilir. Performansın belirli bölümlerine odaklanıldıgından, öğretmenin her bir parçayı gözlemleyebilmesini ve değerlendirebilmesini sağlar. Aynı değerlendirme aracı kullanılarak öğrencinin zaman içindeki geliĢimi bir çizelge dâhilinde izlenebilir. Üst düzey zihinsel becerilerin geliĢmesine yardımcı olur. Ayrıca grupla çalıĢma, teknolojiyi kullanma, iletiĢim vb. becerilerinin geliĢmesine de katkıda bulunur. Öğrencilerin eleĢtirel düĢünme becerilerinin geliĢmesine katkıda bulunurken eleĢtirilere karsı hoĢgörülü olmayı öğrenmelerine de yardımcı olur. Ögrencilerin belli ölçütler çerçevesinde birbirlerini değerlendirmesidir. Ögrencilerin sahip oldukları bilgi ve becerileri günlük yaĢamla da iliĢkilendirerek ortaya koymalarını gerektiren kısa süreli çalıĢmalardır. Ögretmenin ögrencilerden beklentilerini somut ve anlaĢılır hâle getirir. Hazırlanması kolaydır. Birçok davranıĢın ölçülmesinde kullanılabilinir. KullanılıĢ Amacı ve Yararları Ölçülen özelliğe iliĢkin performansı çeĢitli düzeyleriyle tanımlayabilen ve ölçütlerin ne dereceye kadar karĢılandığını görmeye imkan sağlayan araçlardır. Tanımı ve Özellikleri PROJE ÖDEVLERĠ PERFORMANS ÖDEVLERĠ AKRAN DEĞERLENDĠRME DERECELENDĠRME ÖLÇEKLERĠ Yöntemler Araç veya Ögrenciler kendilerini degerlendirirken yanlı davranabilirler. Hazırlanması uzmanlık gerektirir ve zaman alır. Ġçerik önceden belirlenmezse ürün dosyası nitelikli veya niteliksiz birçok çalısmayı içerebilir. Kalabalık sınıflarda dosyaların saklanması ve degerlendirilmesi sorun olabilir. Bazı ürünler evde hazırlandıgından çalısmanın ögrenciye ait olup olmadıgından emin olunamaz. Uzun süreli ve evde yapılan çalısmalar oldugu için çalısmanın ögrenciye ait olup olmadıgından emin olunamaz. Ödevler, ögrencinin sahip oldugu olanaklar düsünülerek hazırlanmadıgında adil olmayan durumlar ortaya çıkabilir. Yakın arkadaĢlarına gereken, fazla yakın olmadıkları arkadaĢlarına ise gerekenden düĢük puan verebilirler. Ayrıca akranlar kendi aralarında anlaĢarak birbirlerine yüksek puan verebilirler. Gözlem zaman alır, öznel algılar, değer yargıları ve duygular gözlem sonuçlarını etkileyebilir. Olumsuz Yönleri ve Sınırlılıkları Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net GeçmiĢ yıllarda bu konuyla ilgili sorulan bazı KPSS soruları (KPSS - 2007) Yazılı yoklamalardaki sorularda, öğrencilerin cevaplarını düĢünerek bulmaları ve buldukları bilgileri organize ederek yazmaları gerekir. Bu tür sorularla üst düzeydeki zihinsel beceriler ölçülebilir. AĢağıdaki sorulardan hangisi, yazılı yoklamaların bu avantajlarını ortaya koyan uygun bir örnek değildir? A) Enflasyonu düĢürmek için ne tür önlemler alınabilir? Örnek vererek irdeleyiniz. B) Avrupa Birliği‟ne katılma konusundaki görüĢleriniz nelerdir? Bu Ģekilde düĢünmenizin nedenini açıklayınız. C) Ġzlediğiniz en iyi sinema filmi hangisidir? Bu filmi neden beğendiğinizi gerekçeleriyle açıklayınız. D) BaĢarı ile yetenek arasındaki iliĢkiyi bir örnekle açıklayınız. Sizce insan yaĢamında hangisi ön plandadır. E) Ölçme nasıl tanımlanır? Eğitimde yapılan ölçmeler kaç gruba ayrılır? Yanıt: A, B, C, D seçeneklerinde yer alan ifadeler zorunlu olarak yazılı yoklama kullanılmasını zorunlu kılan sorulardan oluĢmakta iken, E seçeneğinde ise birçok ölçme aracıyla ölçülebilecek soru tipine yer verilmiĢtir. Yanıt E’dir. (KPSS - 2006) AĢağıdakilerden hangisi, yazılı yoklamalarda puanlama güvenilirliğini arttırmaya yönelik önlemlerden biri değildir? A) Puanlamayı birden fazla puanlayıcının yapması ve verilen puanların ortalamasının alınması B) Bir soruya öğrencilerin tümünün verdiği cevaplar puanlandıktan sonra diğer soruya geçilmesi C) Cevabın değiĢik bölümlerine verilecek puanların ayrı ayrı belirlenmesi D) Öğrencinin sınıf içi etkileĢimiyle ilgili puanın sınav puanlarına katılması E) Puanlama için ayrıntılı yönergelerin bulunduğu cevap anahtarının kullanılması Yanıt: A seçeneğindeki ifade, puanlayıcı güvenilirliğini sağlamak için uygulanır. B, C ve E seçeneklerindeki ifade ise tesadüfi hatayı azaltan önlemler olduğundan güvenilirliği arttırır. D seçeneğindeki ifade ise, güvenilirliği arttırmayacağı gibi geçerliliği de düĢürür. Yanıt D’dir. (KPSS – 2007) Sosyal bilgiler sınavında sorulan bir soru Ģöyledir: Türkiye‟nin pek çok sınır komĢusu vardır. En uzun sınırı paylaĢtığımız sınır komĢumuz aĢağıdakilerden hangisidir? A) Bulgaristan‟la sınırımız en uzundur. B) Irak‟la sınırımız en uzundur. C) Ġran‟la sınırımız en uzundur. D) Suriye‟yle sınırımız en uzundur. E) Yunanistan‟la sınırımız en uzundur. Yukarıdaki sorunun kusurları arasında aĢağıdakilerden hangisi yoktur? A) Kökte yazım hatasının olması B) Kökte gereksiz sözcük kullanılması C) Kök ile seçenekler arasında ifade uyumsuzluğu olması D) Seçeneklerde aynı sözcüklerin tekrarlanması E) Seçeneklerin uygun olmayan bir sırada verilmesi Yanıt: Sözel seçeneklerde, seçeneklerin belli bir sırada verilmesi zorunluluğu yoktur. Yanıt E’dir. (KPSS – 2003) Okul öğrenmelerinin ölçülmesinde öğretmenler, “tamamlama” veya” boĢluk doldurma” tipi sorular hazırlarken genellikle, kitaptaki bir ifadeyi aynen almakta, bu ifadenin içinden bir sözcüğü ya da sözcük grubunu bulmasını istemektedir. Bu tür soruların en önemli sakıncası aĢağıdakilerden hangisidir? A) Puanlamanın çok zaman alması B) Kesin bir yanıt bulmanın zor olması C) Kopya çekmeyi kolaylaĢtırması D) Öğrencileri ezbere yöneltmesi E) Öğrenme farklılıklarını gösterme gücünün az olması Yanıt: Kitap cümlelerinin teste alınmasının en önemli sakıncası öğrencileri ezbere yöneltmesidir. Yanıt D’dir. 51 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net (KPSS - 2004) AĢağıdaki davranıĢlardan hangisi yazılı yoklama türü sınavlarla daha geçerli bir biçimde ölçülebilir? A) GörüĢünü, nedenleriyle birlikte açıklama B) Bir kavramı veya ilkeyi tanımlama C) Bir bütünü oluĢturan öğeler arasındaki iliĢkiyi belirtme D) Bilgilerinden yararlanarak yeni bir problemi çözme E) Olgu ve olayları verilen ölçüte göre gruplama Yanıt: Bir konudaki görüĢün nedenleriyle açıklanmasına, en uygun sınav türü yazılı yoklamalardır. Dolayısıyla Yanıt A’dır. (KPSS - 2008) Bir sınav türünün özellikleri Ģunlardır: Kısa sürede çok soru sorulmasına olanak sağlar. Puanlaması kolay ve nispeten nesneldir. ġans baĢarısı yoktur. Bu özellikleri taĢıyan sınav türü aĢağıdakilerden hangisidir? A) Doğru-yanlıĢ B) BoĢluk doldurma D) Açık uçlu E) Sözlü C) Çoktan seçmeli Yanıt: Verilen özellikler, boĢluk doldurma sınavlarının özelliklerini ifade etmektedir. Yanıt B’dir. (KPSS – 2008) Bir ölçme uzmanı, Fen ve Teknoloji dersi için hazırlanan baĢarı testini incelemiĢ ve ortak köke dayalı soruların 5-6 civarında olduğu saptanmıĢtır. Bu durumu eleĢtiren uzman, bir köke dayalı olarak sorulabilecek soru sayısının üçü geçmemesini önermiĢtir. Ölçme uzmanının bu eleĢtirisinin en önemli gerekçesi aĢağıdakilerden hangisidir? A) Öğrencilere aynı kökle ilgili çok sayıda soru sormak motivasyonu düĢürür. B) Sorular tek bir test yaprağına sığmayacağı için test düzeni bozulabilir. C) Benzer davranıĢı ölçen soru sayısının artması güvenirliği düĢürür. D) Soruların birbirinden bağımsız cevaplanabilme kuralı bozulabilir. E) Okuduğunu anlama değiĢkeninin etkisi artarak geçerliği düĢürür. Yanıt: Aynı soru köküne bağlı soru sayısının fazla olması, soruların birbirine bağımlı olmasına, dolayısıyla bağımsız cevaplanamamasına neden olur. Yanıt D’dir. (KPSS - 2009) Sınıf içi testlerin kullanım amacı, temelde eğitim öğretim etkinliklerinin niteliğini artırmaktır. Test sonuçları öğretmene, sınıf içerisinde yapmıĢ olduğu etkinliklerin ne ölçüde baĢarılı olduğuna dair geri bildirimde bulunmakta, aynı Ģekilde öğrencilere de sınıf içi etkinlikler sonucunda neyi ne kadar öğrendikleri konusunda bilgi vermektedir. Test sonuçlarına göre böyle bir geri bildirim alan öğretmenden beklenen aĢağıdakilerden hangisi olamaz? A) Eksik öğrenmeler varsa bunları tamamlaması B) Kullandığı öğretim yöntem, teknik ve materyallerinin etkililiğini gözden geçirmesi C) Öğretim etkinlikleri boyunca öğrencilerin geliĢimlerini izlemesi D) Öğrenciler arasındaki öğrenme güçlüklerini belirlemesi E) Öğrencileri yetenek düzeylerine göre gruplaması Yanıt: Paragrafta da belirtildiği gibi, sınıf içi öğretim etkinliklerinin değerlendirilmesine yönelik uygulanan testler, öğrencilerin yetenek düzeyleri hakkında bilgi vermez. Dolayısıyla elde edilen verilerle “öğrencilerin yetenek düzeylerine göre gruplandırılması” iĢlemi yapılamaz. Yanıt E’dir. 52 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net (KPSS - 2009) Fen ve teknoloji öğretmeni, öğrencilerin sınıf içi baĢarılarını yazılı ve sözlü yoklamalarla değerlendirmekte, öğrencilerin, hazırladıkları ürün dosyalarıyla değerlendirilmesine ise daha az yer vermektedir. Bu öğretmen aĢağıdakilerden hangisine daha çok önem vermektedir? A) B) C) D) E) Öğrencinin kendi öğrenmeleriyle ilgili güçlü ve zayıf yönlerini analiz etmesini sağlamaya Öğrencilerin bireysel geliĢim aĢamalarını izlemeye Öğrencileri baĢarılarına göre sıralamaya Öğrencide sorumluluk bilincini geliĢtirmeye Öğrencilere günlük hayata dair beceriler kazandırmaya Yanıt: Yazılı ve sözlü sınavlar, öğrenme sürecini değil, öğrenme ürünlerini yani, sonucu değerlendirmeye yöneliktir. Bir baĢka deyiĢle baĢarıyı, öğrencinin öğrenme düzeyini ölçer. Bu durumda öğretmenin, “öğrencileri baĢarılarına göre sıralamaya” daha çok önem verdiği söylenebilir. Yanıt C’dir. (KPSS - 2010) Öğrencilerin küresel ısınmanın getirdiği tehlikelerle ilgili ödevlerini inceleyen bir öğretmenin, ölçme sonuçlarına karıĢacak ölçmeciden kaynaklı hata miktarıyla ilgili endiĢeleri vardır. Puanlamasına karıĢacak olan öznelliği azaltmak isteyen bu öğretmene aĢağıdakilerden hangisini yapması önerilir? A) Dereceli puanlama anahtarı (rubrik) kullanması B) Ödevin kapsamını geniĢletmesi C) Ödev konularını seçmeli olarak tasarlaması D) Ödev teslim tarihini öğrencilerle birlikte kararlaĢtırması E) Öğrencilerin düzeyine uygun ödev konuları vermesi Yanıt: Ödev, araĢtırma, proje vb. çalıĢmalar genel olarak izleme yoluyla yapılır. Bu tür çalıĢmalarda puanlamaya hata karıĢmasını önlemenin en iyi yolu, “Dereceli Puanlama Anahtarı” kullanmaktır. Yanıt A’dir. (KPSS - 2011) Ġnsan nefesinden, kandaki alkol düzeyini ölçen alkolmetrelerin kullanılmadığı bir ülkede, trafik polisleri alkol kontrolünü „„yedi adım‟‟ testi ile yapmaktadır. Bu testte, kontrolü yapılacak sürücüden düz bir çizgi üzerinde yedi adım atması istenir. Ġlgili trafi k polisi ise sürücünün yürüyüĢünü gözlemleyerek aĢağıdaki formu doldurur. . Evet Hayır Sürücü açıklamalarımın bitmesini beklemeden çizgi üzerinde yürümeye baĢladı. Sürücü dengesini sağlayabilmek için kollarını yana açarak yürüdü. Sürücü yedi adımdan daha az veya daha fazla adım attı. Sürücü düz çizgiden saparak yürüdü. Sürücünün gözlenmesi sonucunda, formdaki maddelerden iki veya daha fazlası „„Evet” olarak iĢaretlenmiĢ ise sürücü, alkollü olarak değerlendirilip kendisine ceza kesilmektedir. Trafi k polisinin kullandığı form için aĢağıdaki terimlerden hangisi kullanılabilir? A) Kontrol listesi B) Öz değerlendirme formu C) Rubrik D) Tutum ölçeği E) YapılandırılmıĢ grid Yanıt: Belli bir özelliğin varlık veya yokluğunu “evet-hayır, var-yok” gibi iki kategoride belirlendiği ölçme araçları “kontrol listeleri”dir. Yanıt A’dır. 53 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net 3. Bölüm. TEST HAZIRLAMA SÜRECĠ-TEST VE MADDE ĠSTATĠSTĠKLERĠ TEST HAZIRLAMA SÜRECĠ Testin kapsamı, testteki sorularla yoklanacak olan öğrenme ürünleri demektir. Testin kapsamı, yokla- TEST HAZIRLAMA AġAMALARI nacak olan öğrenme ürünlerinin tamamı sayılarak ortaya konmalıdır. Testin kapsamı belirlenirken, yok- Test Planı: Test hazırlamaya plan ile baĢlanır. Bu lanacak davranıĢların hangi konu veya etkinlik üzerinde gösterilmesinin istendiği de belirlenmiĢ olma- planda; Hazırlanacak olan testin amacı lıdır. Öğrenmeleri izleme amacıyla test hazırlanıyor- Testin kapsamı (DavranıĢların belirlenmesi) sa konu kapsamındaki bütün davranıĢlar en az bir Konuların belirlenmesi-Belirtke tablosunun soru ile yoklanır. Öğrenme düzeyini belirlemek ise hazırlanması kapsam, dersin kritik davranıĢlarıdır. Bir öğretim Madde türünün seçimi ve yazımı programına öğrenci seçmek ise, kapsam öğrenci- Madde düzeltme lerin öğretim programındaki öğrenmelerine temel Testin düzenlenmesine iliĢkin ilkeler oluĢturacak bir alt programda kazandığı davranıĢ- Testin düzenlenmesi lardır. Testin denenmesi Testin uygulanması Konuların Belirlenmesi–Belirtke Tablosunun Testin puanlanması Hazırlanması: Ders içeriği ile hedef davranıĢlar arasındaki iliĢki ortaya konularak, hedeflere iliĢkin Testin Amacı: Sınavlar, tanıma, seçme, yerleĢtir- kritik davranıĢlara yönelik sorular hazırlanması gere- me vb. birçok amaçla yapılabilir. Sınav hazırlığı ya- kir. parken öncelikle bu sınavın yapılıĢ amacının belir- Bir testin kapsamı, konu ve davranıĢ boyutlarıyla lenmiĢ olması gerekir. birlikte, iki boyutlu bir belirtke tablosu ile belirlenmiĢ Derslerde kullanılan testlerin baĢlıca iki amacı olmalıdır. vardır. Bunlardan biri öğrencilerin ünitedeki öğrenme eksiklerin ve bu eksiklere yol açmıĢ olması Madde Türünün Seçimi ve Yazımı: Test hazırla- beklenen güçlükleri belirleyerek bunların, sonraki manın dördüncü aĢaması, ikinci aĢamada belirlenen üniteye geçmeden önce tamamlanmasını sağlamak- davranıĢları ölçen soruların yazılması aĢamasıdır. tır. Ġkincisi ise, öğrencilerin, dersin birkaç ünitelik bir Soruların yazılmasında, hangi ölçme araç ve yönte- bölümünde veya tümündeki öğrenme düzeylerini mi kullanılacaksa o araç için soru yazımındaki kural- belirlemektir. Okuldaki bütün derslerin her ünitesi ile lar göz önünde bulundurulmalıdır. Yoklanacak dav- ilgili bir izleme testi ve ayrıca, bütün derslerin her ranıĢların en güvenilir ve geçerli ölçüleri hangi test birkaç ünitelik bölümü ve tümü için de birer tane maddeleri veya durumları ile elde edilebilecekse düzey belirleme testi hazırlanır. onlardan yararlanma yollarına gidilmelidir. Örneğin, biliĢsel davranıĢların yoklanması için olanak var ise Testin Kapsamı (DavranıĢların belirlenmesi): seçmeli sorulardan, yoksa kısa yanıtlı soruların kul- Sınavda ölçülmek istenen davranıĢların belirlenme- lanılması daha uygun olabilir. si, sınavda hangi soruların sorulacağının belirlenme- Sınav türü, süre, öğrencilerin öğrenme düzeyleri, si için temel oluĢturur. sınavın amacı gibi faktörler, sınavda sorulacak soru Test planı hazırlanırken amaç belirlendikten sonra sayısını doğrudan etkiler. Soru sayısı belirlenirken yapılacak olan iĢ, belirlenen amaca hizmet edebile- bu faktörlerin göz önünde bulundurulması gerekir. cek olan bir testin kapsamının ortaya konmasıdır. Sınavda sorulacak soruların (yazılı, kısa cevaplı, 54 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net çoktan seçmeli, doğru-yanlıĢ vb.) belirlenmesi, sına- Testte, değiĢik konulara dayalı sorular varsa vın amacına, süresine, ölçülmek istenen davranıĢ- bunlardan aynı konuyla ilgili olanlar bir araya ların niteliğine, grubun öğrenme düzeyine bağlıdır. getirilmelidir. Sorulacak soruların güçlük dereceleri orta güçlükte Testteki sorular, yanıtlama yolları ve önemli olmalıdır. ise konu veya hedef birliği bozulmadan, Testin tümünde yer alacak test maddeleri veya gruplar içinde kolaydan zora doğru sıralan- durumlarının sayısı belirlenirken test için ayrılan sü- malıdır. re dikkate alınmalıdır. Soruların yazımı ve ilgili çizimler, okumayı ve görmeyi kolaylaĢtıracak biçimde olmalıdır. Madde Düzeltme: Test hazırlamanın üçüncü aĢa- Sorular sayfaya yerleĢtirilirken, sorunun tü- masında yazılan soruların tekrar gözden geçirilmesi münün aynı sayfada bulunmasına, soruların ve soru yazarının fark edemediği anlam ve ifade birbirlerinden bozukluğu, yazım hatası, eksik bilgilerin tamamlan- özen gösterilmelidir. ması ve varsa yanlıĢlıkların düzeltilmesi aĢamasıdır. Yazım ve çizim hataları test uygulanırken Düzeltme iĢi ekip çalıĢmasını gerektirir. Bu ekipte, yapılmamalıdır. dil uzmanı, ölçme ve değerlendirme uzmanı, prog- Çoğaltılan testlerin tümü kontrol edilmelidir. ram geliĢtirme uzmanı, soruların öğrenci seviyesine Testten ayrı bir yanıt kâğıdı düzenlenmelidir. uygunluğunu tartıĢmak üzere konu alanı uzmanı Testin baĢında bir yönerge konmalıdır. Bu bulunmalıdır. yönergede; testin amacı, testteki soru sayısı, ayrılacak Ģekilde olmasına testteki soruların düzeni, yanıtlama için veriTestin Uygulanmasına ĠliĢkin Ġlkeler: Testin uy- len süre, yanıtların nereye ve nasıl yapılaca- gulama koĢulları, test sonuçlarının puanlanması, ğı, yanıtların puanlama Ģekli, yanıtlama sıra- test sonuçlarından yararlanmada göz önünde tutul- sında nelerin göz önünde tutulması gerektiği, ması gereken noktalar belirlenmelidir. yanıtlama bitince ne yapılacağı belirtilmelidir. Testin uygulanması sırasında yapılması gereken Testte değiĢik bölümler varsa veya aynı test özel hazırlıklar, alınması gereken özel önlemlerin içinde değiĢik Ģekillerde yanıtlandırılacak so- belirlenmesi testin uygulanmasını kolaylaĢtırır. Ya- rular bulunuyorsa, bu bölüm veya soru grup- nıtlama süresi, ayrı bir yanıt kâğıdının kullanılması, larının baĢına, bölümün özelliğini ve bölüm- yardımcı araçlardan yararlanma durumları gibi ko- deki soruların yanıtlama Ģeklini belirten açık- Ģullar belirlenmelidir. lamalar konmalıdır. Test maddelerinden elde edilen bilgilerin nasıl Ayrı yanıt kâğıdı kullanılıyorsa bu kâğıtta, öğ- sayısallaĢtırılacağı, nasıl puanlayacağı belirlenmeli- rencinin adı soyadı, sınıfı, okul numarası ve dir. Puanlama ile ilgili neler yapılması düĢünülüyor- gerekli olabilecek diğer bilgiler yazılmalıdır. sa belirlenmelidir. Testten elde edilen sonuçların hangi amaçla kul- Testin Denenmesi: Testin istenen niteliklere sa- lanılması düĢünülüyorsa, sonuçlarla ilgili amaçların hip olup olmadığını belirlemek için onun denenmesi, kullanılmasında göz önünde tutulacak noktalar belir- deneme sonuçlarının analiz edilmesi gerekir. Testin lenmelidir. uygulanacağı kitle ölçülecek özellik yönünden homojen ise bu kitleden eĢ olasılıklı (random) örnek- Testin Düzenlenmesi: Soruların test formuna dö- leme, değilse dilimler içinde eĢ olasılıklı örnekleme nüĢtürülmesinde, yanıtlamayı kolaylaĢtıracak biçim- yöntemiyle bir deneme grubu belirlenebilir. Okullar- de düzenleme yapılmalıdır. da öğretmenler tarafından hazırlanan testlerde böy- Testte değiĢik yollarla yanıtlandırılacak soru- le bir yolla gitmek gerekmez. Öğretmenler, kendi sı- lar varsa bunlardan aynı yolla yanıtlandırı- nıflarındaki öğrencilerden yararlanabilir. Testin ilk lacak olanlar bir araya getirilmelidir. kullanıĢını ön deneme olarak kabul edilebilir. Aynı özel hedefle ilgili kritik davranıĢları Testin deneme uygulaması birçok amaç için 120 dolayında öğrenciden oluĢan gruplardan yararlanı- yoklayan sorular bir araya getirilmelidir. 55 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net labilir. Ancak titiz çalıĢmalarda deneme grubu 400 Dizi geniĢliğinden (ranjdan) yararlanarak testin kiĢiden oluĢmalıdır. bütünü üzerinde bazı yorum ve kanaatlere ulaĢılabilir. Testin Uygulanması: Uygulamada, sınavın bütün öğrencilere standart Ģekilde yapılmasına dikkat edil- 1. Ranjın yüksek olması, uygulanan testin, prog- melidir. Öğrencilerin oturma planlarının kopya çekil- ramın hedeflerini gerçekleĢtiren öğrenci ile ger- mesini önleyici Ģekilde olmasına dikkat edilmelidir. çekleĢtiremeyen öğrenciyi ayırabilen nitelikte bir test Sınavın yönergesinin öğrenciler tarafından okunma- olduğunu ifade eder. Bir baĢka deyiĢle ranjın yüksek sı sağlanmalıdır. olması, testin ayırt ediciliğinin de yüksek olduğunu ifade eder. Ranjın düĢük olması ise, ayırt edicilğin Testin Puanlanması: Yapılan sınavların puanlan- düĢük olması anlamına gelir. Yani test, bilen öğrenci ması, kullanılan ölçme araç ve yöntemine bağlıdır. ile bilmeyen öğrenciyi birbirinden ayırabilecek nite- Eğer sınav, yazılı yoklama sınavı ise, hazırlanan bir likte değildir. yanıt anahtarı ile puanlama yapılmalıdır. Yanıt anahtarında ise soruların yanıtı olabilecek bütün ay- Geçerliliği ve güvenirliği yüksek, ayırt edici rıntılar çıkartılmıĢ ve her birine puan verilmiĢ olma- bir testte dizi geniĢliğinin; o testten elde lıdır. Öğrencinin yanıt anahtarı ile tutarlı olan doğru edilmesi mümkün olan en yüksek puanın yanıtlarına, karĢılığı olan puanlar verilerek puanla- yarısına yakın olması beklenir. ma yapılmalıdır. Sınav, kısa yanıtlı, doğru-yanlıĢ ya da çoktan seçmeli ise puanlaması daha kolaydır. Bu Biraz önceki örnekte, alınabilecek en yüksek puan sınavlar genellikle doğru olan yanıtlar bir ve yanlıĢ 100 olarak verilmiĢtir. olanlarla boĢ bırakanlar sıfır ile puanlanılır. Dolayısıyla bu testte beklenen dizi geniĢliği (ranj) Uygulanan bir testin sonuçları bir bütün olarak 100 2 = 50‟dir. değerlendirilerek, uygulanan test ve gerçekleĢtirilen Ancak, alınan puanlar incelendiğinde bu testin sınav hakkında bazı sonuçlara ve kanaatlere ulaĢı- ranjı 25 olarak hesaplanmıĢtır. Hesaplanan dizi ge- labilir. niĢliği, beklenen dizi geniĢliğinden daha az olduğundan, bu testin ayırt ediciliğinin düĢük olduğu söylenebilir. TEST VE MADDE ANALĠZĠ 2. Dizi geniĢliği (ranj) değerinin, o testin standart sapmasına bölünmesi sonucunda elde edilen sayıRANJ (DĠZĠ GENĠġLĠĞĠ) nın 4 ile 6 arasında olması beklenir. Ranjın standart sapmaya bölümü ile elde edilen puanın 4-6 aralığı Uygulanan testte elde edilen en yüksek puan ile dıĢında bir değer olarak ortaya çıkması, bu testin en düĢük puan arasındaki fark, bu testin dizi geniĢ- geçerlik ve güvenilirliğinin düĢük olduğunu, 4-6 ara- liğini (ranj) ifade eder. sında bir değer alması ise testin güvenilirlik ve geçerliğinin yüksek bir test olduğu anlamını taĢır. Örnek: 50 sorudan oluĢan ve 100 puan sisteminde değerlendirme yapılan bir testte, sınıfta en Örnek: yüksek puan alan öğrenci 65, en düĢük puan alan Yukarıdaki örnekte verilen testin standart sapma- öğrenci ise 40 puan almıĢtır. sının 2,5 olduğu kabul edilirse; Bu durumda test puanlarının dizi geniĢliği Ranj (ranj) kaçtır? 25 Yanıt: Standart Sapma 2,5 = 10 Dizi geniĢliğinin standart sapmaya bölümünden Ranj = En Yüksek Puan – En DüĢük Puan elde edilen değer 4-6 aralığının çok üstünde bir = 65 – 40 değer olması, bu testin geçerlik ve güvenirliğinin dü- = 25 Ģük olduğu sonucunu ortaya koyar. 56 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net 3. Uygulanan bir testin ortalama puanı; o testten Öğrencilerin test maddelerinin en az dörtte bi- alınabilecek en yüksek puanın yarısına yakın olma- rini cevapsız veya boĢ bırakmıĢ olmalarının se- lıdır. bepleri aĢağıdakiler olabilir; Örnek: 100 puan sistemiyle uygulanan bir testtin ortalaması, 50 puan civarında olmalıdır. Sorunun madde kökü, ne sorulduğunu, ne is- Bir testin ortalamasının, o testten alınabilecek en tendiğini açık ve net bir Ģekilde ifade etmiyor yüksek puanın yarısından çok yüksek veya çok dü- olabilir. Ģük olması, o testin ayırt ediciliğinin düĢük olduğu, Seçenekler arasında kesin ve net bir cevap aynı veya yakın olması ise ayırt edicilik düzeyinin olmayabilir. yüksek olduğunu ortaya koyar. Test yönergesi, öğrencinin cevaplama iĢlemini nasıl yapması gerektiğini açık ve anlaĢılır 4. Bir testte elde edilen puanların aritmetik ortala- bir Ģekilde ifade etmiyor olabilir. masından yararlanarak, uygulanan testin güçlük de- Soruların güçlük dereceleri çok yüksek ola- recesi hakkında bilgi sahibi olunabilir. bilir. Bir testin ortalama güçlüğü aĢağıdaki Ģekilde hesaplanır: TEST MADDELERĠNĠN (SORULARIN) ANALĠZĠ Testin Ortalama Güçlüğü (P) Test maddelerinin analizinin yapılmasının baĢlıca Puanların Aritmetik Ortalaması = üç temel amacı vardır: Testten Alınabilecek En Yüksek Puan 1. Test maddelerinin güçlük dereceleri nedir? 2. Test maddeleri, istenilen davranıĢları kazanan öğrenci ile kazanamamıĢ öğrenciyi bir P 0,50’den Küçük Ġse birinden ayırt edebiliyor mu? P 0,50’den Büyük Ġse 3. Test maddelerinin çeldiricileri iyi çalıĢmıĢ mı? Test öğrencilere zor Eğitim öğretim gelmiĢtir. etkinlikleri yeterli Test soruları zordur. düzeydedir. Eğitim öğretim Öğrenciler, konuları etkinlikleri yetersiz öğrenmiĢtir. olabilir. Test, güçlük düzeyi Sınıf, baĢarısız düĢük, kolay öğrencilerden sorulardan cevapların sayısının, testi alan tüm öğrenci sayısına oluĢmaktadır. oluĢmaktadır. oranı, o soru maddesinin güçlük derecesini gösterir. Bu soruların cevaplarının bulunabilmesi için aĢağıdaki madde analizlerinin yapılması gerekmektedir: 1. MADDE GÜÇLÜK DERECESĠ (ĠNDEKSĠ) (P) Bir testteki herhangi bir maddeye verilen doğru 5. Testin bütünü üzerinde değerlendirme yapılırken göz önünde bulundurulması gereken en önemli Güçlük noktalardan birisi de, öğrenciler tarafından boĢ bıra- Derecesi P= Maddeyi Doğru Cevaplayanların Sayısı Testi Alan Tüm Öğrenci Sayısı kılan, cevaplandırılmayan sorulardır. Soruların öğrenciler tarafından cevaplandırılmaması veya boĢ bırakılması testin geçerlik ve güvenirliğini de düĢü- Madde güçlük indeksi (P); 0 ile 1 arasında değer rür. Bir testte, çok sayıda sorunun cevaplandırılma- alır. Ġndeks 1‟e yaklaĢtıkça soru maddesinin kolay, mıĢ olması, bunların sebebinin mutlaka araĢtırılma- 0‟a yaklaĢtıkça zor olduğunu ifade eder. P=0 olması sının gerekliliğini de beraberinde getirir. hiç kimsenin bu soruyu cevaplayamadığını, P=1 olması ise herkesin bu soruya doğru cevap verdiğini gösterir. 57 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Testlerin güçlük dereceleri: Güçlük indeksi Çözüm: Öncelikle bu sınavda baĢarılı ve baĢarısız olan % Güçlük derecesi 0.00 – 0.19 Çok zor 0.20 – 0.39 Zor 0.40 – 0.59 Orta güçlükte 0.60 – 0.79 Kolay 0.80 – 1.00 Çok kolay 27 oranındaki öğrenci grubu belirlenmelidir. 200 öğrenci % 27 54 öğrenci. Yani; üst gruptaki öğrenci sayısı 54, alt gruptaki öğrenci sayısı 54 tür. Ġyi bir test maddesinin güçlük indeksi 0,50 50 + 12 olmalıdır. P= Test maddelerinin güçlük indekslerinin = 0,57 54 + 54 toplamı testin aritmetik ortalamasını verir. Testin aritmetik ortalamasının madde sa2. MADDE AYIRT EDĠCĠLĠK DERECESĠ yısına bölümü, testin ortalama güçlüğünü (ĠNDEKSĠ) (r) verir. Bir soru maddesinin ayırt edicilik derecesi, bilen Örnek: Türkçe testinin 14. sorusuna 50 öğrencinin 40‟ı öğrenci ile bilmeye öğrenciyi ayırt edebilme gücünü doğru cevap vermiĢtir. 14. sorunun madde güçlük ortaya koyar. Ayırt edicilik öğeliği yüksek olan soru indeksi kaçtır? maddeleri, o testin güvenirliğini de arttırır. Bir soru maddesinin ayırt edicilik özelliğini belirleyebilmek Çözüm: için, o testten yüksek puan alan öğrenciler ile düĢük Doğru cevap verenlerin sayısı: 40 puan alan öğrencilerin, bu maddeye verdikleri ce- Sınava katılan öğrenci sayısı : 50 vapları incelemek gerekir. P= 40 Bu nedenle ayırt edicilik indeksi hesaplanırken, bu 50 = 0,80 teste katılan tüm öğrencilerin puanlarından değil, en 1‟e yakın bir sonuç ortaya çıktığı için bu sorunun baĢarılı olan ilk % 27 ve en baĢarısız olan son % 27 kolay bir soru olduğu söylenebilir. öğrenci grubu belirlenerek bu gruplar üzerinden Ancak, öğrenci sayısının çok fazla olması duru- iĢlem yapılır. Ayırt edicilik özelliği olan bir soru mad- munda, tüm öğrencilerin puanları üzerinden iĢlem desinden beklenen, baĢarılı olan % 27‟lik grubun bu yapılmaz. O testte en baĢarılı olan % 27‟lik öğrenci soruyu daha fazla oranda doğru cevaplaması, baĢa- dilimi ile, baĢarısız olan % 27‟lik öğrenci dilimi dik- rısız olan alttaki % 27‟lik grubun ise daha az oranda kate alınarak iĢlem yapılır. Bu durumda iĢlem aĢağı- doğru cevaplamıĢ olmasıdır. ĠĢlem aĢağıdaki gibi daki gibi formüle edilir: formüle edilmiĢtir: Güçlük Derecesi Üst Grupta Soruyu Alt Grupta Soruyu Doğru Cevaplayan + Doğru Cevaplayan Öğrenci Sayısı Öğrenci Sayısı P= Ayırt edicilik Her İki Gruptaki Toplam Öğrenci Sayısı Derecesi Örnek: Atatürk Lisesi‟nde 12. sınıf matematik sınavına toplam 200 öğrenci katılmıĢtır. 23. soruya, bu sınavda baĢarılı olan üst gruptan 50, alt gruptan ise 12 öğrenci doğru cevap vermiĢtir. 23. sorunun madde güçlük indeksi kaçtır? 58 Üst Grupta Soruyu Doğru Cevaplayan Öğrenci Sayısı r= - Alt Grupta Soruyu Doğru Cevaplayan Öğrenci Sayısı Bir Gruptaki Öğrenci Sayısı Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Bir test maddesinin ayırt edicilik gücü, aĢağıdaki Örnek: kriterlere göre değerlendirilir: Madde Ayırıcılık Ġndeksi 0,40 ve daha büyük 0,30-0,39 arası Fizik dersinden yapılan bir sınavda, sınıftaki 50 öğrenciden 22‟si 3. soruya doğru cevap vermiĢtir. 3. sorunun madde varyansı kaçtır? Değerlendirme Çözüm: Ayırt ediciliği çok yüksek Ayırt ediciliği normal, 22 (Sj²) = geliĢtirilebilir. 50 Düzeltilip geliĢtirilmeli, 0,20-0,29 arası aynı Ģekilde tekrar 28 = 0,25 50 Madde varyansını hesaplamanın bir diğer yolu da, kullanılmamalı maddenin güçlüğü ile madde güçlüğünün 1.00‟dan Ayırt ediciliği düĢük, 0,19 ve altı . farkına çarpılmasıdır. testten çıkartılmalı Örnek: Örnek: Bir önceki örnekte güçlük indeksi belir- Güçlük indeksi 0,50 olan bir Fizik sorusunun mad- lenen 23. soru maddesinin ayırt edicilik indeksi he- de varyansı kaçtır? saplanacak olursa; Çözüm: Çözüm: 50 - 12 (Sj²) = P . (1 – P) r= = 0,70 54 0,70 sonucu, bu soru maddesinin ayırt ediciliğinin = 0,50 . (0,50-1.00) çok yüksek bir madde olduğunu, bilen öğrenci ile = 0,25 bilmeyen öğrenciyi birbirinden ayırt edebildiğini ortaya koymaktadır. 4. MADDE STANDART SAPMASI (Sj) 3. MADDE VARYANSI (Sj²) Soru maddesinin ve testin güvenirliğinin hesaplanBir soru maddesinin varyansı, o soru maddesine masında kullanılmaktadır. Bir soru maddesinin stan- doğru cevap veren öğrencilerin oranıyla doğru ce- dart sapmasının hesaplanması için o soru madde- vap veremeyenlerin oranının çarpımı ile elde edilir. sinin varyansının karekökü alınır. 0,00 ile 0,25 arasında değer alır. Madde varyansının 0,25 olması istenir. Varyansın 0,25 olması, öğren- (Sj) = Pj.qj cilerin yarısının bu soruya doğru, kalan diğer yarısının ise yanlıĢ cevap verdiğini gösterir. Varyansın Örnek: 0,00 olması ise, bu soru maddesinin tüm öğrenciler Bir önceki örnekte Fizik dersinin 3. sorusunun var- tarafından doğru cevaplandırıldığı veya hiçbir öğren- yansı 0,25 olarak belirlenmiĢti. Bu soru maddesinin ci tarafından doğru cevaplandırılamadığını ifade standart sapması kaçtır? eder. Çözüm: (Sj²) = Pj . qj (Sj) = 0,25 (Sj) = 0,5 Pj : Doğru cevaplayanların oranı Sj : Doğru cevaplayamayanların oranı 59 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net 5. MADDE GÜVENĠRLĠĞĠ (rj) DEĞĠġKENLER ARASI ĠLĠġKĠLER (KORELASYON) Bir soru maddesinin güvenirlik katsayısı aĢağıdaki formülle belirlenebilir: DEĞĠġKENLER VE TÜRLERĠ DeğiĢken: Gözlemden gözleme farklı değerler (rj) = (rjx) . (Sj) alabilen özelliklere değiĢken denir. (rjx) : madde ayırt edicilik indeksi Örnek: (Sj) : madde standart sapması Anasınıfında öğrenim gören tüm öğrencilerin hepsinin yaĢı 6‟dır. Yani, bir anasınıfında bulunan öğ- Madde güvenirlik indekslerinin toplamı, testin rencilerin yaĢları değiĢken değil sabittir. Ancak, bu standart sapmasını verir. anasınıfında bulunan öğrencilerin boy uzunlukları ve Madde ayırıcılık gücü veya madde standart sap- ağırlıkları birbirinden farklıdır. Öğrencilerin boy ması arttıkça güvenirlik katsayısı artar. uzunluklarının ve ağırlıklarının değiĢiklik göstermesi, bu özelliklerin bir değiĢken kabul edilebileceğini Örnek: Üst gruptaki 150 kiĢiden 120‟sinin, alt göstermektedir. gruptakilerden ise 80 kiĢinin doğru cevapladığı bir DeğiĢkenler, türleri itibarıyla farklı Ģekillerde grup- soru maddesinin ayırt ediciliği, güçlük derecesi, var- lanmakta ve tanımlanmaktadır. yansı, standart sapması ve güvenirliği kaçtır? Bağımsız değiĢkenin etkisinin Çözüm: Güçlük indeksi = Bağımlı 120 80 = 0,67 300 DeğiĢken 80 = 0,27 Ayırt edicilik indeksi = 120 150 incelendiği, kontrol edilemeyen, bağımsız değiĢkenin durumuna bağlı olarak değiĢim gösteren değiĢkenlerdir. Bir iliĢkinin sonucunu etkileyen, Varyans = 0,67 (1-0,67) = 0,22 Bağımsız araĢtırmada kontrol altında tutulan ve DeğiĢken farklı değiĢiklikler yapılabilen değiĢkenlerdir. 0.22 = 0,47 Standart sapma = Güvenirlik Ġndeksi = (0,27).(0,47) = 0,13 Örnek: Düzenli beslenmenin sağlıklı yaĢamaya etkisi. Bağımsız değişken Bağımlı değişken Ders çalıĢmanın okul baĢarısına etkisi. Bağımsız değişken Bağımlı değişken Nicel Gözlenen değiĢkenin sayısal DeğiĢken sembollerle ifade edilmesidir. Bazı özellikler tür veya kalite Nitel yönünden değiĢkenlik gösterirler. Bu DeğiĢken özelliklere sayılar yerine semboller veya sıfatlar karĢı getirilebilir. Örneğin, cinsiyet, milliyet, medeni durum… Ali‟nin Matematik sınavından 70 alması. Nicel değişken Emel‟in Türkçe dersinden baĢarılı olması. Nitel değişken 60 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Sürekli DeğiĢken Süreksiz (Kesikli) DeğiĢken Yapay Süreksiz DeğiĢken Herhangi iki değeri arasında sonsuz sayıda değer alabilen değiĢkenlerdir. Bu iki değer arasındaki değerler arasında süreklilik vardır. Ağırlık, uzunluk, yaĢ, insanların zeka düzeyleri gibi… KORELASYON (ĠliĢki) Pozitif (Doğrusal) ĠliĢki Katsayı işareti + dır. Tüm değerleri almayan, sınırlı değerler alabilen değiĢkenlerdir. Değerler arasında bir süreklilik yoktur. Ġkinci bir değer alsa bile bu iki değer arasında baĢka bir değer alamaz. Örnek; Bir tavla zarı atıldığında üste gelen sayılar süreksiz değiĢkendir. Çünkü; değiĢkenin alabileceği bütün değerler 1-2-3-4-5 ve 6‟dan ibarettir. Örnek: Spor – Sağlık Çalışma – Başarı Beslenme – Sağlık Negatif (Ters Yönlü) ĠliĢki Katsayı işareti - dir. Örnek: Eğitim – Kadercilik Tembellik – Başarı Sigara – Sağlık Doğrusal iliĢkilerin korelasyon katsayıları pozitif, ters yönlü iliĢkilerin korelasyon katsayıları ise negatiftir. Sonucun negatif olması, iki değiĢken arasında Diğer adı, süreksizleştirilmiş değişkendir. Aslında sürekli olmasına karĢın, yapay olarak süreksiz bir değiĢkene dönüĢtürülüp kodlanmıĢ değiĢkenlerdir. Örnek: Boy uzunlukları 50-60 olanlara 1, 60-70 olanlara 2, 70-80 olanlara 3 gibi değerler verilerek kodlanırsa, sürekli olan ağırlık grupları süreksizleĢtirilmiĢ olur. iliĢki olmadığını değil, ters yönlü bir iliĢki olduğu ortaya koyar. Sonucun sıfır olması ise iki değiĢken arasında hiçbir iliĢki bulunmadığını ortaya koyar. Korelasyon katsayısı -1 ile +1 arasında değer alır. Korelasyon katsayılarındaki + veya – matematiksel bir anlam ifade etmez. ĠliĢkinin yönünü (doğrusal mı, ters yönlü mü) ifade eder. Dolayısıyla korelasyon katsayılarında -0,70, +0,60‟tan daha büyüktür. Yani -0,70 teki iliĢki daha yüksektir. Sadece ters Örnek: yönlüdür. Öğrencinin boy uzunluğu: 167,8→Devam edebilir. Örnekler: Süreksiz değişken Bir sınıftaki öğrenci sayısı. 24→Devam etmez. Süreksiz değişken ĠliĢki ĠliĢkinin sonucu Ders çalıĢma Ders çalıĢtıkça baĢarı artar, çalıĢmadıkça düĢer. Doğrusa l (+) iliĢki Yorgunluk arttıkça baĢarı düĢer, azaldıkça baĢarı artar Ters yönlü (-) iliĢki Meyve suyu içme alıĢkanlığı olanlar ile olmayanların baĢarısı arasında bir farklılık yok. ĠliĢkisiz (0) nötr iliĢki ile baĢarı arasındaki Öğrencinin boy uzunluğu: 167,8→Bir boy listesi iliĢki yapacaksak, virgülden sonra 0,5‟in altını bir alta, Yorgunluk ile üstünü bir üst puana tamamlarsak, baĢarı öğrencinin boy uzunluğu: 167,8‟den 168 olur. (Yu- arasındaki varladık-süreksizleĢtirdik.) iliĢki Yapay süreksiz değişken Meyve suyu içme alıĢkanlığı ile Korelasyon: baĢarı Ġki veya daha fazla değiĢken arasındaki iliĢkilerin arasındaki sayısal ifadelerle gösterilmesini sağlayan istatistik- iliĢki sel tekniktir. DeğiĢkenler arasındaki iliĢkiyi ortaya koyan sayısal değer ise, korelasyon katsayısı olarak ifade edilir. 61 Korelas yon Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Örnek: y AĢağıdaki korelasyon katsayılarına göre en yüksek iliĢki hangi değiĢkenler arasındadır? A-B DeğiĢkenleri korelasyonu: 0,5 C-Z DeğiĢkenleri korelasyonu: 0,3 K-L DeğiĢkenleri korelasyonu: -0,6 Çözüm: En yüksek iliĢki, K-L değiĢkenleri arasındadır. x DüĢük pozitif korelasyon DeğiĢkenler arasındaki iliĢkilerin (korelasyonun) grafiksel ifadeleri ise aĢağıda gösterilmiĢtir: y y x x Yüksek negatif korelasyon Sıfır (nört) korelasyon (ĠliĢkisizlik) y x DüĢük negatif korelasyon y x Yüksek pozitif korelasyon 62 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net DeğiĢkenlerin, sütunlar halinde koordinat eksenine GRAFĠK TÜRLERĠ VE YORUMLANMASI yerleĢtirilmesiyle oluĢur. X ekseninde puanların frekansı, Y ekseninde ise, gruplanmıĢ verilerin alt sı- Bir grubun baĢarısı ile ilgili değerlendirme yapıl- nırları yazılır. Daha sonra Y eksenindeki bölümler masında, grubun elde ettiği puanların bir bütün ola- üzerine, o aralığın frekansı yüksekliğinde sütunlar rak değerlendirip yorumlanması gerekir. Bunu sağ- yerleĢtirilir. layabilmek amacıyla frekans dağılımının yorumlan- Sütun grafiklerde her sütunun alanının büyüklüğü, masından yararlanılır. Frekans dağılımının yorum- o aralığın frekans büyüklüğü ile doğru orantıldır. lanması ise bağıl değiĢkenlik katsayısının hesaplanması ya da çarpıklık (kayıĢıklık) yardımıyla gerçek- Frekans leĢtirilebilir. 10 9 8 Grafiklerin Okunması ve Yorumlanması: 7 Verilerin (puan dağılımlarının) yorumlanmasında 6 yararlanılan bir diğer yöntem ise grafiklerden yarar- 5 4 lanarak, grafikler üzerinden değerlendirme ve yo- 3 rumlama yapmaktır. Bu nedenle önce, grafikleri ta- 2 nımamız ve nasıl oluĢtuklarını bilmemiz gerekmek- 1 0 tedir. 10 20 30 40 50 60 70 80 90 100 Puanlar ġekil: Sütun (Bar) Grafiği Örneği 1. Çizgi grafikler: Çizgi grafiklerle, birbirinden bağımsız değiĢkenler gösterilebilir ve bu değiĢkenler arasında kıyaslama 3. Toplamlı (Yığmalı) Frekans Grafiği: yapılabilir. Toplamlı grafiğin çizimi, çizgi grafik ve sütun gra- Bu tür grafiklerde, X ekseni frekansı, yani tekrar fiklerden farklıdır. Y ekseninde diğer grafiklerde eden puan sayısını, Y ekseni ise puanları gösterir. puanların tekrar sayılarından yani frekanslardan Hangi puanın kaç kez tekrarlandığı yani frekans oluĢurken, toplamlı grafiklerde yığmalı frekanslardan noktası bulunur ve daha sonra bu noktalar çizgi ile oluĢur. Bu nedenle Y ekseni, toplam frekans miktarı birleĢtirilir. dikkate alınarak belirlenir. Y ekseni ise gruplanmıĢ veriler için aralıkların üst sınırlarıdır. Frekans 10 Daha sonra, her aralıktaki toplamlı frekansa göre 9 kesiĢme noktaları belirlenerek, noktalar çizgi ile 8 birleĢtirilir. 7 Yüzde Frekans 6 5 4 3 2 1 0 0 10 20 30 40 50 60 70 80 90 100 Puanlar ġekil: Çizgi Grafik Örneği. 50 100 45 90 40 80 35 70 30 60 25 50 20 40 15 30 10 20 5 10 0 2. Sütun Grafik (Bar Grafiği): Sütun grafikler, genellikle birbirinden bağımsız 10 20 30 40 50 60 70 80 90 100 Puanlar ġekil: Toplamlı (Yığmalı) Frekans Grafiği değiĢkenler için kullanılır. 63 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net MERKEZĠ EĞĠLĠM (YIĞILMA-VASAT) Tabloda da görüldüğü gibi tekrar sayısı en yük- ÖLÇÜLERĠ sek olan puan 7‟dir ve 4 kez tekrarlanmıĢtır. Dolayısıyla dağılımın modu 7‟dir. Puan dağılımında, elde edilen puanların hangi puan etrafında yoğunlaĢtığı hakkında bilgi veren Eğer verilen değerler gruplanmıĢ değerler ise eğilim (yığılma) ölçüleridir. mod, frekansı en yüksek olan veri satırının orta noktası olarak alınır. 1. Mod (Tepe Değer) Merkezi Eğilim Ölçüleri (YığılmaVasat Ölçüleri) 2. Medyan (Ortanca) 3. Aritmetik Ortalama Örnek: 4. Ağırlıklı Ortalama AĢağıdaki puan dağılımının modu kaçtır? Puanlar (x) Frekans (f) 82-90 2 1. MOD (TEPE DEĞER) 73-81 64-72 4 3 Bir ölçme iĢleminde en fazla tekrar edilen (frekansı en yüksek olan) değer, o puan dağılımının 55-63 46-54 4 2 modu (tepe değeri) olarak kabul edilir. Mod, aritme- 37-45 2 tik ortalama ve medyan gibi ayrıntılı bir eğilim ölçüsü değildir. Bir baĢka deyiĢle ortalamanın kabaca bu- Çözüm: lunmasını ifade eder. Yukarıdaki puan dağılımı incelendiğinde frekansı Bir puan dağılımında birden fazla mod bulunabilir. en yüksek olan iki veri satırı olduğu ve ikisinin de Eğer birden fazla puan aynı sayıda tekrarlanmıĢ ise, frekansının 4 olduğu görülmektedir. Öncelikle bu yani frekansları aynı ise, bu dağılımın iki veya daha puan dağılımında iki mod bulunduğu söylenebilir. fazla modlu olduğu söylenir. Ancak; veriler gruplandırılmıĢ verilerden oluĢmaktadır. Bu nedenle mod satırlarındaki verilerin orta Mod, daha çok sınıflama ölçeğindeki veriler için noktalarının bulunarak, elde edilen rakamlar mod uygun bir eğilim ölçüsüdür. olarak açıklanmalıdır. Bir puan dağılımında modun bulunması, aritmetik ortalama ve medyanın bulunmasından çok daha ko- 1. mod satırı: 73-81, Orta Nokta: 76, laydır. 2. mod satırı: 55-63, Orta Nokta: 59 Dağılımın modu iki tanedir ve 76 ve 59‟dur. Örnek: 13 öğrencinin katıldığı matematik sınavında elde Eğilim ölçüleriyle ilgili istatistiki iĢlemlerde en iĢlevsel ve sonuçlarından en iyi Ģekilde yararlanılabileni aritmetik ortalama, daha sonra ortanca ve sonra da mod’dur. edilen puanlar aĢağıdadır. Bu dağılımın modu kaçtır? 8, 7, 5, 8, 6, 4, 7, 5, 7, 3, 2, 7, 9 Çözüm: Öncelikle grup sıralanmalıdır. 2. MEDYAN (ORTANCA) (Mdn) 2, 3, 4, 5, 5, 6, 7, 7, 7, 7, 8, 8, 9 Puanlar (X) 2 3 4 5 6 7 8 9 Tekrar Sayısı (Frekans) 1 1 1 2 1 4 2 1 Merkezi eğilim (merkeze yığılma) ölçülerinin bir diğeridir. SıralanmıĢ bir veri grubunu tam ortadan bölen, veri grubunun tam ortasında yer alan puan, bu veri grubunun medyanı (ortancası) olarak kabul edilir. Ölçüm sayısının tek olmasına, çift olmasına veya puanların tekrarlı olmasına göre medyanın hesaplanma Ģekli de değiĢmektedir. 64 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Tek sayılı ölçümlerde medyanın hesaplanması: Verilerin tekrarlı olması durumunda ortancanın Grubu tam ortadan ikiye bölen sayı medyan olarak (medyanın) hesaplanması: Elde edilen puanlar her kabul edilir. Ancak, öncelikle veriler karıĢık verilmiĢ- zaman birer tane olmayabilir. Bazı puanlar tekrarlı se sıralanması gerekir. (frekansı birden fazla) olabilir. Bu durumda dağılımın medyanı aĢağıdaki formül yardımıyla buluna- Örnek: bilir. 9 kiĢilik bir sınıfta Türkçe dersinde alınan puanlar 22, 44, 46, 78, 89, 54, 66,33, 50 dir. Dağılımın medyanı (ortancası) kaçtır? Puanlar Alt-üst Frekans Yığmalı (x) sınırlar (f) Frekans (tf) 82-90 81,5-90,5 2 20 73-81 72,5-81,5 4 18 64-72 63,5-72,5 7 14 55-63 54,5-63,5 3 7 46-54 45,5-54,5 2 4 37-45 36,5-45,5 2 2 N/2 – ayf Mdn= A.S.+a F A.S. : Medyanın bulunduğu puan aralığının alt sınırı a : Aralık katsayısı N : Veri sayısı ayf : Medyan satırının altındaki satırın yığmalı frekansı f : Ortancanın bulunduğu satırın frekansı 20 Çözüm: 22, 33, 44, 46, 50, 54, 66, 78, 89. n= 9 Örnek: Grubu tam ortadan ikiye bölen (n+1)/2 sayının AĢağıdaki tabloda 20 kiĢilik bir sınıfta uygulanan bulunması gerekir. sınavda Yani; (9+1)/2 = 5 Alttan ve üstten 5. sayı medyan (ortanca) dır. Mdn = 50 edilen veriler gruplandırılarak Çözüm; Öncelikle tablodaki gibi verilerin alt-üst sınırlarının Çift sayılı ölçümlerde medyanın bulunması: Öl- bulunması gerekir. Her aralığın alt sınırı alt puanın çüm (veri) sayısının çift olması durumunda grubu 0,5 eksiği, üst sınırı ise üst puanın 0,5 fazlasıdır. ortadan ikiye bölen tek sayı olmayacak, iki veri or- Öncelikle N/2 bulunmalıdır. taya çıkacaktır. Bu durumda yapılması gereken Ģey N/2 = 20 / 2 = 10 ise iki verinin ortalamasını almaktır. Elde edilecek Yani tahmini medyan satırı, 10. puanın bulunduğu puan, dağılımın medyanı (ortancası) kabul edilir. satırdır. (64-72 aralığındadır) Örnek: Çözüm: 10 kiĢilik bir gruba uygulanan testte; 22, 54, 65, 44, 90, 66, 70, 75, 45, 50 puanlar elde edilmiĢtir. A.S. : 63,5 a :9 N : 40 ayf : 7 Puan dağılımının medyanı kaçtır? Çözüm: 22, 44, 45, 50, 54, 65, 66, 70, 75, 90. n= 10 elde verilmiĢtir. Bu dağılımın medyanı kaçtır? f n/2 = 10/2 = 5 BaĢtan ve sondan sayıldığında grupta 2 tane 5. 20/2 – 7 Mdn= 63,5+9 7 Mdn= 67,37 :7 Medyan, grubu tam ortadan ikiye ayıran sayıyı, sayı vardır. (54 ve 65) yani % 50‟yi ifade etmektedir. Ġstenildiği taktirde Bu durumda; diğer yüzdelikler de hesaplanabilir. Mdn= (54+65) / 2 = 59,5‟tir 65 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net 3. ARĠTMETĠK ORTALAMA (X) Frekans: Hangi puanın, kaç kez tekrarlandığını, kaç öğrenci tarafından alındığını ifade eder. Merkezi eğilim ölçüleri içerisinde en istikrarlı olan ortalamadır. Puanlar (x) Frekans (f) x.f Elde edilen ölçümlerin toplamının, ölçüm sayısına 90 2 180 bölünmesiyle elde edilir. Bir sınav örnek alındığında, 80 2 160 öğrencilerin sınavda aldıkları puanların toplamının, 76 2 152 öğrenci sayısına bölümü, o sınavın aritmetik ortala- 66 3 198 masını ortaya koyar. 65 4 260 55 3 165 45 2 90 40 2 80 20 1285 Bir testin aritmetik ortalaması en basit haliyle aĢağıdaki gibi hesaplanır: Teste katılan öğrencilerin puanlarının toplamı (X) = Teste katılan öğrenci sayısı Görüldüğü gibi, frekanslar belirlendikten sonra, Örnek: alınan her puan kendi frekansı ile çarpılarak elde Bir sınıftaki 7 öğrencinin Tarih sınavında elde edilen veriler toplanmıĢtır. ettikleri puanlar 50, 65, 55, 45, 40, 80, 35‟tir. O halde yapılması gereken Ģey, elde edilen puan Uygulanan sınavda ortaya çıkacak aritmetik orta- toplamının, frekans toplamına (öğrenci sayısına) lama kaçtır? bölünmesidir. Yani; Puanların Toplamı Σfx = 1285 Çözüm: 50 + 65 + 55 + 45 + 40 + 80 + 35 (X) = 7 (X) = 52,86 Frekans Topamı 1285 X= Bu sınavın 100‟lük puan sisteminde yapıldığı dü- Bu iĢlemi formüle edecek olursak; Σfx ortalama öğrenme düzeyinin veya grubun mutlak X= baĢarı düzeyinin orta düzeyde olduğu söylenebilir. n Aritmetik Ortalama, küçük veri gruplarında kolayca hesaplanabilmektedir. Ancak veri sayısının fazla ol- Bir baĢka deyiĢle aritmetik ortalama; puanların ması durumunda farklı veri gruplamaları yapılarak frekanslarla çarpımlarının toplamının, puan sayısına iĢlem yapılması gerekir. bölümüyle elde edilir. Büyük gruplarla yapılan ölçme iĢlemlerinde elde Örnek: edilen veriler genellikle gruplanmıĢ verilerden oluĢ- 20 kiĢilik bir sınıfta yapılan Matematik sına-vında maktadır. Veriler belli bir aralık katsayısına göre alınan puanlar aĢağıda verilmiĢtir. gruplandırılarak yine frekans tablosu oluĢturulur. 40, 65, 66, 65, 76, 76, 45, 65, 55, 45, 80, 90, 55, Ancak, puanlar belli bir aralıkta verilmiĢ olması ne- 65, 66, 66, 80, 90, 55, 40. Matematik = 64,25 20 Ģünülürse, aritmetik ortalamanın 50 ye yakın olması, Bu n = 20 sınavının aritmetik deniyle, yapılması gereken ilk iĢ, veri gruplarının ortalaması orta noktasının bulunmasıdır. kaçtır? Veri gruplarının orta noktaları bulunduktan sonra yapılması gereken iĢlem ise, orta nokta puanlarının Çözüm: yine frekanslarla çarpılarak elde edilen puanların Böyle bir durum karĢısında yapılması gereken ilk toplamının veri sayısına yani frekans toplamına bö- Ģey; bir frekans tablosu oluĢturmaktır. lünmesidir. 66 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Aralık Katsayısı (a): Verilerin gruplanmasında Örnek: belirlenen puan aralıklarını ifade eder. Her zaman Serap‟ın yılsonu ders notları aĢağıda verilmiĢtir. tek sayılardan oluĢur. Serap‟ın ağırlıklı yılsonu notu (sınıf geçme puanı) kaçtır? Örnek: Bir önceki örnekteki puanların gruplandırılmıĢ ve- Ders Puan rilere dönüĢtürülmüĢ hali aĢağıdaki tabloda veril- Ders Saati miĢtir. Bu verilerden yararlanarak aritmetik ortalama Tarih 60 3 nasıl bulunabilir? Coğrafya 90 1 Matematik 55 4 Müzik 90 1 Resim 100 1 Puanlar (x) Orta Frekans x.f Nokta (f) 82-90 86 2 172 73-81 77 4 308 64-72 68 7 476 55-63 59 3 177 46-54 50 2 100 37-45 41 2 82 20 1315 Çözüm: Çözüm: Ders Puan Tarih 60 3 180 Coğrafya 90 1 90 Matematik 55 4 220 Müzik 90 1 90 Resim 100 1 100 10 680 Verilerin orta noktaları bulunarak frekanslar ile çarpımı sonucu elde edilen toplamın Ders Puan x Ders Saati Saati frekans toplamına bölümü, aritmetik ortalamayı vermektedir. 680 1315 X= Ağırlıklı Ortalama = = 65,75 20 4. AĞIRLIKLI ORTALAMA Bazı durumlarda, bazı ölçüm değerlerinin ağırlığının, diğer değerlerden daha fazla olması gerekebilir. ĠĢte bu, farklı ağırlık dereceleri verilerek hesaplanan ortalamalara ise ağırlıklı ortalama denir. Örneğin; okullarımızda yılsonu her dersin hesaplanırken = 68 10 bir baĢarı notu notları doğrudan toplanarak ders sayısına bölünmez. Her dersin puanı, kendi haftalık ders saati ile çarpılarak elde edilen puanların toplamı alınır ve haftalık toplam ders saatine bölünerek ağırlıklı yılsonu ortalaması hesaplanır. 67 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net MERKEZĠ DEĞĠġĠM (YAYILMA) ÖLÇÜLERĠ 3. STANDART SAPMA (KAYMA) Elde edilen verilerin (ölçümlerin), ortalamadan ne Ölçme iĢlemi sonucunda elde edilen puanların, kadar uzaklara yayıldığını veya puanların homojen- puan dağılımının aritmetik ortalamasından uzaklıkla- liğini belirlemek amacıyla kulanılan istatistiki teknik- rını (farklılıklarını) ifade eder. Puanların ve grubun lerdir. homojenliğini ortaya koyar. Aritmetik ortalama her ne kadar grubun baĢarısını ortaya koysa da, arit- 1. Ranj (Dizi GeniĢliği) metik ortalama grubun homojenliği hakkında bilgi 2. Çeyrek Sapma vermez. (Kayma) Merkezi DeğiĢim 3. Standart Sapma Ölçüleri (Yayılma- (Kayma) Dağılma Ölçüleri) 4. Varyans Örnek; AĢağıda, 8 kiĢilik bir sınıfta uygulanan Fen Bilgisi ve Matematik sınavlarına ait puanlar verilmiĢtir. 5. Bağıl DeğiĢkenlik Katsayısı Dersler Puanlar x 6. Çarpıklık Katsayısı Fen Bilgisi 7 5 6 4 6 7 7 6 6 7. Basıklık Katsayısı Matematik 2 9 9 3 1 7 4 10 6 Her iki dersin aritmetik ortalaması da 6‟dır. Bu 1. RANJ (DĠZĠ GENĠġLĠĞĠ) derslerde grubun öğrenme düzeyi ortalama olarak birbirinin aynısıdır. Ancak; grubun her iki dersten Ranj (Dizi GeniĢliği), test puanlarının analizi baĢlı- aldığı puanların dağılımı, yani aritmetik ortalamadan ğı altında açıklanmıĢtı. Merkezi değiĢim ölçülerinden uzaklığı birbirinden farklıdır. birisi olan ranjın tanımını bu bölümde de kısaca tek- Fen bilgisi dersinde alınan puanlar 4 ile 7 ara- rarlayalım. sında değiĢmektedir, yani öğrencilerin çoğunluğu Ölçme iĢlemi sonucunda elde edilen puan dizisin- aritmetik ortalamaya yakın puanlar almıĢtır. Mate- deki en yüksek değer ile en küçük değer arasındaki matik dersinde ise aritmetik ortalama yine 6 olma- fark ranj (dizi geniĢliği) olarak tanımlanmaktadır. sına rağmen öğrencilerin 1 ile 10 puan arasında puanlar aldıkları, öğrencilerin çoğunluğunun aldığı Örnek: Yapılan bir sınavda en yüksek puanı alan puanların aritmetik ortalamadan uzak olduğu görül- öğrenci 95, en düĢük puanı alan öğrenci ise 30 mektedir. Hatta aritmetik ortalama olan 6 puanı alan almıĢ ise bu dağılımın ranjı; 95-30 = 65‟tir. hiçbir öğrenci olmamıĢtır. ĠĢte standart sapma, bu puanların aritmetik ortalamadan uzaklıklarını, elde edilen puanların bir birin- 2. ÇEYREK SAPMA (Q) den ne kadar farklılaĢtığını, grubun bir bütün olarak baĢarılı olup olmadığını, yani grubun homojenliğini Çeyrek sapma, puan dağılımının iki ucunda bulu- belirlemeye yarayan bir değiĢim (yayılma) ölçüsü- nan % 25‟lik bölümler dikkate alınmadan hesaplanır. dür. Birinci çeyrek (% 25) Q1, ikinci çeyrek ise (% 75) Q3 Ġstatistiki iĢlem olarak standart sapma; her öğren- ile gösterilir. Çeyrek sapma aĢağıdaki formül kulla- cinin puanının aritmetik ortalamadan farkının bulu- nılarak hesaplanır. narak bu farkın karelerinin hesaplanması, daha sonra da bu karelerin toplanarak öğrenci sayısına bölünüp puanların varyansının elde edilmesi, son ola- (Y75 – Y25) rak da puanların varyansının kare kökünün alınma- Q= sıyla da bulunabilir. 2 68 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net 2 Buradan da anlaĢılacağı üzere standart sapma, 4. VARYANS (S ) varyansın kareköküne eĢittir. Yani; varyansı 0,25 olan bir puan dağılımının standart sapması 0,5 tir. Bir dizi puanın varyansı, o dizideki değiĢkenliğin bir ölçüsüdür. Standart sapmanın karesine eĢittir. Standart sapmanın hesaplanmasında aĢağıdaki (X – X) formülden yararlanılır: 2 2 S = N-1 (X – X) S= 2 Eleman sayısı 30‟dan büyükse N-1, 30‟a kadar N–1 ise N sayısına bölünür. Standart sapmanın hesaplanmasında aĢağıdaki Örnek: aĢamalar izlenir: Bir önceki örnekteki verilerin varyansı; Dağılımın aritmetik ortalamasının bulunması, Her ölçümün aritmetik ortalamadan farkının 2 32 S = bulunması, = 4,57 7 Farkların karelerinin alınarak toplanması, Bulunan toplamın öğrenci sayısının bir eksi5. BAĞIL DEĞĠġKENLĠK KATSAYISI ğine (N-1) bölünmesi. (Eleman sayısı 30‟dan büyükse N-1, 30‟a kadar ise N sayısına bö- Öğrencilerin katıldığı testlerin ve sınavların nite- lünür.) likleri ve iĢlemleri her zaman aynı değildir ve farklı- Ortaya çıkan sonucun karekökünün alınması, lıklar gösterebilir. Aynı grubun katıldığı iki farklı ölçme iĢlemindeki Örnek: değiĢkenliği, bağıl değiĢkenlik katsayısı hesaplana- 7 kiĢinin Matematik sınavından aldıkları puanlar; 4, 7, 5, 8, 5, 6 ve 7‟dir. Bu ölçüm sonuçlarına göre rak karĢılaĢtırılabilir. Bağıl değiĢkenlik katsayısını hesaplamak için dağılımın standart sapması kaçtır? aĢağıdaki formül kullanılır. Çözüm: V = (Sx X) .100 Puanlar (x) (x – x) (x – x)² 2 -4 16 Bağıl değiĢkenlik katsayısının 20‟nin altında çık- 5 -1 1 ması durumunda grubun homojen, 20-25 aralığında 5 -1 1 çıkması durumunda grubun normal dağılımda, 25‟in 6 0 0 üzerinde çıkması durumunda ise heterojen olduğu 7 1 1 söylenebilir. 8 2 4 Bağıl değiĢkenlik katsayısı daha yüksek olan ders 9 3 9 veya test puanlarının daha fazla değiĢkenlik gös- (x – x)² = 32 terdiği, düĢük olan ders veya test için ise puanların x=42 daha az değiĢkenlik gösterdiği söylenebilir. 1. N= 7 2. (x) = 6 3. (x – x)² = 32 soruluk testin aritmetik ortalaması 60, standart sapması 12, Ġngilizce dersinde uygulanan 60 soruluk 32 7 S= S Örnek: 8/A sınıfının Matematik dersinde uygulanan 40 testin aritmetik ortalaması 50, standart sapması ise 5‟tir. Hangi derste puanlar daha fazla değiĢkenlik 2,14 göstermektedir? 69 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Çözüm: masın da, mod, medyan ve aritmetik ortalamanın birbirleriyle olan konumundan yararlanılır. Soru Aritmetik Sayısı Ders Ortalama Aritmetik ortalamanın veya modun medyandan Standart büyük, küçük veya eĢit olma durumları, grafikteki Sapma Matematik 40 60 12 puanların dağılımı hakkında yorum yapabilmemizi Ġngilizce 60 50 5 sağlar. VM = (12 60) . 100 = 20 VĠ = (5 50) . 100 = 10 a. Normal Dağılım: Aritmetik ortalama, mod ve medyanın birbirine Bağıl değiĢkenlik oranı yüksek olan Matematik eĢit olduğu dağılımlardır. Dağılımda herhangi bir dersinde puanlar, bağıl değiĢkenlik oranı düĢük olan çarpıklık veya kayıĢıklık yoktur Bu nedenle dağılıma Ġngilizce dersine göre daha fazla değiĢkenlik gös- simetrik dağılım, nötr kayıĢıklı (0 kayıĢıklı) dağılım termektedir. gibi isimler verilir. Görünüm tam bir çan eğrisi görünümündedir. Böyle bir dağılımda, baĢarı seviyesinin normal düzeyde olduğu, soruların öğrencilere normal geldiği, soruların güçlük derecelerinin orta 6. ÇARPIKLIK KATSAYISI düzeyde olduğu söylenebilir. Çarpıklık: Bir testten elde edilen puanların ortalaması, ortancası ve standart sapması, o dağılımın Frekans çarpıklığı hakkında bilgi verir. Çarpıklık Ölçüsü ÇK 3 (Ortalama – Ortanca) = Standart Sapma Çarpıklık değeri, testin güçlük düzeyini ortaya ko- Puanlar mod = mdn = X yar. Çarpıklık Katsayısı ġekil: Normal Dağılım Grafiği Testin Güçlük Düzeyi Negatif Kolay Pozitif Zor 0,10‟dan küçük Hafif zor 0,10-0,25 arası Orta güçlükte 0,25‟ten büyük b. Sağa Çarpık Dağılım: Aritmetik ortalamanın, mod ve medyandan büyük, modun ise en küçük olduğu dağılımlardır. Puanların Çok zor büyük bir bölümü dağılımın sol tarafına yığılmıĢtır. Puanlar, koordinat sisteminin eksi yönüne yığılıp, Örnek: Aritmetik ortalaması 41, ortancası 43 ve artı yönde bir açıklık olduğu için sağa çarpık dağı- standart sapması 7 olan bir sınavın güçlük düzeyi lımlara pozitif kayıĢlı dağılımlar da denir. için ne söylenebilir? Çözüm: ÇK = Puanların sol tarafa yığılmıĢ olması, genellikle çarpıklığın yönünü açıklamada yanılgılar yaratmaktadır. 3.(41 – 43) Zihinsel olarak bilginin kalıcı olmasını sağlayabilmek = - 0,86 7 Çarpıklık katsayısının negatif olması, sınavın ko- için, puanların büyük bir bölümü sağa kaydığı için, sol tarafın açıkta kaldığı, grafiğin sol tarafının çarpık lay olduğu veya öğrencilerin baĢarılı olduğu sonu- olduğunu düĢünmek gerekir. cunu ortaya koyar. Bir puan dağılımının grafiğini inceleyerek, grafiği oluĢturan puanların dağılımı ile ilgili bazı yorumlar yapılabilir. Bu yorumların yapıl- 70 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net yüksek puanlar almıĢtır. Sınıfın öğrenme düzeyi yüksektir, konular büyük oranda öğrenilmiĢtir. Eği- Frekans tim-öğretim etkinlikleri, hedeflerin kazandırılmasında etkili olmuĢtur. Sorular öğrencilere kolay gelmiĢtir veya soruların güçlük derecesi düĢüktür. Bazı durumlarda puan dağılımlarının iki modu olabilir. Bu durumda aritmetik ortalama iki modun arasındadır. Medyan ise, iki moddan birisi ile aritmetik mod mdn X ortalama arasındadır. Puanlar ġekil: Sağa Çarpık Dağılım Grafiği Frekans Sağa çarpık grafikler için yapılabilecek yorum ise; öğrencilerin büyük bir bölümünün bu sınavda baĢarısız olduğu, sınavın öğrencilere zor geldiği, öğrencilerin öğrenme düzeylerinin düĢük olduğu, soruların güçlük derecelerinin yüksek olduğu ve öğrenme-öğretme etkinliklerinin bu dersin öğretimi için yeterli olmayabileceğidir. mod c. Sola Çarpık Dağılım: X mod Puanlar Çift modlu dağılım Aritmetik ortalamanın mod ve medyandan küçük olduğu, medyanın en büyük olduğu dağılımlardır. Puanların büyük bir bölümü dağılımın sağ tarafına 7. BASIKLIK KATSAYISI yığılmıĢtır. Puanlar, koordinat sisteminin artı yönüne yığılıp, eksi yönünde bir açıklık, çarpıklık yarattığı Bir dağılım hakkında bilgi veren özelliklerden biri için bu tür çarpık dağılımlara negatif kayıĢlı dağı- de basıklıktır. Çarpıklık katsayısına benzer Ģekilde, lımlar da denir. bu katsayı da negatif veya pozitif değerler alabilir. Sonuç negatif ise; dağılım normalden daha basık, Frekans pozitif ise; normalden daha sivridir. Sıfır olması halinde ise dağılım normale yakın veya normaldir. Bir dağılımın basıklık katsayısı aĢağıdaki formülle hesaplanır. 4 (X – X) / n BK = 4 S X mdn mod Puanlar ġekil: Sola Çarpık Dağılım Grafiği Sola çarpık puan dağılımları için Ģu yorumlar yapılabilir; Puanların büyük bir bölümü artı yönde toplanmıĢtır. Öğrencilerin büyük bir bölümü bu sınavdan 71 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net ÖZET TABLO TEST VE MADDE ANALĠZĠ / 1 Test Hazırlama AĢamaları 1. 2. 3. 4. Hazırlanacak olan testin amacı Testin kapsamı (DavranıĢların belirlenmesi) Konuların belirlenmesi-Belirtke tablosunun hazırlanması Madde türünün seçimi ve yazımı 5. 6. 7. 8. 9. 10. Madde düzeltme Testin düzenlenmesine iliĢkin ilkeler Testin düzenlenmesi Testin denenmesi Testin uygulanması Testin puanlanması Madde Güçlük Ġndeksi: Test maddelerinin (soruların) zorluk veya kolaylığı hakkında fikir verir. Bir testteki herhangi bir maddeye verilen doğru cevapların sayısının, testi alan tüm öğrenci sayısına oranı, o soru maddesinin güçlük derecesini gösterir. Madde Ayırtedicilik Ġndeksi: Test maddesinin (sorunun) bilen veya bilmeyen öğrenciyi ayırt edip etmediğini gösterir. Ayırt ediciliği belirleyebilmek için, o testten yüksek puan alan Madde Analizi öğrenciler ile düĢük puan alan öğrencilerin, bu soruya verdiği yanıtları incelemek gerekir. Madde Varyansı: Soruya doğru yanıt verenlerin oranı ile, doğru yanıt veremeyenlerin oranının çarpımı ile elde edilir. 0,00 ile 0,25 arasında değer alır. Madde Standart Sapması: Madde varyansının kareköküne eĢittir. Sorunun güvenirliğinin hesaplanmasında kullanılır. Madde Güvenirliği: Madde ayırt edicilik indeksi ile madde standart sapmasının çarpımı ile elde edilir. Güvenirlik indekslerinin toplamı, testin standart sapmasını verir. Ayırıcılık gücü ve sapma arttıkça, güvenirlik artar. ÖZET TABLO TEST VE MADDE ANALĠZĠ / 2 DeğiĢken Bağımlı ve Bağımsız DeğiĢkenler Nicel ve Nitel DeğiĢkenler Gözlemden gözleme farklı değerler alabilen özelliklere değiĢken denir. Bağımlı DeğiĢken: Bağımsız değiĢkenin etkisinin incelendiği, kontrol edilemeyen, bağımsız değiĢkenin durumuna bağlı olarak değiĢim gösteren değiĢkenlerdir. Bağımsız DeğiĢken: Bir iliĢkinin sonucunu etkileyen, araĢtırmada kontrol altında tutulan ve farklı değiĢiklikler yapılabilen değiĢkenlerdir. Nicel DeğiĢken: Gözlenen değiĢkenin sayısal sembollerle ifade edilmesidir. Nitel DeğiĢken: Bazı özellikler tür veya kalite yönünden değiĢkenlik gösterirler. Bu özelliklere sayılar yerine semboller veya sıfatlar karĢı getirilebilir. Sürekli ve Süreksiz DeğiĢkenler Sürekli DeğiĢken: Herhangi iki değeri arasında sonsuz sayıda değer alabilen değiĢkenlerdir. Bu iki değer arasındaki değerler arasında süreklilik vardır. Süreksiz DeğiĢken: Tüm değerleri almayan, sınırlı değerler alabilen değiĢkenlerdir. Değerler arasında bir süreklilik yoktur. SüreksizleĢtirilmiĢ DeğiĢken: Aslında sürekli olmasına karĢın, yapay olarak süreksiz bir değiĢkene dönüĢtürülüp kodlanmıĢ değiĢkenlerdir. Korelasyon Ġki veya daha fazla değiĢken arasındaki iliĢkilerin sayısal ifadelerle gösterilmesini sağlayan istatistiksel tekniktir. 72 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net ÖZET TABLO TEST VE MADDE ANALĠZĠ / 3 Grafik Türleri Çizgi grafikler Sütun grafikler (bar grafiği) Toplamlı (Yığmalı) frekans grafiği Mod (Tepe değer): Bir ölçme iĢleminde en fazla tekrar edilen (frekansı en yüksek olan) değer, o puan dağılımının modunu oluĢturur. Ortalamanın kabaca bulunmasıdır. Bir dağılımda birden fazla mod bulunabilir. Medyan (Ortanca): SıralanmıĢ bir veri grubunu tam ortadan ikiye bölen, dağılımın tam ortasında Merkezi Eğilim (YığılmaVasat) Ölçüleri yer alan puan, o puan dağılımının medyanını oluĢturur. Tek sayılı ölçümlerde tam ortadaki puan medyandır. Çift sayılı ölçümlerde ise, ortada kalan iki puanın toplanarak ikiye bölünmesiyle elde edilir. Aritmetik Ortalama: Puanların toplamının, puan sayısına bölümü ile elde edilir. Merkezi eğilim ölçüleri içerisinde en istikrarlı olan ortalamadır. Ağırlıklı Ortalama: Bazı ölçüm değerlerinin ağırlığının, diğer değerlerden daha fazla olması gerektiği durumlarda kullanılır. Okullarda yılsonu baĢarı ortalamasının hesaplanması, üniversitede vize ve final puanlarının belli ağırlıklarıyla sınıf geçme puanlarının belirlenmesi gibi. Ranj (Dizi GeniĢliği): Bir puan dağılımındaki en yüksek değer ile en düĢük değer arasındaki farktır. Çeyrek Sapma: Puan dağılımının iki ucunda bulunan % 25‟lik bölümler dikkate alınmadan hesaplanır. Standart Sapma (Kayma): Puanların aritmetik ortalamadan uzaklıklarını ifade eder. Puanların veya grubun homojenliğini ortaya koyar. Varyans: Bir dizi puanın varyansı, o dizideki değiĢkenliğin ölçüsünü ifade eder. Standart Merkezi DeğiĢim (Yayılma) Ölçüleri sapmanın karesine eĢittir. Bağıl DeğiĢkenlik Katsayısı: Aynı grubun katıldığı farklı testlerdeki puan dağılımlarının farklılıklarını ortaya koyar. Bağıl değiĢkenlik katsayısı arttıkça puanların daha fazla değiĢkenlik gösterdiği söylenir. Çarpıklık Katsayısı: Testteki çarpıklığı ortaya koyar ve testin güçlük derecesi hakkında bilgi verir. Sonucun negatif olması testin kolay, pozitif olması ise zor olduğunu ifade eder. Normal dağılım : Aritmetik ortalama = Medyan = Mod Sağa çarpık dağılım: Aritmetik ortalama > Medyan >Mod Sola çarpık dağılım : Aritmetik ortalama < Medyan < Mod Basıklık Katsayısı: Basıklık katsayısı, puan dağılımının belli bir puanda yığıldığını mı yoksa farklı puanlara bir dağılım olduğunu mu ortaya koyar. Sonuç negatif ise dağılımın normalden daha basık, pozitif ise daha sivri, sıfır ise normal dağılım olduğu söylenir. 73 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net GeçmiĢ yıllarda bu konuyla ilgili sorulan bazı KPSS soruları (KPSS - 2002) Ölçme sonucunun hangi özelliği, ağırlıklı ortalama hesaplanırken bu ölçme sonucuna daha büyük ağırlık verilmesi için bir gerekçe olamaz? A) Geçerliğinin yüksek olması B) Daha önemli hedeflerle ilgili olması C) Kapsamının daha geniĢ olması D) KullanıĢlılığı yüksek bir testten elde edilmiĢ olması E) Standart hatasının küçük olması Yanıt: Geçerliği ve güvenirliki yüksek testlere ağırlık verilebilir. Ancak kullanıĢlılığı yüksek olduğu için bir teste ağırlık verilmez. Yanıt D’dir. (KPSS - 2002) Ölçme sonucunun hangi özelliği, ağırlıklı ortalama hesaplanırken bu ölçme sonucuna daha büyük ağırlık verilmesi için bir gerekçe olamaz? A) B) C) D) E) KullanıĢlığı yüksek bir testten elde edilmiĢ olması Standart hataların küçük olması Kapsamının daha geniĢ olması Daha önemli hedeflerle ilgili olması Geçerliğinin yüksek olması Yanıt: Ağırlıklı ortalama, hedeflerin önem derecesine, kapsamın geniĢliğine, standart hata oranına, geçerliğin yüksekliğine göre ölçme sonuçlarına belli katsayılar verilerek hesaplanır. Katsayı belirlemede, kullanılan ölçme aracının kullanıĢlılığı, belirleyici bir faktör değildir. Yanıt A’dır. (KPSS - 2003) AĢağıda, aynı değiĢkenle ilgili bir ölçümler dizisi ile ilgili dört tanım verilmiĢtir. I. En yüksek frekansa sahip olan değer II. Büyüklük sırasına konmuĢ ölçümler dizisinin tam ortasındaki değer III. Ölçümlerin toplamının ölçüm sayısına bölünmesiyle elde edilen değer IV. En büyük ölçüm ile küçük ölçüm arasındaki fark AĢağıdakilerden hangisi bu tanımlara karĢılık gelen kavramlar doğru olarak verilmiĢtir? A) I Medyan Mod II B) Medyan Ranj C) Ranj D) Mod Standart Sapma Medyan E) Mod Medyan III Standart Sapma Aritmetik Ortalama Aritmetik Ortalama Aritmetik Ortalama Standart Sapma IV Ranj Medyan Medyan Ranj Aritmetik Ortalama Yanıt: En yüksek frekans “mod”, puan dağılımının tam ortasındaki değer ”medyan”, ölçümlerin toplamının ölçüm sayısına bölümüyle elde edilen değer “aritmetik ortalama”, ölçme iĢlemindeki en yüksek puan ile en düĢük puan arasındaki fark ise “ranj” kavramları ile ifade edilir. Yanıt D’dir. 74 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net (KPSS – 2004) Yukarıdaki dağılımın mod’u kaçtır? A)10 B) 28 C) 30 D) 55 E) 60 Yanıt: Mod, bir dağılımda en fazla tekrarlanan (frekansı en yüksek olan) değerdir. Sorudaki dağılımın modu 55‟tir. Yanıt D’dir. (KPSS - 2004) Negatif korelasyon, değiĢkenlerden birnin değeri artarken diğerinin değerinde azalma olduğunu gösterir. Buna göre, aĢağıdakilerin hangisinde verilen iki değiĢken arasında hesaplanacak korelasyonunun negatif olması beklenir? A) Düzenli çalıĢma - baĢarı düzeyi B) Gelir düzeyi - satın alma gücü C) Ġlgi - olumlu tutum D) Zeka - yaratıcılık E) Yorulma - öğrenme hızı Yanıt: DeğiĢkenlerden birinin değeri artarken diğer değiĢkenin değerinin azaldığı, ters orantılı korelasyonlara negatif korelasyon denir. Yorgunluk arttıkça öğrenme hızı düĢer, yorgunluk azaldıkça öğrenme hızında artıĢ olur. Bu iki değiĢken arasındaki korelasyon negatif bir korelasyondur. Yanıt E’dir. (KPSS – 2006) Bir grup öğrencinin tarih, coğrafya, felsefe ve yabancı dil testlerinden aldıkları puanlar arasındaki korelasyonlar aĢağıdaki tabloda gösterilmiĢtir. DERS Tarih Coğrafya Felsefe Ġngilizce Tarih 1,00 0,60 0,85 - 0,35 Coğrafya 0,60 1,00 0,40 - 0,25 Felsefe 0,85 0,40 1,00 0,30 Ġngilizce - 0,35 - 0,25 0,30 1,00 Bu tablodaki bilgilere dayanarak aĢağıdaki sonuçlardan hangisine varılabilir? A) B) C) D) E) Yabancı dil testi en düĢük ortalamaya sahiptir Öğrenciler tarih ve coğrafya derslerinde çok baĢarısızdırlar. Felsefe ve yabancı dil testleri çok farklı özellikleri ölçmektedir. En yüksek iliĢki felsefe ile tarih puanları arasındadır. En düĢük iliĢki tarih ile yabancı dil puanları arasındadır. Yanıt: Korelasyon değerleri -1.00 ile +1.00 arasında değer alır. Korelasyon değeri +1.00‟a yaklaĢtıkça değiĢkenler arasında doğrusal ve yüksek bir iliĢkiyi, -1.00‟a yaklaĢtıkça ters orantılı ve yüksek bir iliĢkiyi, 0.00‟a yaklaĢtıkça değiĢkenler arasında iliĢkinin olmadığını ifade eder. Soruda, en yüksek iliĢki (0,85) Tarih ve Felsefe derslerindedir ve doğru orantılıdır. Yanıt D’dir. 75 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net (KPSS – 2005) Puan Grafikte I, II ve III numarayla gösterilen üç dağrlım için aĢağıdaki ifadelerden hangisi doğrudur? A) Ranj değerleri aynı, mod değerleri farklıdır. B) Ranj değerleri farklı, mod değerleri aynıdır. C) Ranj değerleri farklı, medyan değerleri aynıdır. D) Ranj ve mod değerleri aynıdır. E) Ranj ve medyan değerleri aynıdır. Yanıt: Grafikte verilen dağılımların her üçünde de ranj 10, I. dağılımda mod 5, II. dağılımda mod 15, III. dağılımda ise mod 25‟tir. Yanıt A’dır. (KPSS – 2007) AĢağıdaki sorular, grafiğe göre hesaplanacaktır. 5A sınıfındaki öğrencilerin 25 soruluk matematik testinden aldıkları puanlar gruplanarak aĢağıdaki frekans grafiğinde gösterilmiĢtir. 1. 5A sınıfının mevcudu kaçtır? A) 5 B) 7 C) 8 D) 20 E) 25 Yanıt: Grafik üzerinde öğrenci sayısını belirleyebilmek için, her puan dağılımının frekansının toplamları alınır. Grafikteki frekanslar, 2, 3, 5, 7 ve 3 tür. Frekansların toplamı ise 20‟dir. Yanıt D’dir. 2. 5A sınıfının matematik testi puanlarının aritmetik ortalaması kaçtır? A) 5,7 B) 7,4 C) 14,5 D) 18,6 E) 20 Yanıt: GruplanmıĢ verilerde aritmetik ortalama, grupların orta noktalarının frekanslarla çarpımlarının toplamlarının (∑fx), frekansların toplamına, yani öğrenci sayısına (n) bölümü ile bulunur. Sorudaki grafik üzerinde iĢlem yapıldığında aritmetik ortalama 14,5 olarak elde edilir. Yanıt C’dir. 3. 5A sınıfının matematik testi puanlarının tepe değeri (mod) kaçtır? A) 5 B) 7 C) 8 D) 18 E) 25 Yanıt: Mod, bir puan dağılımında frekansı en yüksek olan, en çok tekrarlanan, sınavda en fazla alınan puanı ifade eder. Sorudaki grafik incelendiğinde mod, 16-20 puan grubundadır. GruplanmıĢ verilerde orta nokta üzerinden iĢlem yapılacağından, mod 16-20 puan grubunun ortasında bulunan “18”dir. Yanıt D’dir. 76 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net (KPSS – 2008) Aynı öğrencilere uygulanan ve bağıl değerlendirme yapılan iki sınavla ilgili aritmetik ortalama ve standart sapma değerleri aĢağıda verilmiĢtir. Aditmetik Standart Ali’nin AyĢe’nin Sınav Ortalama Sapma Puanı Puanı I 55 15 70 ? II 60 5 ? 88 Buna göre, aĢağıdaki yorumlardan hangisi kesinlikle doğrudur? A) Ali birinci sınavdaki soruların hepsini doğru yanıtlamıĢtır. B) Ali ikinci sınavdan da 70 alırsa, ilk sınava göre daha baĢarısız olmuĢ olur. C) Birinci ve ikinci sınav sonuçları arasındaki korelasyon yüksektir. D) AyĢe‟nin ikinci sınavdaki baĢarısı Ali‟nin ilk sınavındaki baĢarısından daha iyidir. E) Kinci sınavda puanların ranjı ilk sınava göre daha büyüktür. Yanıt: A, B, C ve E seçeneklerindeki yorumlar için kesin olduğu söylenemez. Ancak z puanları hesaplandığında AyĢe‟nin ikinci sınavdaki z puanı 1,6, Ali‟nin birinci sınavdaki z puanı ise 1.00 dir. Yanıt D’dir. (KPSS – 2008) Bir testteki maddelere iliĢkin aĢağıdaki değerler elde edilmiĢtir. Maddeler I II III Madde güçlüğü 0,1 0,15 0,50 Madde Ayırıcılık Gücü 0,08 -0,15 0,5 IV 0,6 0,28 V 0,9 0,43 1. Tabloda verilen bölgilere göre, hangi maddenin güvenirliğe katkısı en yüksektir? A) I B) II C) III D) IV E) V Yanıt: Geçerliği ve güvenirliği en yüksek sorular, güçlük derecesi 0,50, ayırt ediciliği 0,40‟ın üzerinde olan sorulardır. Yanıt C’dir. 2. Yapılandırılacak bir testte bu maddeleri kullanma zorunluluğu olsaydı, en köklü değiĢikliğin hangi maddede yapılması gerekir? A) I B) II C) III D) IV E) V Yanıt: Ayırt ediciliği 0,19 ve altında olan soruların kesinlikte testte kullanılmaması gerekir. Bu nedenle en köklü değiĢikliğin, ayırt ediciliği en düĢük soru olan II soruda yapılması gerekir. Yanıt B’dir. (KPSS – 2009) Bir coğrafya öğretmeni 100 soruluk bir baĢarı testi uygulamıĢ ve test puanlarının ortalamasını 75, ortancasını 80, tepe değerini (mod) 90, standart sapmasını 8 ve ranjını 90 bulmuĢtur. Öğrencilerin dersten geçebilmeleri için en az 65 puan almaları gerekmektedir. Test puanlarına iliĢkin istatistiklere ve değerlendirme ölçütüne dayanarak bu dağılım için aĢağıdaki yorumlardan hangisi yapılamaz? A) B) C) D) E) Ölçümlerin yüzde elliden fazlası ortalamadan büyüktür. Merkezî eğilim ölçüsü olarak ortancadan yararlanılmalıdır. Sınıfın büyük çoğunluğu geçer not alır. Tepe değeri, gözlenen en büyük değerdir. Ortalamayı çarpıtan uç değer(ler) bulunmaktadır. Yanıt: Tepe değer, o sınavda en fazla tekrarlayan puandır. Standart sapma ile aritmetik ortalama iliĢkisi kurulduğunda, alınan en yüksek puanın 99 veya üzeri olması gerektiği görülür. Yanıt D’dir. 77 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Öğrenciler (KPSS – 2009) 10 soruluk bir sınava ait öğrenci yanıtları aĢağıdaki tabloda verilmiĢtir. Her soruda doğru yanıta “1”, yanlıĢ yanıta “0” puan verilmiĢtir. Yanıtlanmayan soru bulunmamaktadır. Sorular 1 2 3 4 5 6 7 8 9 10 A 1 1 1 0 0 1 1 0 1 0 B C 1 0 1 1 0 0 0 0 1 1 1 1 1 1 0 1 0 1 1 1 D E 1 0 1 0 1 1 0 0 1 0 0 0 1 1 1 1 1 1 0 0 F G 1 1 1 1 0 0 0 0 1 1 1 1 1 1 1 0 1 0 1 0 H I 1 1 1 1 0 1 0 0 1 0 1 0 1 1 0 0 0 0 1 1 J 0 0 0 0 0 1 1 1 0 0 1. Öğrencilerin bu sınavdan aldıkları puanların ranjı kaçtır? A) 3 B) 5 C) 6 D) 9 E) 10 Yanıt: Alınan en yüksek puan 8, en düĢük puan ise 3 olduğuna göre, ranj (8-3 = 5) tir. Yanıt B’dir. 2. Hangi sorular ölçülen özellikler açısından öğrencilerin bireysel farklılıklarını ortaya çıkarmada hiç etkili olmamıĢtır? A) Yalnız 4. soru D) 4. ve 7. sorular B) Yalnız 7. soru C) Yalnız 8. soru E) 4., 7. ve 8. sorular Yanıt: Bir test maddesinin öğrencileri ayırt etmemesi, sınıftaki hemen hemen herkes tarafından doğru yanıtlandığı veya hiç doğru yanıt verilmediği anlamına gelir. Bu soruda en fazla doğru yanıt verilen soru 7. soru, hiç doğru yanıtlanmayan soru ise 4. sorudur. Yanıt D’dir. (KPSS – 2010) Bir öğretmen sınavında yer alan beĢ maddenin niteliğini incelemek amacıyla öğrencilerin her bir maddeden aldıkları puanlar ile testin tümünden aldıkları puanlar arasındaki korelasyon katsayısını hesaplamıĢtır. Bilenle bilmeyeni en iyi ayırt eden maddeyi bu Ģekilde görebileceğini iddia eden öğretmen aĢağıdaki katsayıları elde etmiĢtir. Maddeler Korelasyon katsayısı; Madde Korelasyon katsayısı 1 0,2 2 -0,1 3 0,5 4 0,6 5 -0,7 Bu öğretmenin en iyi ayırt edici olduğunu iddia edeceği madde hangisidir? A) 1 B) 2 C) 3 D) 4 E) 5 Yanıt: Korelasyon katsayıları, -1 ile +1 arasında değer alır. Puanlar -1‟e ve +1‟e yaklaĢtıkça iliĢki yüksek, 0‟a yaklaĢtıkça düĢüktür. Bu durumda; öğretmenin elde ettiği katsayılara göre 4. Sorunun ayırt ediciliği daha yüksektir denilebilir. Çünkü, en yüksek doğrusal iliĢki 4. Soruda elde edilmiĢtir. 4. Soruyu doğru yanıtlayan öğrencilerin çoğunluğu yüksek puan almıĢtır. Ya da sınavda baĢarısız olan öğrencilerin çoğunluğu bu soruyu yanlıĢ yanıtlamıĢtır. 5. Maddede ise iliĢki yüksek ancak ters yönlüdür. Sınavda baĢarılı olan öğrencilerin çoğunluğu bu soruyu yanlıĢ iĢaretlemiĢ veya baĢarısız olan öğrencilerin çoğunluğu bu soruyu doğru iĢaretlemiĢtir. Yani soru bilenle bilmeyeni ayırt etmemiĢtir. Yanıt D’dir. 78 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net (KPSS – 2010) Altı maddelik bir sınavdan alınan puanlara ait frekans tablosu aĢağıda verilmiĢtir. Puan Frekans 1 2 2 10 3 5 4 5 4 3 6 2 Bu sanav kaç öğrenciye uygulanmıĢtır? A) 6 B) 10 C) 21 D) 26 E) 80 Yanıt: Frekanslar, alınan her bir puanın sayısını, dolayısıyla öğrenci sayısını verdiğinden, frekansların toplamı da sınava katılan öğrenci sayısını verir. Yanıt D’dir. (KPSS – 2011) Bir okuldaki bilim Ģenliğinde 11 Ģubenin yaptığı proje sayıları aĢağıdaki grafi kte verilmiĢtir. Buna göre, proje sayıları dağılımının ranjı kaçtır? A) 1 B) 3 C) 9 D) 10 E) 41 Yanıt: Ranj, bir ölçme iĢleminde elde edilen en yüksek değer ile en düĢük değer arasındaki farktır. Soruda 11 Ģube içerisinde en fazla projeyi M sınıfı (10 proje), en az projeyi ise B sınıfı (1 proje) yapmıĢtır. Dolayısıyla ranj; 10-1=9‟dur. Yanıt C’dir. (KPSS – 2011) Bir matematik öğretmeni aĢağıdaki çoktan seçmeli maddeyi sınavında kullanmıĢtır. Madde: Evren‟in ablası, Evren‟den 10 yaĢ büyüktür. 2 yıl sonra Evren‟in yaĢı ablasının yaĢının yarısı kadar olacaktır. Evren‟in ablası kaç yaĢındadır? A) 8 B) 10 C) 18 D) 20 E) 28 x 2 x 10 2 Evren‟ in yaĢı 8 ise ablasının yaĢı 18 dir. Cevap: C Evren‟in yaĢı x ise ablasının yaĢı x + 10‟dur. 1 ise; 2x+4=x+12 olur. Dolayısıyla x = 8‟ dir. 2 Problemde sözel olarak ifade edilen durumu cebirsel denkleme dönüĢtüren ve bu denklemi çözen ancak yeterince dikkatli olmayan öğrenciler, Evren‟in yaĢının değil, ablasının yaĢının sorulduğunu unutarak A seçeneğini iĢaretlemiĢlerdir. Yukarıda açıklanan durumun, maddenin I. doğru cevaplanma oranı II. ayırt edicilik düzeyi III. geçerlik özelliklerinden hangilerini düĢürmesi beklenir? A) Yalnız I B) Yalnız II C) I ve II D) II ve III E) I, II ve III Yanıt: Sorunun yanlıĢ algılanması nedeniyle yanlıĢ yanıtlanması “doğru cevap oranını”, bilen öğrencinin de yanlıĢ cevap vermesi “ayırt edicilik düzeyi”ni, ayırt edicilik düzeyinin düĢmesi de “geçerliği” etkiler.Yanıt C’dir. 79 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net 5. Bölüm. TEST PUANLARININ DEĞERLENDĠRĠLMESĠ VE YORUMLANMASI TEST PUANLARININ DEĞERLENDĠRĠLMESĠ VE likle normal bir dağılım gösterdiğini varsayar ve YORUMLANMASI değerlendirme ve yorumlamalarımızı bu varsayımla NORMAL DAĞILIM EĞRĠSĠ gerçekleĢtiririz. Üzerinde çalıĢtığımız örneklemin evreni temsil ettiğini varsayarak bazı korelasyon tek- Eğitimde gerçekleĢtirilen ölçme iĢlemlerinin en iyi nikleri, standart puanlar gibi iĢlemler gerçekleĢtiririz. Ģekilde anlaĢılabilmesi ve elde edilen sonuçlardan Gerçekte ise evreni tam anlamıyla gözlemek çok az iĢlevsel olarak yararlanabilmek için, öncelikle normal mümkün olabilen bir durumdur ve bazen dağılımın dağılım eğrisi, çan eğrisi veya Gauss eğrisi olarak gerçek Ģekli hiçbir zaman bilinemeyebilir. Elde etti- adlandırılan dağılım eğrisinin özelliklerinin çok iyi ğimiz verilerin normal bir dağılım gösterip göster- bilinmesi gerekmektedir. mediğini belirleyebilmek için de bazı iĢlemler ger- Ölçme iĢlemlerinde elde ettiğimiz puanların genel- çekleĢtirmemiz gerekir. Normal Dağılım Eğrisi Normal Dağılım Eğrisi % % 99 98 % 95 % 68 0,0215 0,1359 0,3413 0,3413 0,1359 0,0215 Sx -3 -2 -1 0 +1 +2 +3 Z -3 -2 -1 0 +1 +2 +3 T 20 30 40 50 60 70 80 Normal Dağılım Eğrisinin Özellikleri: -2, +2 standart sapma bölgesi, puan dağılımın Normal dağılım eğrisi (Gauss eğrisi, çan eğrisi) % 95‟ini oluĢturmaktadır. görünüm ve dağılım olarak aĢağıdaki özellikleri taĢı- -1, +1 standart sapma bölgesi, puan dağılımının maktadır. % 68‟ini oluĢturmaktadır. Normal dağılım, Z=0 noktasından simetriktir. Z puanı, puan dağılımını normalleĢtirmede kul- Normal dağılımda mod, medyan ve aritmetik lanılmaktadır. ortalama birbirine eĢittir. Normal dağılım özelliği gösteren farklı dağılım- Normal dağılım, - , + arasında tanımlanmıĢ lar, Z puanlarına dönüĢtürülerek standartlaĢma olmakla birlikte, pratikte bu tanım aralığı -3, +3 sağlanır. arasında sınırlandırılmıĢtır. Bu tanım aralığı ise eğrinin % 99‟unu oluĢturmaktadır. 80 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Normal dağılım eğrisinin pratikte -3 ile +3 arasında ÖĞRENCĠ BAġARISININ DEĞERLENDĠRĠLMESĠ değer aldığını biliyoruz. Bu dağılımda 0 noktası aritmetik ortalama noktasıdır. Puanların -3 ve +3 yö- Uygulanan bir testten elde edilen verilerle öğren- nünde dağılımını ifade eder. BaĢka bir tanımla- cilerin baĢarılarının değerlendirilmesinde sadece mayla; puanların aritmetik ortalamadan ne kadar aritmetik ortalamaya bakılarak değerlendirme yapıl- uzaklaĢtığını gösterir. masının yeterli olmayacağı daha önce belirtilmiĢti. Aritmetik ortalama, her ne kadar o sınıftaki öğrenme -3 -2 -1 0 +1 +2 düzeyini ortaya koysa da, puanların dağılımı hak- +3 kında çok fazla bilgi vermez. Puanların dağılımı hakkında bilgi veren istatistiki iĢlem, standart sapmadır. Hatırlanacağı gibi, puanların aritmetik ortalama- Standart sapma, elde edilen puanların, ortalama dan uzaklığını belirleyen istatistik kavramı ise stan- puandan ne kadar farklılıklar olduğunu ortaya koyar. dart sapma idi. Bu durumda, normal dağılım eğri- Aritmetik ortalamanın yüksek olması, sınıftaki her- sindeki her 1 birimlik dağılım ölçüsü, 1 standart sap- kesin, o dersin hedeflerinde belirtilen davranıĢları mayı iĢaret eder. Dolayısıyla da aritmetik ortalama- kazandığını ifade etmez. Sadece o sınıftaki öğren- sını ve standart sapmasını bildiğimiz bir puan me düzeyini ortalama olarak ifade eder. Grubun dağılımında en yüksek ve en düĢük puanları, normal baĢarısını ise, standart sapma ortaya koyar. dağılım eğrisinden yararlanarak bulabiliriz. Aritmetik ortalama ve standart sapmadan yararlanarak, öğrencilerin öğrenme düzeylerinin, grup ba- Örnek: Ģarılarının Matematik dersinde uygulanan bir testin aritmetik aĢağıdaki yolların izlenmesi gerekmektedir: değerlendirmesinin yapılabilmesi için ortalaması 60, standart sapması ise 4 olarak belirlenmiĢtir. Bu testte elde edilebilecek en yüksek ve Aritmetik ortalama yüksek ise; Grubun öğ- en düĢük puan kaçtır? renme düzeyinin yüksek olduğu, ders baĢarısının iyi olduğu, öğrencilerin konuyu iyi öğ- Çözüm: rendiği, ortalama öğrenme düzeyinin ya da Aritmetik ortalamanın 60, standart sapmanın 4 grubun baĢarı düzeyinin yüksek olduğu söylenebilir. olması, puanların + yönde ve – yönde her birimde standart sapma miktarı kadar arttığını veya eksil- Aritmetik ortalama düĢük ise; Grubun öğ- diğini ifade eder. renme düzeyinin düĢük, ders baĢarısının dü- -3 -2 -1 0 +1 +2 -4 -4 -4 X +4 +4 +4 48 52 56 60 64 68 72 Ģük olduğu, öğrencilerin konuyu iyi öğrene- +3 mediği, ortalama öğrenme düzeyinin ya da grubun baĢarı düzeyinin düĢük olduğu söylenebilir. Standart sapma küçük ise; Standart sapma Bu testte % 99 olasılıkla öğrencilerin almıĢ olduk- küçük ise; grubun homojen bir yapıya sahip ları en yüksek puanın 72, en düĢük puanın ise 48 olduğu, puanların birbirine yakın olduğu, gru- olabileceği söylenebilir. bun ortak öğrenme özelliklerine sahip olduğu, Bir baĢka ifadeyle, öğrencilerin % 99‟u Matematik grup baĢarısının yüksek olduğu anlaĢılır. testinden 48 ile 72 arasında puanlar almıĢtır. Standart sapma büyük ise; Standart sapma büyük ise; grubun heterojen bir yapıya sahip olduğu, puanların birbirinden uzak olduğu, grubun öğrenme özelliklerinin birbirinden farklı olduğu, grup baĢarısının düĢük olduğu sonucuna ulaĢılır. 81 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Örnek: ise daha baĢarısız olduğu kabul edilir. Bu Dersler x S durumda Eğitim Psikolojisi dersinin standart GeliĢim Psikolojisi 60 12 sapması (13), GeliĢim Psikolojisi dersinin Program GeliĢtirme 62 8 standart sapmasından (12) daha büyük ol- Eğitim Psikolojisi 60 13 duğu için, grubun baĢarı düzeyinin en düĢük Ölçme Değerlendirme 80 14 Rehberlik 65 13 olduğu ders olarak Eğitim Psikolojisi dersini söyleyebiliriz. 3. mıyla, aritmetik ortalamadan uzaklığıyla ilgili- Yukarıdaki tablodan yararlanarak aĢağıdaki soru- dir. Bu da, standart sapmadan yararlanaca- ları cevaplandıralım. 1. ğımız anlamına gelir. Puanların aritmetik or- Hangi derste grubun baĢarı düzeyi (öğrenme talamadan en az uzaklaĢtığı, yani standart düzeyi) en yüksektir? 2. sapmanın en düĢük olduğu ders, Program Hangi derste grubun baĢarı düzeyi (öğrenme GeliĢtirme (8) dersi, grup baĢarısının en yük- düzeyi) en düĢüktür? 3. Hangi derste grup baĢarısı en yüksektir? 4. Hangi derste grup baĢarısı en düĢüktür? 5. Hangi derste grup homojendir? 6. Hangi derste grubun heterojenliği en yüksek- sek olduğu derstir. 4. Değerlendirme (14) dersidir. 5. sapması olan Program GeliĢtirme (8) dersinde grup homojendir. anlar kaç olabilir? 6. Ölçme Değerlendirme dersinde öğrencilerin bun homojenliği en düĢük düzeydedir ve grup puanlar 1 sapmaya göre kaç olabilir. heterojen özellikler göstermektedir. 7. Çözümler: GeliĢim Psikolojisi dersinin aritmetik ortalaması 60, standart sapması 2‟dir. Normal da- Grubun baĢarı düzeyi (öğrenme düzeyi), pu- ğılım eğrisi -3, +3 arasında değerler aldığına an ortalamasının, yani aritmetik ortalamanın göre; 3 x 12 = 36 yüksek olmasıyla ilgilidir. Aritmetik ortalaması Yani; GeliĢim Psikolojisi dersinde alınabilecek en yüksek olan ders, grubun en baĢarı dü-e- en düĢük puan 60 – 36 = 24, en yüksek puan yinin en yüksek olduğu derstir. Yani; Aritmetik ise; ortalaması en yüksek (80) olan Ölçme değer- 60 + 36 = 96 olabilir. lendirme dersidir. 2. Aynı Ģekilde, standart sapması en yüksek olan Ölçme Değerlendirme (14) dersinde gru- almıĢ olabilecekleri en düĢük ve en yüksek 1. Grup homojenliği, grup baĢarısı ile aynı Ģeyi ifade eder. Dolayısıyla en düĢük standart GeliĢim Psikolojisi dersinde öğrencilerin almıĢ olabilecekleri en düĢük ve en yüksek pu- 8. Grup baĢarısının en düĢük olduğu ders ise standart sapmanın en yüksek olduğu Ölçme tir? 7. Grup baĢarısı, grubun aldığı puanların dağılı- 8. Grubun baĢarı düzeyi (öğrenme düzeyi) arit- Ölçme Değerlendirme dersinin aritmetik ortalaması 80, standart sapması ise 14‟tür. Bu metik ortalama yardımıyla belirlendiğine göre, durumda; 14 x 1 = 14 aritmetik ortalamanın en düĢük olduğu ders Yani; Ölçme Değerlendirme dersinde alınabi- bulunmalıdır. Ancak, tablo incelendiğinde, lecek en düĢük puan 80 – 14 = 66, en yüksek aritmetik ortalama en düĢük GeliĢim Psikolo- puan ise; 80 + 14 = 94‟tür. jisi (60) ve Eğitim Psikolojisi (60) derslerinde ortaya çıkmıĢtır. Bu tür eĢitliklerde yapılma- Öğrenme düzeyinin (grubun başarı düzeyi, ortalama öğrenme düzeyinin) belirlenmesinde standart sapmaları eşit olan ders sayısı birden fazla ise, standart sapması eşit olan aritmetik ortalamalarına bakılır. Aritmetik ortalaması yüksek olan ders başarılı olan derste grup başarısı yüksek, düşük olan derste ise düşük olarak kabul edilir. sı gereken Ģey, standart sapmaya bakmaktır. EĢitliklerde; standart sapması düĢük olan derste öğrencilerin baĢarı düzeylerinin daha iyi, standart sapması yüksek olan derslerde ise daha düĢük olan derste 82 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net GERÇEK PUAN ĠÇĠN GÜVEN ARALIĞININ Neriman‟ın % 95 olasılıkla gerçek puanının hangi HESAPLANMASI sınırlarda olduğunu (güven aralığını) bulunuz. Bir öğrencinin bir sınavda elde ettiği gerçek puanı Ancak; gerçek puanının Çözüm: = T‟ (Z puanı) Se sınırlarda olabileceğini, belli bir hata payı ile tahmin = 73 2.0,64 edebiliriz. ĠĢte bu sınırların, belli bir olasılık dahilinde = 61 puan bilemeyebiliriz. hangi GA T‟ 85 puan belirlenmesine güven aralığı denir. Neriman‟ın gerçek puanı % 95 olasılıkla 61 ile 85 GA /2 = T’ (z değeri)Se puan aralığındadır. GA /2: Güven aralığı T‟ : Öğrenci puanı Se : Standart hata PUANLARIN STANDARTLAġTIRILMASI Testlerden elde delen puanlar ham puanlardır. Uygulanan her testin farklı aritmetik ortalamaları ve Normal Dağılım Eğrisi standart sapmaları vardır. Öğrencilerin aldığı puan- % % 99 98 lar, farklı testlerde farklı dağılımlar gösterebilir. Bu % 95 % 68 nedenle, elde edilen puan dağılımlarının gerektiği gibi değerlendirilip yorumlanabilmesi için elde edilen ham puanların, standart puanlara dönüĢtürülmesi gerekir. BaĢka bir tanımla; aritmetik ortalamaları ve standart sapmaları aynı olan bir dağılıma dönüĢtürülmesi gerekir. 0,0215 0,1359 Se -3Se -2Se Z -3 -2 0,3413 0,3413 -1Se -1 T’ 0 Ham puanların standartlaĢtırılmıĢ puanlara dö- 0,1359 0,0215 +1Se +1 nüĢtürülmesinde kullanılan Z ve T gibi formüller +2Se +3Se +2 +3 vardır. Bu nedenle sınavlarla ilgili değerlendirme yapılmadan önce elde edilen puanlar Z veya T cin- Ölçmenin Standart Hatasının Normal Dağılım sinden standartlaĢtırıldıktan sonra değerlendirme ve Eğrisindeki Görünümü yorumlama yapılmalıdır. T‟ 1Se Olasılık sınırı % 68 Z PUANI T‟ 2Se Olasılık sınırı % 95 Aritmetik ortalaması 0, standart sapması 1 olan T‟ 3Se Olasılık sınırı % 99 puan türüdür. Serap‟ın Matematik dersinde uygulanan ve arit- Yukarıdaki durum dikkate alındığında; bir öğren- metik ortalaması 55, standart sapması 4 olan sınav- cinin sınavda aldığı gerçek puanın hangi olasılıkla dan aldığı puan Z puanına dönüĢtürüldüğünde elde (% 99, % 95 veya % 68) istendiğine bakılarak, bu edilen puanın aritmetik ortalaması 0, standart sap- aralık veya aralıklardaki standart hata puanını öğ- ması ise 1 olur. Yani puan Z sisteminde sabitleĢ- renci puanına tirilmiĢtir. yönde ekleyerek ve çıkararak gü- ven aralıklarını bulabiliriz. Ham puanların Z puanlarına dönüĢtürülmesinde aĢağıdaki formül uygulanır: Örnek: Neriman, aritmetik ortalaması 60, standart sapPuan (X) – Aritmetik Ortalama (X) ması 10, standart hatası 6 ve güvenirlik katsayısı Z= 0,64 olan Matematik testinden 73 puan almıĢtır. Standart Sapma S(x) 83 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net Örnek: T PUANI Aritmetik ortalaması 65, standart sapması 5 olan T puanı da, Z puanı gibi elde edilen ham puanların sınavdan Selda‟nın almıĢ olduğu 75 puanın Z Puanı standartlaĢtırılmıĢ puanlara dönüĢtürülmesinde kul- değeri kaçtır? lanılan bir sistemdir. Ham puanlar T puanına dönüĢtürülürken, aritmetik ortalaması 50, standart sap- Çözüm: ması 10 olan puan sistemine dönüĢürler. Ham puanların T puanına dönüĢtürülmesinde aĢa- 75 – 65 Z= ğıdaki formül kullanılır: =2 5 Puan (X) – Aritmetik Ortalama (X) Z Puanından yararlanılarak, bir öğrencinin hangi T = 50 + derste veya hangi testte daha baĢarılı olduğu .10 Standart Sapma Sx değerlendirmesi ve yorumu yapılabilir. Örnek: Görüldüğü gibi, parantez içindeki bölüm, Z pua- Deniz‟in Matematik testlerinden elde ettiği puanlar nının hesaplanma formülüdür. Bu nedenle T puanı tabloda verilmiĢtir. Deniz‟in en baĢarılı ve en formülü; baĢarısız olduğu test hangisidir? T = 50 + 10 Z olarak da ifade edilebilir. Test Test Test Test 1 2 3 4 Puanları 80 68 60 51 türerek Deniz‟in en baĢarılı ve en baĢarısız olduğu x 68 55 70 45 dersleri belirleyelim. S 10 5 4 2 Örnek: Deniz’in Bir önceki örnekteki puanları T puanına dönüĢ- Çözüm: Çözüm: 80 – 68 Test 1: Z = = 1,2 = 76 T = 50 + 10 . 3 68 – 55 = 2,6 = 80 Görüldüğü gibi, T puanları da aynı sonuçları 5 ortaya koymaktadır. 60 – 70 Test 3: Z = = 62 T = 50 + 10 . 2,6 T = 50 + 10 . - 2,5 = 25 10 Test 2: Z = T = 50 + 10 . 1,2 = - 2,5 4 SINAV SONUÇLARININ NOTA ÇEVRĠLMESĠ 51 – 45 Test 4: Z = =3 Eğitimde öğrenci baĢarısı hakkında karar verebil- 2 mesi için öğrencilerin ölçme araçlarından aldıkları Deniz‟in en baĢarılı olduğu test; 3 Z puanı olan, 45 ölçme sonuçlarının nota çevrilmesi gerekmektedir. puan aldığı 4 testtir. Öğrencilerin herhangi bir sınavdan aldıkları puan- En baĢarısız olduğu test ise; - 2,5 Z puanı olan, 60 ların nota çevrilmesiyle, öğrencilerin o dersten ba- puan aldığı 3. testtir. Ģarılı ya da baĢarısız sayılarak sınıfı geçip geçemeyecekleri hakkında kararlar verilir. Değerlendirmenin, bir ölçme sonucunun ölçütle karĢılaĢtırılarak bir değer yargısına ulaĢma iĢidir. Bu nedenle sınav- 84 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net lardan elde ettiğimiz puanlar birer ölçme sonucu, Çizelge 3: 5‟lik sisteme göre mutlak baĢarı yüz- notlar ise değerlendirme sonucu elde edilen de- deleri ile verilen notlar ğerlerdir. Geçer Mutlak Değerlendirme: MBY(%) Mutlak değerlendirmede, bir dersin öğretim prog- 90-100 5 ramındaki davranıĢların tümü ölçüt olarak alındığın- 80- 89 4 dan, bu davranıĢları yeterli düzeyde kazanan öğ- 70- 79 3 60 69 2 rencilerin baĢarılı, yeterli düzeyde kazanamayan öğrenciler ise baĢarısız kabul edilir. Mutlak değerlendirmede bir öğrencinin baĢarı yüzdesi ve mutlak Kalır Not Not MBY(%) 0-59 1 Not ölçeğindeki kategori sayısı arttıkça, notun baĢarı puanı aĢağıdaki formüller yardımıyla hesap- dayandığı ölçmeler yeterince güvenilir olmak kay- lanır. dıyla, değerlendirmenin güvenirliğini de artırır. XĠ .100 MaxPuan MBP MBY Bağıl Değerlendirme: XĠ MaxPuan Bağıl değerlendirmede ölçüt olarak sınıfın ortalama baĢarı düzeyi alınır. Bu değerlendirme sınıfın MBY=Mutlak Başarı Puanı ortalama baĢarısı üzerinde not alan öğrenciler ba- MBY=Mutlak Başarı Yüzdesi Ģarılı, ortalamanın altında not alan öğrenciler de baĢarısız kabul edilir. Ölçüt bağıl olduğu için bu değer- X: i öğrencinin sınav puanı lendirme türü, norm dayanaklı değerlendirme olarak MaxPuan:Sınavdan alınabilecek en yüksek puan da bilinmektedir. Sınıfın puan dağılımına göre not vermek için öncelikle puan dağılımının ortalama ve Örneğin, yapılan bir sınavda alınabilecek en yük- standart sapma değerlerinin hesaplanması gerek- sek puan 80 ve bir öğrencinin bu sınavdan aldığı mektedir. puan 40 ise bu öğrencinin mutlak baĢarı yüzdesi, MBY 40 80 AĢağıda ortalama ve standart kaymaya göre oluĢturulan 5‟lik not sistemine göre not verme ölçeği 0.5 ' dir. verilmiĢtir. Bu sonuç, öğrencinin yoklanan davranıĢlardan X – 0,5.S 0.50‟sini kazanmıĢ olduğunu ve 100 üzerinden 50 puan aldığını göstermektedir. Mutlak baĢarı yüz- X+0,5.S 1 2 X+1,0.S X+1,5.S 3 4 5 desine göre 10‟luk ve 5‟lik sisteme göre not verme Örneğin, ortalaması 55 ve standart sapması 11 iĢlemi aĢağıdaki çizelgeden yararlanılarak yapıla- olan puan dağılımındaki puanların 5‟lik sisteme göre bilir. not aralıkları aĢağıdaki çizelge ve ölçek üzerinde Çizelge 2: 10‟luk sisteme göre mutlak baĢarı yüz- gösterilmiĢtir. deleri ile verilen notlar Alt Sınır Notu Notlar Geçer MBY(%) Not Kalır MBY(%) 1 Not 0,00 Üst Sınır Notu - 49.50 2 =55-0,5.11 = 49,50 - 60.50 95-100 10 35-44 4 3 =55+0,5.11= 60,50 - 66,00 85- 94 9 25-34 3 4 =55+1,0,11= 66,00 - 71,50 75- 84 8 15-24 2 5 =55+1,5.11= 71,5 ve üstü 65- 74 7 5-l4 1 55 -64 6 0-4 0 45- 54 5 49,5 60,5 66 71,5 Sınır 1 85 2 3 4 5 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net ÖZET TABLO TEST PUANLARININ DEĞERLENDĠRĠLMESĠ VE YORUMLANMASI Normal Dağılım Eğrisi Z Puanı T Puanı Puanların aritmetik ortalama, mod ve medyanının birbirine eĢit olduğu, herhangi bir çarpıklığın sözkonusu olmadığı dağılımlardır. Puanların, aritmetik ortalaması 0, standart sapması 1 olan sistemde standartlaĢtırılmıĢ durumudur. Puanların, aritmetik ortalaması 50, standart sapması 10 olan sistemde standartlaĢtırılmıĢ durumudur. Mutlak BaĢarı Yüzdesi Herhangi bir testten elde edilen puanın, % lik ifadelerde baĢarı oranını ortaya koyar. Mutlak BaĢarı Puanı Herhangi bir testten elde edilen puanın, 100‟lük puan sistemindeki değerini ifade eder. Mutlak Değerlendirme Puanların, önceden belirlenmiĢ ölçütlerle karĢılaĢtırılarak değerlendirilmesidir. Bağıl Değerlendirme Puanların, elde edilen verilerle veya öğrenci grubunun özellikleri dikkate alınarak belirlenen ölçütlerle değerlendirilmesidir. 86 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net GeçmiĢ yıllarda bu konuyla ilgili sorulan bazı KPSS soruları (KPSS - 2002) Her biri 0 veya 1 Ģeklinde puanlanan 100 soruluk genel baĢarı sınavında, eĢit sayıda öğrencisi olan beĢ sınıfın puan dağılımlarının grafikleri, aritmetik ortalama ve standart sapmaları aĢağıda verilmiĢtir. I II III IV V Buna göre, testte grup olarak en baĢarılı olan sınıf hangisidir? A) I B) II C) III D) IV E) V Yanıt: Grup baĢarısı, sınıfın çoğunluğunun birbirine yakın puanlar almasını, yani standart sapmanın düĢük olmasını ifade eder. Standart sapmanın düĢük olduğu grupların baĢarılarının yüksek olduğu kabul edilir. Standart sapmaların eĢit olması durumunda ise, standart sapmaları eĢit olan gruplardan aritmetik ortalaması en yüksek olan grup en baĢarılı grup olarak kabul edilir. Yanıt E’dir. (KPSS – 2008) Matematik dersinde bilgisayar programlarından yararlanmanın öğrencilerin matematik baĢarısına etkisini ölçmeyi planlayan bir öğretmen, bir sınıfında geleneksel öğretim yöntemini kullanırken, diğer bir sınıfında ise iĢlenen her konudan sonra bilgisayar programıyla alıĢtırmalar yaptırmaktadır. Bu araĢtırmadaki bağımsız değiĢken aĢağıdakilerden hangisidir? A) Öğretmen özellikleri B) Matematik notları C) Öğretim yöntemleri D) Sınıf mevcutları E) Öğrenci nitelikleri Yanıt: Bağımsız değiĢken, iki değiĢken arasındaki iliĢkide, diğer değiĢkeni etkileyen değiĢkendir. Soruda öğretim yöntemleri, bağımsız değiĢkendir. Yanıt C’dir. (KPSS – 2008) Bir araĢtırmada X ve Y değiĢkenleri arasında sıfıra yakın bir iliĢki bulunmuĢtur. Bu değiĢkenler aĢağıdakilerin hangisinde verilenler olabilir? X Y A) Doğum Yeri Doğum tarihi B) Boy Kütle C) YaĢ Eğitim düzeyi D) Kaygı düzeyi BaĢarı E) Spor yapma Sağlık Yanıt: Korelasyonun sıfır olması, iki değiĢken arasında hiçbir iliĢkinin olmadığı anlamına gelir. Doğum yeri ile doğum tarihi arasında anlamlı bir iliĢki olmadığından korelasyon sıfır olur. Yanıt A’dır. 87 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net (KPSS – 2004) Farklı dersler için hazırlanan ve soru sayıları aĢağıdaki tabloda parantez içinde verilen beĢ test bir gruba uygulanmıĢ ve ham puanlar üzerinde elde edilen aritmetik ortalamalar tabloda gösterilmiĢtir. Test Soru sayısı x Biyoloji 10 5,2 Matematik 45 38,1 Fizik 19 13,4 Kimya 12 6,9 Tarih 14 11,7 Hangi testte sınıfın mutlak baĢarı düzeyi en yüksektir? A) Biyoloji B) Matematik C) Fizik D) Kimya E) Tarih Yanıt: Mutlak baĢarı, bir testten alınabilecek puanın yüzde kaçının alındığını ifade eder. Tablo incelendiğinde mutlak baĢarının en yüksek olduğu dersin Matematik olduğu hesaplanacaktır. Yanıt B’dir. (KPSS – 2007) AĢağıdaki tabloda beĢ dersin sınavlarının puan dağılımlarına iliĢkin aritmetik ortalama ile standart sapmalar ve Ali‟nin bu sınavlardan elde ettiği puanlar verilmiĢtir. Ders Aritmetik ortala. Standart sapma Ali’nin puanı Matematik 50 5 65 Türkçe 50 8 65 Fizik 50 10 65 Kimya 50 15 65 Biyoloji 50 20 65 Ali’nin sınıfına göre en baĢarılı ve en baĢarısız olduğu dersler hangileridir? En baĢarılı En baĢarısız A) Matematik Türkçe B) Matematik Biyoloji C) Fizik Kimya D) Fizik Biyoloji E) Kimya Biyoloji Yanıt: Puanlar hesaplandığında Ali‟nin en yüksek puanı Matematik (z=3) ve en düĢük puanı Biyoloji (z=-0,75) dersindedir. Yanıt B’dir. (KPSS – 2008) Bir grup öğrenciye uygulanan dönem sonu sınavlarına iliĢkin istatistikler tablodaki gibidir. Dersler Soru Sayısı Aritmetik Or. Medyan Mod Kimya 20 8 6 4 Tarih 40 30 35 39 Türkçe 30 15 18 23 Fizik 50 30 30 30 Felsefe 40 14 10 7 Öğrencilerin en baĢarılı olduğu ders hangisidir? A) Kimya B) Tarih C) Türkçe D) Fizik E) Felsefe St. Sapma 4 7 6 11 9 Yanıt: Mutlak baĢarı, aritmetik puanın, alınabilecek en yüksek puana bölümüyle elde edilir. Soruda aritmetik ortalamalar soru sayısına bölünerek en baĢarılı olunan ders bulunur. Yanıt B’dir. 88 Diğer kitaplar ve testler için aşağıdaki linki tıklayınız. www.izmirkpsskursu.net (KPSS – 2009) Bir coğrafya öğretmeni 100 soruluk bir baĢarı testi uygulamıĢ ve test puanlarının ortalamasını 75, ortancasını 80, tepe değerini (mod) 90, standart sapmasını 8 ve ranjını 90 bulmuĢtur. Öğrencilerin dersten geçebilmeleri için en az 65 puan almaları gerekmektedir. Test puanlarına iliĢkin istatistiklere ve değerlendirme ölçütüne dayanarak bu dağılım için aĢağıdaki yorumlardan hangisi yapılamaz? A) Ölçümlerin yüzde elliden fazlası ortalamadan büyüktür. B) Merkezî eğilim ölçüsü olarak ortancadan yararlanılmalıdır. C) Sınıfın büyük çoğunluğu geçer not alır. D) Tepe değeri, gözlenen en büyük değerdir. E) Ortalamayı çarpıtan uç değer(ler) bulunmaktadır Yanıt: Aritmetik ortalamanın medyandan küçük, modun medyandan büyük olduğu dağılımlar sola çarpık dağılımlardır. Böyle bir dağılımda öğrencilerin büyük çoğunluğu baĢarılı olmuĢtur. BaĢarı ölçütü 65 olduğu için öğrencilerin çoğunluğu geçer not almıĢtır. Uç değerler, dağılımı çarpıtmıĢtır. Tepe değer, bir puan dağılımında en fazla tekrarlayan (en çok alınan) puandır. Dolayısıyla mod olan 90‟ın en yüksek puan olduğu söylenemez. Yanıt D’dir. (KPSS – 2010) Bir testten elde edilen puanların standart sapması küçük bulunmuĢsa bu testi alan bireyler hakkında aĢağıdaki sonuçlardan hangisine ulaĢılabilir? A) Ölçülen özellik bakımından birbirlerine benzemektedirler. B) Bu tür testleri almaya alıĢmıĢlardır. C) Testi, verilenden daha kısa sürede cevaplamıĢlardır. D) Testte yer alan sorular kendi düzeylerine uygundur. E) Soruları cevaplarken gerçek performanslarını ortaya koymuĢlardır. Yanıt: Standart sapma, puanların aritmetik ortalamadan uzaklıklarını, bir baĢka deyiĢle, öğrencilerin birbirinden ne kadar farklı puanlar aldıklarını ifade eder. Puanlar farklılaĢtıkça standart sapma büyük, farklılaĢma azaldıkça (puanlar birbirine yaklaĢtıkça) puanlar düĢer. Dolayısıyla sapma küçükse grubun homojen, birbirine yakın öğrenme özellikleri taĢıdığı, sapma büyüdükçe grubun heterojen, birbirinden farklı öğrenme özelliklerine sahip olduğu söylenir. Yanıt A’dir. (KPSS – 2011) Bir okulda öğrencilerin geliĢimini izlemek amacıyla, bir hafta arayla, 100‟er maddelik paralel iki test uygulanmıĢtır. Bu iki uygulamadan elde edilen doğru cevap ortalamaları, standart sapmalar ve Zeynep adlı öğrencinin doğru cevap sayıları aĢağıdaki tabloda verilmiĢtir. Testin Ortalaması Testin Standart Sapması Zeynep‟ in Doğru Cevap Sayısı Birinci Uygulama 50 10 60 Ġkinci Uygulama 60 10 65 Zeynep’in durumuyla ilgili olarak I. Mutlak baĢarı düzeyi artmıĢtır. II. T standart puanı artmıĢtır. III. Sınıf içindeki sıralamada yükselmiĢtir. ifadelerinden hangileri kesinlikle doğrudur? A) Yalnız I B) Yalnız III D) II ve III E) I, II ve III C) I ve II Yanıt: Her iki testte 100 sorudan oluĢtuğu için, birinci testte 60, ikinci testte 65 doğru yanıt veren Zeynep‟in mutlak baĢarısının arttığı kesinlikle doğrudur. Zeynep‟in T puanları: Birinci uygulamada 60, ikinci uygulamada ise 55‟tir, yani düĢmüĢtür. Dolayısıyla sınıf içerisindeki sıralaması da düĢmüĢtür. Yanıt A’dır. 89