İstatistiksel analizlerde doğru testin seçilmesi, elde edilen sonuçların güvenilirliği açısından oldukça önemlidir. Bu süreçte araştırmacıların en sık karşılaştığı konulardan biri de normallik testidir. Özellikle SPSS, Jamovi, JASP, R veya Python gibi programlarla veri analizi yapılırken, birçok parametrik testten önce verilerin normal dağılıma uygun olup olmadığı değerlendirilir.
Bu yazıda normallik testinin ne olduğu, neden önemli olduğu, hangi testlerle değerlendirildiği ve sonuçların nasıl yorumlanması gerektiği detaylı şekilde ele alınacaktır.
Normallik Testi Nedir?
Normallik testi, bir veri setinin normal dağılıma uygun olup olmadığını değerlendirmek için kullanılan istatistiksel bir yöntemdir. Normal dağılım, verilerin ortalama etrafında simetrik biçimde dağıldığı, çan eğrisi şeklinde görülen dağılım türüdür.
Birçok istatistiksel test, verilerin normal dağılım gösterdiği varsayımına dayanır. Bu nedenle analiz öncesinde verilerin dağılım özelliklerinin incelenmesi gerekir. Normallik testi de bu noktada devreye girer.
Örneğin bir araştırmada bireylerin yaş, boy, kilo, ağrı puanı, ölçek toplam puanı veya laboratuvar değerleri inceleniyorsa, bu değişkenlerin normal dağılıma uygunluğu analiz seçimini doğrudan etkileyebilir.
Normallik Neden Önemlidir?
Normallik varsayımı özellikle parametrik testler için önemlidir. Parametrik testler, verilerin belirli varsayımları karşıladığını kabul eder. Bu varsayımlardan biri de çoğu durumda normal dağılımdır.
Normal dağılım gösteren verilerde genellikle şu testler tercih edilir:
- Bağımsız örneklem t testi
- Eşleştirilmiş örneklem t testi
- Tek yönlü ANOVA
- Pearson korelasyon analizi
- Doğrusal regresyon analizi
Veriler normal dağılım göstermediğinde ise parametrik olmayan testler tercih edilebilir:
- Mann-Whitney U testi
- Wilcoxon testi
- Kruskal-Wallis testi
- Spearman korelasyon analizi
Bu nedenle normallik değerlendirmesi, yalnızca teknik bir aşama değil, doğru istatistiksel yöntemi seçmenin temel adımlarından biridir.
Normal Dağılım Nasıl Anlaşılır?
Bir değişkenin normal dağılıma uygun olup olmadığını değerlendirmek için tek bir yönteme bağlı kalmak doğru değildir. Normallik değerlendirmesi genellikle birkaç farklı yöntem birlikte kullanılarak yapılır.
Başlıca değerlendirme yöntemleri şunlardır:
1. Shapiro-Wilk Testi
Shapiro-Wilk testi, özellikle küçük ve orta büyüklükteki örneklemlerde sık kullanılan normallik testlerinden biridir. Genel olarak örneklem sayısı 50’nin altında olduğunda daha çok tercih edilir. Ancak daha büyük örneklemlerde de kullanılabilir.
Bu testte hipotezler şu şekildedir:
H₀: Veri normal dağılıma uygundur.
H₁: Veri normal dağılıma uygun değildir.
Sonuç yorumlanırken p değeri dikkate alınır:
- p > 0.05: Veri normal dağılımdan anlamlı şekilde sapmamaktadır.
- p < 0.05: Veri normal dağılıma uygun değildir.
Ancak sadece p değerine bakarak karar vermek her zaman doğru değildir. Özellikle büyük örneklemlerde çok küçük sapmalar bile istatistiksel olarak anlamlı çıkabilir.
2. Kolmogorov-Smirnov Testi
Kolmogorov-Smirnov testi de normallik değerlendirmesinde kullanılan bir başka testtir. Daha büyük örneklemlerde tercih edilebilse de uygulamada Shapiro-Wilk testi genellikle daha güçlü kabul edilir.
Bu testte de p değeri üzerinden yorum yapılır:
- p > 0.05: Normal dağılım varsayımı reddedilmez.
- p < 0.05: Veri normal dağılıma uygun değildir.
SPSS çıktılarında genellikle Shapiro-Wilk ve Kolmogorov-Smirnov testleri birlikte verilir. Araştırmacının örneklem büyüklüğüne ve veri yapısına göre uygun değerlendirmeyi yapması gerekir.
3. Çarpıklık ve Basıklık Değerleri
Normallik değerlendirmesinde kullanılan önemli göstergelerden biri de çarpıklık ve basıklık değerleridir.
Çarpıklık, dağılımın simetrik olup olmadığını gösterir.
Basıklık, dağılımın normal dağılıma göre daha sivri veya daha basık olup olmadığını gösterir.
Genel kabul gören yaklaşımlardan birine göre çarpıklık ve basıklık değerlerinin yaklaşık olarak -1.5 ile +1.5 arasında olması normal dağılım açısından kabul edilebilir bir durum olarak değerlendirilebilir. Bazı kaynaklarda bu aralık -2 ile +2 olarak da kullanılmaktadır.
Ancak bu değerler tek başına yeterli değildir. Grafikler ve test sonuçlarıyla birlikte değerlendirilmelidir.
4. Histogram Grafiği
Histogram, verilerin dağılımını görsel olarak incelemeye yarayan grafiklerden biridir. Normal dağılıma yakın bir veri setinde histogram grafiği çan eğrisine benzer bir görünüm gösterir.
Histogram değerlendirilirken şu sorulara dikkat edilir:
- Veri ortalama etrafında dengeli dağılmış mı?
- Aşırı sağa veya sola yığılma var mı?
- Uç değerler dağılımı bozuyor mu?
- Grafik çan eğrisine benzer bir yapı gösteriyor mu?
Histogram, özellikle normallik testlerinin p değerleriyle birlikte yorumlandığında daha sağlıklı fikir verir.
5. Q-Q Plot Grafiği
Q-Q Plot grafiği, gözlenen değerlerin teorik normal dağılım değerleriyle ne kadar uyumlu olduğunu gösterir. Eğer noktalar diyagonal çizgiye yakın seyrediyorsa, verinin normal dağılıma yakın olduğu söylenebilir.
Noktalar çizgiden belirgin şekilde sapıyorsa, özellikle uçlarda ciddi ayrışmalar varsa, normal dağılım varsayımı zayıflayabilir.
Normallik Testi Sonucu Nasıl Yorumlanır?
Normallik testi yorumlanırken yalnızca “p değeri 0.05’ten küçük mü büyük mü?” sorusuna odaklanmak yeterli değildir. Özellikle büyük örneklemlerde normallik testleri çok hassas hale gelir. Bu durumda küçük ve pratikte önemsiz sapmalar bile anlamlı sonuç verebilir.
Bu nedenle normallik değerlendirmesinde şu unsurlar birlikte ele alınmalıdır:
- Shapiro-Wilk veya Kolmogorov-Smirnov testi sonucu
- Çarpıklık ve basıklık değerleri
- Histogram grafiği
- Q-Q Plot grafiği
- Örneklem büyüklüğü
- Uç değerlerin varlığı
- Kullanılacak istatistiksel testin varsayımları
Örneğin örneklem sayısı çok büyükse ve p değeri 0.05’in altında çıkmışsa, ancak çarpıklık-basıklık değerleri kabul edilebilir aralıktaysa ve grafikler normal dağılıma yakın görünüyorsa, parametrik testlerin kullanılması yine de değerlendirilebilir.
SPSS’te Normallik Testi Nasıl Yapılır?
SPSS programında normallik testi yapmak için genellikle şu yol izlenir:
Analyze > Descriptive Statistics > Explore
Açılan pencerede analiz edilecek değişken “Dependent List” alanına aktarılır. Daha sonra “Plots” seçeneğine tıklanarak “Normality plots with tests” kutucuğu işaretlenir. Analiz çalıştırıldığında SPSS, normallik testlerini ve ilgili grafikleri verir.
SPSS çıktısında özellikle şu bölümler incelenir:
- Tests of Normality tablosu
- Shapiro-Wilk testi
- Kolmogorov-Smirnov testi
- Histogram
- Q-Q Plot
- Descriptives tablosundaki çarpıklık ve basıklık değerleri
Normallik Bozulursa Ne Yapılır?
Veri normal dağılım göstermiyorsa birkaç farklı yol izlenebilir.
İlk olarak veri setinde uç değer olup olmadığı kontrol edilmelidir. Uç değerler dağılımı bozabilir ve analiz sonuçlarını etkileyebilir. Ancak uç değerler rastgele silinmemeli, mutlaka bilimsel ve metodolojik gerekçeyle değerlendirilmelidir.
İkinci olarak, değişkenin yapısına göre dönüşüm uygulanabilir. Logaritmik dönüşüm, karekök dönüşümü veya Box-Cox dönüşümü bazı durumlarda dağılımı normale yaklaştırabilir.
Üçüncü olarak, parametrik test yerine parametrik olmayan testler tercih edilebilir. Örneğin iki bağımsız grup karşılaştırmasında bağımsız örneklem t testi yerine Mann-Whitney U testi kullanılabilir.
Son olarak, örneklem büyüklüğü ve analiz amacı dikkate alınarak parametrik testlerin dayanıklılığı da değerlendirilebilir. Bazı parametrik testler, özellikle örneklem büyüklüğü yeterliyse, normal dağılımdan küçük sapmalara karşı oldukça dayanıklıdır.
Hangi Durumda Hangi Test Kullanılır?
Normallik sonucu, kullanılacak analiz yöntemini etkileyen önemli bir faktördür.
İki bağımsız grup karşılaştırılacaksa ve veri normal dağılıyorsa bağımsız örneklem t testi, normal dağılmıyorsa Mann-Whitney U testi kullanılabilir.
İki bağımlı ölçüm karşılaştırılacaksa ve veri normal dağılıyorsa eşleştirilmiş örneklem t testi, normal dağılmıyorsa Wilcoxon testi tercih edilebilir.
Üç veya daha fazla bağımsız grup karşılaştırılacaksa ve veri normal dağılıyorsa ANOVA, normal dağılmıyorsa Kruskal-Wallis testi kullanılabilir.
İki sürekli değişken arasındaki ilişki incelenecekse ve değişkenler normal dağılıyorsa Pearson korelasyon, normal dağılmıyorsa Spearman korelasyon kullanılabilir.
Normallik Testinde En Sık Yapılan Hatalar
Normallik değerlendirmesinde en sık yapılan hatalardan biri yalnızca p değerine bakarak karar vermektir. Oysa normallik, test sonuçları ve grafiklerle birlikte değerlendirilmelidir.
Bir diğer hata, büyük örneklemlerde p değerinin küçük çıkmasını doğrudan “veri kullanılamaz” şeklinde yorumlamaktır. Büyük örneklemlerde normallik testleri çok hassastır ve küçük sapmaları bile anlamlı gösterebilir.
Ayrıca ölçek toplam puanları, alt boyut puanları ve tek tek madde puanları aynı şekilde değerlendirilmemelidir. Likert tipi tek maddeler çoğu zaman normal dağılım göstermeyebilirken, toplam ölçek puanları daha dengeli bir dağılım gösterebilir.
Normallik testi sonucuna göre yanlış analiz seçmek de sık karşılaşılan hatalardandır. Bu nedenle normallik değerlendirmesi, araştırma sorusu, değişken türü ve örneklem büyüklüğüyle birlikte düşünülmelidir.
Sonuç
Normallik testi, istatistiksel analiz sürecinin temel aşamalarından biridir. Verilerin normal dağılıma uygun olup olmadığını belirlemek, kullanılacak testin doğru seçilmesini sağlar. Ancak normallik değerlendirmesi yalnızca Shapiro-Wilk veya Kolmogorov-Smirnov testinden ibaret değildir.
Sağlıklı bir değerlendirme için test sonuçları, çarpıklık-basıklık değerleri, histogram, Q-Q Plot grafiği ve örneklem büyüklüğü birlikte ele alınmalıdır. Böylece araştırmacı, parametrik veya parametrik olmayan testlerden hangisini kullanacağına daha doğru karar verebilir.
Kısacası normallik testi, veriyi anlamanın ve doğru istatistiksel analize ulaşmanın önemli bir basamağıdır. Doğru yorumlandığında araştırmanın bilimsel güvenilirliğine doğrudan katkı sağlar.