İstatistikte Merkezi Yayılım Ölçüleri

Ekim 22, 2019
Merkezi yayılım ölçüleri hayati öneme sahiptir, çünkü size bir spesifik veri setinin veya grubun içerisindeki dağılımı gösterirler. Veri setleri söz konusu olduğunda bu yayılım önemlidir, çünkü ortalamalar gibi merkezi yayılım ölçüleri ile ilgili çıkarımlar yaparken dikkate almanız gereken yanılma payını belirler.

Merkezi yayılım ölçüleri, herhangi bir veri seti söz konusu olduğunda önemli bir role sahiptir. Bu ölçüler, merkezi eğilim ölçüleri ile birlikte kullanılır ve size elinizdeki veri setinin değişkenliğini gösterirler. 

Merkezi eğilim ölçüleri, size verilerinizi gruplamak için kullanabileceğiniz farklı yolları gösterir. Farklı değişkenlerin bir spesifik veri setinin veya bir grubun içerisinde nasıl farklılık gösterdiğini bulmak için kullanılabilirler. Size gösterebilecekleri üç temel şey medyan, ortalama ve açıklıktır.

Merkezi yayılım ölçüleri, genelde merkezi eğilim ölçüleri ile birlikte kullanılır. Bu ölçüler de bir veri setini incelerken gereklidir çünkü size verilerinizin ne kadar değişken olduğunu gösterirler. Bu ölçülerin istatistikteki rollerinin önemi, Wild ve Pfannkuch tarafından güçlendirilmiştir (1999).

Bu araştırmacılara göre, verilerin değişkenliği ile ilgili algımız istatistiksel düşüncenin temel bileşenlerinden biridir. Değişkenliği algılama şeklimiz bize verinin ortalama ve medyanlar açısından yayılımı ile ilgili bilgi verir. 

Ortalama, istatistikte çok sık kullanılan bir konsepttir. Ancak, ortalamaları yanlış yorumlamak da son derece kolaydır. Bu en çok, verilerin arasında büyük yayılım farklılıkları olduğunda ortaya çıkar. Merkezi yayılım ölçüleri tam da bu noktada işimize yaramaya başlar (2).

Merkezi yayılım ölçüleri söz konusu olduğunda, rastgele değişkenlerle ilgili üç önemli bileşen vardır (2):

  • Etrafınızdaki dünyada ne kadar sık görüldüklerine dair algınız.
  • Elinizdeki açıklamalara zıt başka bir açıklama olup olmadığı.
  • Bu açıklamaları sayısal şekilde açıklayabilme beceriniz (ki bu da, yayılım konseptini anlamanızı ve nasıl uygulandığını bilmenizi gerektirir).
Bir tahta dolusu yazıya bakan arkasını dönmüş bir adam.

Merkezi yayılım ölçüleri ne için kullanılır?

Merkezi yayılım ölçüleri verilerden çıkarımlar yapmaya çalıştığınız her türlü istatistik araştırmada önemlidir. Bunun sebebi, merkezi yayılım ölçülerinin üzerinde çalıştığınız veri setindeki yanılma payı üzerinde direkt bir etkisi olmasıdır. Bir veri setinin yayılımı ne kadar genişse, bu sınırlarda çalışmak için o kadar fazla alana ihtiyacınız olacaktır.

Merkezi yayılım ölçüleri ayrıca size verilerinizin merkezi eğilimden ne kadar uzağa düştüğü ile ilgili de bilgi verir. Size gösterdiği asıl şey, merkezi eğilimin araştırmanız için veri topladığınız insanları temsil etmek için iyi bir yol olup olmadığıdır. Bu, dağılımları karşılaştırmak ve bazı kararlar almanın olası risklerini anlamak için size son derece yardımcı olacaktır (1).

Özetlemek gerekirse, yayılım ne kadar fazlaysa, merkezi eğiliminiz elinizdeki veri setini o kadar az temsil edecektir. Aşağıda, en çok kullanılan merkezi yayılım ölçülerini bulabilirsiniz:

Bu kavramların çalışma şekilleri

Açıklık

Açıklık, ilk karşılaştırmalarınızı yapmak için genelde işe yarar, çünkü sadece veri setinizin iki ucuna bakar. Bu aynı zamanda, küçük veri setleriyle kullanılmasını daha mantıklı kılar (1). Açıklığın temel tanımı; ilk ve son veri arasındaki fark olarak yapılabilir.

Tam ve yarım birtakım elmaların fotoğrafı.

Ortalama sapma

Sırada, ortalama sapma var. Ortalama sapma size eğer tüm veriler ortalamadan tam olarak aynı uzaklıkta olsaydı verilerin nasıl görüneceğini gösterebildiği için son derece yardımcıdır (1). Bir değişken ile bir sayı arasındaki sapma, bu değişkenin mutlak değeri ile ortalama arasındaki fark alınarak bulunur. Dolayısıyla, ortalama sapma temelde bütün sapmaların ortalaması olarak açıklanabilir (3).

Varyans

Varyans, tüm değerler için hesaplanan bir cebir fonksiyonudur ve çıkarsamalı istatistikte kullanılmak için mükemmel olan bir hesaplamadır (1). Varyans, tüm sapmaların karesi alınarak bulunur.

Standart sapma

Standart sapma, aynı insan grubundan alınmış herhangi bir veri setiyle çalışılırken en sık kullanılan yayılım ölçüsüdür (1). Varyansın karekökü alınarak bulunur (3).

Varyasyon katsayısı

Bu ölçü, çoğunlukla iki farklı gruba yerleştirilmiş iki farklı veri seti arasındaki varyansı karşılaştırmak için kullanılır. Örnek vermek gerekirse, bir okuldaki öğrencilerin boy ve kiloları ile ilgili veri toplamış olduğunuzu düşünelim. Varyasyon katsayısı size hangi spesifik dağılımda verilerin en fazla gruplandığını gösterebilir ve böylece ölçümünüz gerçeği daha iyi temsil edebilir.

Bir tablette açılmış grafik resimleri.

Varyasyon katsayısı, şimdiye kadar bahsettiğimiz merkezi yayılım ölçülerinin en temsilci olanıdır çünkü size soyut bir sayı verir. Başka bir deyişle, varyasyon katsayısı elinizdeki veri setlerindeki sayıların ne olduğundan bağımsız bir ölçüm aracıdır. Genelde, varyasyon katsayısının bir yüzde olarak verildiğini görürsünüz (3).

Bu merkezi yayılım ölçüleri size elinizdeki örneklemde ne kadar değişkenlik olduğunu gösterir. Ayrıca size merkezi eğiliminizin de örnekleminizi ne kadar temsil ettiğini gösterirler. Eğer değişkenliğiniz düşükse, bu elinizdeki veri setinin eğiliminize nispeten yakın olduğunu ve genel veri grubunuzun iyi bir temsili olduğunu gösterir.

Diğer taraftan, eğer yüksek bir değişkenliğiniz varsa, bu elinizdeki verilerin bir noktada yoğunlaşmak yerine dağınık olduğu anlamına gelir. Yüksek değişkenlik merkezi eğiliminizin genel veri grubunuzu pek iyi temsil etmediğini gösterir. Böyle bir durumda, daha büyük bir veri havuzuna ihtiyacınız olacaktır. Daha fazla veriye sahip olmak değişkenliği azaltacaktır, ki zaten bu değişkenlik de büyük bir yanılma payınız olmasına sebep olan şeydir.

  1. Graus, M. E. G. (2018). Estadística aplicada a la investigación educativa. Dilemas Contemporáneos: Educación, Política y Valores, 5(2).
  2. Batanero, C., González-Ruiz, I., del Mar López-Martín, M., & Miguel, J. (2015). La dispersión como elemento estructurador del currículo de estadística y probabilidad. Epsilon, 32(2), 7-20.
  3. Folgueras Russell, P. Medidas de Dispersión. Retrieved from https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=2ahUKEwixgPLvw_XgAhVDAmMBHW02AesQFjABegQIBRAC&url=http%3A%2F%2Fwww.educaguia.com%2FBiblioteca%2Fapuntesde%2Fmatematicas%2FESTADISTICAYPROBABILIDAD%2FMEDIDASDEDISPERSION.pdf&usg=AOvVaw0DCZ9Ej1YvX7WNEu16m2oF
  4. Wild, C. J. y Pfannkuch, M. (1999). Statistical thinking in empirical enquiry. International
    Statistical Review, 67(3), 223-263.