İstatistik biliminde kutu grafiği (İngilizce: Box plot) bir betimsel istatistik ve aleti olup niceliksel verileri görsel şekilde özetlemek için Amerikan istatistikçi John Tukey tarafından kutu-ve-bıyıklar grafiği adı altında bir aracı olarak ilk defa geliştirilmiştir. Kutu grafiği, ilgili değişken bakımından veri için hazırlanan gösterimini grafiksel olarak özetlemeye dayalıdır. Özellikle merkezsel konum, yayılma, çarpıklık ve basıklık yönünden verileri özetlemek ve aykırı değerleri tanımlamak için kullanılır.
En basit çiziminde izlenecek yordam
1. Veri seti için Xmed: medyan (ortanca), Xmin (en küçük gözlem değeri), Q1 (birinci dörttebirlik) ve Q3 (üçüncü dörttebirlik) ve Xmaks(en büyük gözlem değeri) olarak bulunur. Bunun en kolay yaklaşımı veri setinin en küçük değerden en büyük değere kadar sıralaması yapılmasi ve bu sıralamadan beş sayılı özetleme tablosu çıkarılmasıdır; yani şu tablo verilebilir:
- Xmed
- Q1 Q3
- Xmin Xmaks
2. Kutu grafiği iskeleti, veri minimum ile maksimum değerleri arasında üzeri ölçekli bir çizgiden oluşur; yani Xmin lle Xmaks noktaları arasında ya yatay ya da dikey bir çizgi halindedir.
3. Bu çizgi üzerinde ölçeğe göre bir kutu çizilir. Kutunun en küçük değeri birinci dörttebirlik Q1 ve en büyük değeri üçüncü dörttebirlik Q3 olur. Kutunun uç noktalarına Tukey tarafından "menteşe" adı verilmiştir; yani Q1 ve Q3 kutunun uç noktaları "menteşe" noktalarıdır. Bu kutunun uzunluğu QA = Q3 - Q1 olur ve bu QA verinin çeyrekler açıklığı ölçüsünü gösterir. Dikkat edilirse böylece gösterim bir "kutu" ile dörttebirlikler dışındaki (yani "menteşe" dışındaki) veri değerlerini gösteren "bıyıklar" şekle girmiştir. Bunun için bu grafiğe tarafından kutu-ve-bıyıklar grafiği adı verilir.
4. Medyan "kutu"nun içinde ölçeğe göre yerine konulup işaretlenir.
Yorumlanması
Veri setinin niteliklerini bir kutu grafiği görsel şekilde ifade eder:
- Merkezsel konum: Verinin merkezsel konumu kutunun içinde işaretlemiş olan medyan noktası ile gösterilir.
- Yayılma: Verinin yayılmasının açıklık ölçüsüyle ölçülen niteliği, "kutu grafiği"'nin (yatay veya dikey) tüm çizgisi ile görülür. Çeyrekler açıklığı ise "kutu grafiği"nde kutunun büyüklüğü ile görülür.
- Şekil:
- Çarpıklık: Verinin "çarpıklık" ölçüsü bu grafikte bulunmaz. Ama verinin çarpıklık karakteri kutunun tüm çizginin küçük Xmin tarafına mı yoksa büyük Xmaks tarafına mı yakın olması ile görülür. Eğer kutu, çizginin küçük tarafında ise, kutu içindeki medyan noktası Xmin değerine yakın olur ve kutu dışında kalan çizginin yüksek kısmı (yani Xmaksa doğru kısmı) pozitife doğru uzunca bir kuyruk gösterir. Bu demektir ki veri pozitif çarpıklık niteliği gösterir. Eğer kutu, çizginin büyük tarafında ise, yani medyan noktası Xmaks değerine yakın ise, kutu dışında kalan çizginin düşük kısmı (yani Xmine doğru kısmı) negatife doğru uzun kuyruklu olur ve böylece veri değerleri negatif çarpıklık gösterir. Ancak "çarpıklık" karakterini doğrudan doğruya ölçen bir sayısal ölçü "kutu grafiği"nden hemen doğrudan doğruya çıkmaz.
- Basıklık: Yine basıklık ölçüsü bu grafikte yoktur. Ama verinin basıklık niteliği hakkında bu grafikten bir kanaat edinilebilir. Dikkat edilirse bu kanaat edinme olup, epeyce zayıf, bir intiba edinme şeklindedir ve tam olarak basıklık niteliği öğrenilmez. Basıklık için bir kanaat sağlama kutunun genişliği ile çizginin genişliğini karşılaştırılma ile edinilebilir. Eğer kutu çizginin çoğunu kapsıyorsa genellikle verinin basık olduğu hakkında bir ilk intiba ortaya çıkabilir.
Alternatif şekiller
Aykırı değer sorunları ve kutu grafiği
Eğer veri sıralaması sonunda ya diğer değerlerden çok küçük veya diğer değerlerden çok büyük uç değer bulunmaktaysa kutu grafiği için bu problem olabilir. Bu çok değişik uç değerler bıyık çizgilerini çok uzun yapıp, geri kalan verilerin birbirine çok yakın olmalarına, hatta birbirleri ile çakışmalarına, neden olabilir. Bu nedenle alternatif kutu grafikleri kullanılabilir ve bu alternatifle uç noktalarının minimum ve maksimum veri değerlerinden diğer değerler olmasına dayanır. Şu alternatifler kullanılmıştır:
- Uç noktalarının kutu uçlarından 1,5 kutu genişliğe (yani 1.5 x "çeyrek aralığı") kadar uzatılması;
- Uç noktaları veri aritmetik ortalama etrafında ortalama değerinden 1 standart sapma altına ve üstüne uzatılması;
- Uç noktalarının 9. yüzdebirlik ile 91. yüzdebirlik olması;
- Uç noktalarının 2. yüzdebirlik ile 98. yüzdebirlik olması;
Bu şekillerde değişik uç noktası kullanıldığı zaman aykırı değerler özel olarak çizginin dışında, çok kere ölçeğe uymadan, birer nokta (veya boş nokta veya küçük yıldız veya *) halinde gösterilmeleri tavsiye edilmektedir.
Çentikli kutu grafiği
Bu halde kutu grafiğinde (çok kere kutu içinde medyan noktasının hemen yanında) bir veri aritmetik ortalama noktası konulmakta ile %95 (hatta %99) güven aralığı alt ve üst sınırları da birer "çentik (notch)" olarak çizgi üzerine konulmaktadır. Bu yaklaşım ile bir betimsel istatistik gösterim aracı olan kutu grafiği üzerine bir çıkarımsal istatistik (yani güven aralığı) eklenmiş olmakta ve kutu grafiğinin temelden karakteri değiştirilmektedir. Bir "çentikli kutu grafiği" çok kere bir çeşit çıkarımsal analiz aracı olarak aykırı değerlerin tanımlanması için kullanılmaktadır. Bazen kutu uçlarından çentiklere kadar "kalın bıyıklar" çizilmektedir.
Diğer yaklaşımlar
Kutu grafiğinin çeşitli diğer alternatifleri de bulunmaktadır ve bunlar burada hiç kritik görmeden şöyle sıralanabilir:
- Bazen kutu grafikleri ya bir çubuk olarak ya da bir çizgi olarak verilip sadece bunlar üzerinde beş nokta ayrıca yazılarak gösterilir.
- Bazen %2, %9, %91, %98 gibi beklemedik yüzdebirlikler de (%25, %50 ve %75 yüzdebirliklerle birlikte) yedi nokta olarak özel olarak gösterilmektedir. Eğer veri bir normal dağılım gösterirse bu 7 yüzdebirlik birbirlerinden eşit aralıklarla ayrılması gerekmektedir. Böylece kutu grafiği bir normal dağılıma uygunluk testi için parametrik olmayan sınama (uyma uygunluğu sınaması) aleti olarak kullanılmaktadır.
Örnekler
Ör.1./ İki örneklem veri seti için şu "Beş sayılı özetleme tablosu" verilmiş ve şu iki yatay "kutu grafiği" çizilmiştir:
- Örneklem 1 (üstte) : Xmin=1, Q1= 7, Xmed= 9, Q3 = 12, Xmaks = 16.
- Örneklem 2 (altta) : Xmin=1, Q1= 3, Xmed= 7, Q3 = 12, Xmaks = 16.
Ör.2./ Bir tüketim malı için yapılan yarışmaya cevap kuponu gönderenlerin yaşları şöyledir:
- 23, 21, 10, 15, 12, 15, 39, 17, 21, 30, 18, 20
Bu veri setinin en küçükten en büyüğe sıralanması şöyle elde edilir:
- 10, 12, 15, 15, 17, 18, 20, 21, 21, 23, 30, 39
"Beş sayılı özetleme tablosu" şöyle bulunur:
- 19
- 15 22
- 10 39
Şu yatay kutu grafiği çizilmiştir:
+---+--+ ----| + |-------- * +---+--+ -+----+----+----+----+----+----+- Yaş 10 15 20 25 30 35 40
Not: 39 tam bir "aykırı değer" olduğu için tek başına bir nokta halinde (*) ile gösterilir.
Kaynakça
- ^ "Beş sayılı özetleme tablosu" minimum. birinci dörttebirlik, medyan (ortanca), üçüncü dörttebirlik ve maksimum değerlerinin ya bir sıra halinde ya da medyan en üstte ortada, dörttebirlikler ikinci satırda medyan yanlarında ve manimum ve maximum üçüncü satırda en dışarıda yazılarak elde edilen tablodur.
- İngilizce Wikipedia "Box_plot" maddesi 21 Haziran 2010 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişme:14.5.2010)
Ayrıca bakınız
Dış kaynaklar
Wikimedia Commons'ta Kutu grafiği ile ilgili ortam dosyaları bulunmaktadır. |
- Tukey, John W. (1977), Exploratory Data Analysis (Açıklayıcı Veri Analizi). Reading MA.:Addison-Wesley (İngilizce)
- McGill, R., John W. Tukey ve Wayne A. Larsen. (1978) "Variations of Box Plots" 10 Temmuz 2015 tarihinde Wayback Machine sitesinde .. The American Statistician, Cilt.32(1), say.12-16. (İngilizce) (Erişme:14.5.2010).
- "Kutu Grafiği" çizmek iin Microsoft Excel Kutuçizim kullanılması 2 Mayıs 2010 tarihinde Wayback Machine sitesinde . (İngilizce) (Erişme:14.5.2010).
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Istatistik biliminde kutu grafigi Ingilizce Box plot bir betimsel istatistik ve aleti olup niceliksel verileri gorsel sekilde ozetlemek icin Amerikan istatistikci John Tukey tarafindan kutu ve biyiklar grafigi adi altinda bir araci olarak ilk defa gelistirilmistir Kutu grafigi ilgili degisken bakimindan veri icin hazirlanan gosterimini grafiksel olarak ozetlemeye dayalidir Ozellikle merkezsel konum yayilma carpiklik ve basiklik yonunden verileri ozetlemek ve aykiri degerleri tanimlamak icin kullanilir veri setleri icin dikey Kutu Grafikleri En basit ciziminde izlenecek yordam1 Veri seti icin Xmed medyan ortanca Xmin en kucuk gozlem degeri Q1 birinci dorttebirlik ve Q3 ucuncu dorttebirlik ve Xmaks en buyuk gozlem degeri olarak bulunur Bunun en kolay yaklasimi veri setinin en kucuk degerden en buyuk degere kadar siralamasi yapilmasi ve bu siralamadan bes sayili ozetleme tablosu cikarilmasidir yani su tablo verilebilir Xmed Q1 Q3 Xmin Xmaks 2 Kutu grafigi iskeleti veri minimum ile maksimum degerleri arasinda uzeri olcekli bir cizgiden olusur yani Xmin lle Xmaks noktalari arasinda ya yatay ya da dikey bir cizgi halindedir 3 Bu cizgi uzerinde olcege gore bir kutu cizilir Kutunun en kucuk degeri birinci dorttebirlik Q1 ve en buyuk degeri ucuncu dorttebirlik Q3 olur Kutunun uc noktalarina Tukey tarafindan mentese adi verilmistir yani Q1 ve Q3 kutunun uc noktalari mentese noktalaridir Bu kutunun uzunlugu QA Q3 Q1 olur ve bu QA verinin ceyrekler acikligi olcusunu gosterir Dikkat edilirse boylece gosterim bir kutu ile dorttebirlikler disindaki yani mentese disindaki veri degerlerini gosteren biyiklar sekle girmistir Bunun icin bu grafige tarafindan kutu ve biyiklar grafigi adi verilir 4 Medyan kutu nun icinde olcege gore yerine konulup isaretlenir YorumlanmasiVeri setinin niteliklerini bir kutu grafigi gorsel sekilde ifade eder Merkezsel konum Verinin merkezsel konumu kutunun icinde isaretlemis olan medyan noktasi ile gosterilir Yayilma Verinin yayilmasinin aciklik olcusuyle olculen niteligi kutu grafigi nin yatay veya dikey tum cizgisi ile gorulur Ceyrekler acikligi ise kutu grafigi nde kutunun buyuklugu ile gorulur Sekil Carpiklik Verinin carpiklik olcusu bu grafikte bulunmaz Ama verinin carpiklik karakteri kutunun tum cizginin kucuk Xmin tarafina mi yoksa buyuk Xmaks tarafina mi yakin olmasi ile gorulur Eger kutu cizginin kucuk tarafinda ise kutu icindeki medyan noktasi Xmin degerine yakin olur ve kutu disinda kalan cizginin yuksek kismi yani Xmaksa dogru kismi pozitife dogru uzunca bir kuyruk gosterir Bu demektir ki veri pozitif carpiklik niteligi gosterir Eger kutu cizginin buyuk tarafinda ise yani medyan noktasi Xmaks degerine yakin ise kutu disinda kalan cizginin dusuk kismi yani Xmine dogru kismi negatife dogru uzun kuyruklu olur ve boylece veri degerleri negatif carpiklik gosterir Ancak carpiklik karakterini dogrudan dogruya olcen bir sayisal olcu kutu grafigi nden hemen dogrudan dogruya cikmaz Basiklik Yine basiklik olcusu bu grafikte yoktur Ama verinin basiklik niteligi hakkinda bu grafikten bir kanaat edinilebilir Dikkat edilirse bu kanaat edinme olup epeyce zayif bir intiba edinme seklindedir ve tam olarak basiklik niteligi ogrenilmez Basiklik icin bir kanaat saglama kutunun genisligi ile cizginin genisligini karsilastirilma ile edinilebilir Eger kutu cizginin cogunu kapsiyorsa genellikle verinin basik oldugu hakkinda bir ilk intiba ortaya cikabilir Alternatif sekillerAykiri deger sorunlari ve kutu grafigi Eger veri siralamasi sonunda ya diger degerlerden cok kucuk veya diger degerlerden cok buyuk uc deger bulunmaktaysa kutu grafigi icin bu problem olabilir Bu cok degisik uc degerler biyik cizgilerini cok uzun yapip geri kalan verilerin birbirine cok yakin olmalarina hatta birbirleri ile cakismalarina neden olabilir Bu nedenle alternatif kutu grafikleri kullanilabilir ve bu alternatifle uc noktalarinin minimum ve maksimum veri degerlerinden diger degerler olmasina dayanir Su alternatifler kullanilmistir Uc noktalarinin kutu uclarindan 1 5 kutu genislige yani 1 5 x ceyrek araligi kadar uzatilmasi Uc noktalari veri aritmetik ortalama etrafinda ortalama degerinden 1 standart sapma altina ve ustune uzatilmasi Uc noktalarinin 9 yuzdebirlik ile 91 yuzdebirlik olmasi Uc noktalarinin 2 yuzdebirlik ile 98 yuzdebirlik olmasi Bu sekillerde degisik uc noktasi kullanildigi zaman aykiri degerler ozel olarak cizginin disinda cok kere olcege uymadan birer nokta veya bos nokta veya kucuk yildiz veya halinde gosterilmeleri tavsiye edilmektedir Centikli kutu grafigi Bu halde kutu grafiginde cok kere kutu icinde medyan noktasinin hemen yaninda bir veri aritmetik ortalama noktasi konulmakta ile 95 hatta 99 guven araligi alt ve ust sinirlari da birer centik notch olarak cizgi uzerine konulmaktadir Bu yaklasim ile bir betimsel istatistik gosterim araci olan kutu grafigi uzerine bir cikarimsal istatistik yani guven araligi eklenmis olmakta ve kutu grafiginin temelden karakteri degistirilmektedir Bir centikli kutu grafigi cok kere bir cesit cikarimsal analiz araci olarak aykiri degerlerin tanimlanmasi icin kullanilmaktadir Bazen kutu uclarindan centiklere kadar kalin biyiklar cizilmektedir Diger yaklasimlar Kutu grafiginin cesitli diger alternatifleri de bulunmaktadir ve bunlar burada hic kritik gormeden soyle siralanabilir Bazen kutu grafikleri ya bir cubuk olarak ya da bir cizgi olarak verilip sadece bunlar uzerinde bes nokta ayrica yazilarak gosterilir Bazen 2 9 91 98 gibi beklemedik yuzdebirlikler de 25 50 ve 75 yuzdebirliklerle birlikte yedi nokta olarak ozel olarak gosterilmektedir Eger veri bir normal dagilim gosterirse bu 7 yuzdebirlik birbirlerinden esit araliklarla ayrilmasi gerekmektedir Boylece kutu grafigi bir normal dagilima uygunluk testi icin parametrik olmayan sinama uyma uygunlugu sinamasi aleti olarak kullanilmaktadir OrneklerOr 1 Iki orneklem veri seti icin su Bes sayili ozetleme tablosu verilmis ve su iki yatay kutu grafigi cizilmistir Orneklem 1 ustte Xmin 1 Q1 7 Xmed 9 Q3 12 Xmaks 16 dd Orneklem 2 altta Xmin 1 Q1 3 Xmed 7 Q3 12 Xmaks 16 dd Or 2 Bir tuketim mali icin yapilan yarismaya cevap kuponu gonderenlerin yaslari soyledir 23 21 10 15 12 15 39 17 21 30 18 20 dd Bu veri setinin en kucukten en buyuge siralanmasi soyle elde edilir 10 12 15 15 17 18 20 21 21 23 30 39 dd Bes sayili ozetleme tablosu soyle bulunur 19 15 22 10 39 Su yatay kutu grafigi cizilmistir Yas 10 15 20 25 30 35 40 Not 39 tam bir aykiri deger oldugu icin tek basina bir nokta halinde ile gosterilir Kaynakca Bes sayili ozetleme tablosu minimum birinci dorttebirlik medyan ortanca ucuncu dorttebirlik ve maksimum degerlerinin ya bir sira halinde ya da medyan en ustte ortada dorttebirlikler ikinci satirda medyan yanlarinda ve manimum ve maximum ucuncu satirda en disarida yazilarak elde edilen tablodur Ingilizce Wikipedia Box plot maddesi 21 Haziran 2010 tarihinde Wayback Machine sitesinde arsivlendi Ingilizce Erisme 14 5 2010 Ayrica bakinizJohn Tukey Coklu sayili ozetleme tablolariDis kaynaklarWikimedia Commons ta Kutu grafigi ile ilgili ortam dosyalari bulunmaktadir Tukey John W 1977 Exploratory Data Analysis Aciklayici Veri Analizi Reading MA Addison Wesley Ingilizce McGill R John W Tukey ve Wayne A Larsen 1978 Variations of Box Plots 10 Temmuz 2015 tarihinde Wayback Machine sitesinde The American Statistician Cilt 32 1 say 12 16 Ingilizce Erisme 14 5 2010 Kutu Grafigi cizmek iin Microsoft Excel Kutucizim kullanilmasi 2 Mayis 2010 tarihinde Wayback Machine sitesinde Ingilizce Erisme 14 5 2010