İstatistik bilim dalında, Kolmogorov-Smirnov (K-S) sınaması parametrik olmayan istatistik olup Andrey Kolmogorov ve adlarındaki iki Sovyet bilim insanı tarafından oluşturulmuştur.
Bu sınama iki değişik problem için olarak kullanılır:
- Tek örneklem K-S sınaması: Hedef, verilmiş olan bir deneysel olasılık dağılımı gösteren örneklem verilerinin, dağılım parametreleri tam olarak bilinen tam tanımlanmış bir teorik anakitle olasılık dağılımına uyum gösterip göstermediğini sınamak. Bu tip problemde sıfır hipotez Ho örneklem verilerin deneysel dağılımının tam tanımlanmış bir anakitle olasılık dağılımından gelmiş olduğudur.
- İki örneklem K-S sınaması: Hedef, verilmiş iki tane değişik deneysel olasılık dağılımı gösteren iki örneklem veri serisinin aynı tek bir teorik anakitle olasılık dağılımından gelip gelmediğini sınamak. Bu tip problemde sıfır hipotez Ho ise iki örneklem verilerin deneysel dağılımlarının tek bir anakitle olasılık dağılımından gelmiş olduğudur.
Tek örneklem K-S sınaması çok popüler olarak olarak bir normallik sınaması olarak, yani örneklem verilerinin tanımlanmış bir anakitle normal olasılık dağılımına uyumluluk gösterip göstermemesini sınamak için kullanılır. Örneklem verileri standardize edilerek (yani her bir veri değerinden teorik anakitle olasılığı için verilmiş ortalama çıkartıp sonucu verilmiş teorik yığın varyansına bölerek) elde edilen normalize veriler standart normal dağılım ile karşılaştırılır. Fakat bu türlü dönüşüm yapmanın sınamanın gücünü azalttığı ispat edilmiştir. Bu taraflılığın düzeltilmesi ortaya çıkartır. Fakat, Anderson-Darling sınaması veya Shapiro-Wilk sınaması normallik sınaması olarak hem Lilliefors sınaması hem de K-S tek örneklem normallık sınamasından daha güçlüdür. K-S tek örneklem sınaması, gözlenen ve beklenen kümülatif frekans dağılış arasındaki mutlak farklılıklar dikkate alınarak geliştirilmiştir. Örneklem hacmi küçük olduğu için uygulanamadığı durumlarda Kolmogorov-Simirnov testi kullanılabilir.
"İki örneklem K-S sınaması" hem genel olarak uygulanabilen hem de çok kullanışlı olan bir "parametrik olmayan sınama" yöntemidir çünkü bu sınama hem konum hem de dağılım şekline duyarlıdır ve bu türlü problem çözümü için popüler olarak kullanılır.
Prensip
Bu test örneklem deneysel dağılım fonksiyonunun özelliklerine bağlıdır. n örneklem hacmi büyüklüğü de örneklem verilerinin; yani
değerlerinin n tane birbirinden bağımsız ve reel değerli rastgele değişken olduğunu kabul edelim. Bu halde örnekleme deneysel dağılım fonksiyonu şöyle tanımlanabilir: burada
Tüm sabitleri için, bu sürec için deneysel dağılım fonksiyonu ile değerleri arasında büyüme fonksiyonları uzayında değerler alır ve bunun özellikleri arasında şuna yakınsama gösterir:
Eğer ise teriminin değeri ne yakınsar. Dikkat edilirse sağa doğru limit 'ye dayanmadığı görülür.
Kolmogorov dağılımı şu rassal değişkenin dağılımıdır:
burada B(t) bir olur. Knin birikimli dağılım fonksiyonu şöyle verilir:
Sıfır hipotezi doğru ise örneklem şu hipotez olarak verilen F(x) dağılımından gelir:
burada B(t) "Brown tipi köprü" olur.
Eğer sıfır hipotezinde verilen F sürekli ise
bir Kolmogorov dağılımına yakınsar ve bu F dağılımına dayanmaz.
Tek örneklem K-S sınaması yani uyumluluk iyiliği sınaması Kolmogorov fonksiyonunun kritik değerlerini kullanılarak yapılır. Sıfır hipotezini seviyesinde reddetmek için
ifadesinden bulunan Kα için
olması gerekir.
Bu testin asimptotik "istatistik gücü" 1e eşittir. Eğer F(x) fonksiyonunun şekli veya parametreleri örneklem
verileri ile bulunursa, yukarıda verilen kritik değerler uygun değildir. Bu hallerde Monte Carlo simülasyon yöntemi veya benzer sayısal yöntemler kullanılması gerekir. Ama bazı haller için özel tablolar kurulmuştur. Pearson ve Hartley (1957) Tablo 54de normal dağılım ve için kritik değerleri ve test istatistiğini vermektedir.
Örnek problemler
Örnek verilerini vermek ve K-S sınamalarını uygulamak için "R" adı altında hazırlanmış olan ve standart olarak uygulanan ve telif hakkı gerektirmeyen serbest kullanılma hakları verilmiş bir istatistik yazılım paketi kullanılacaktır.
Simülasyonla üretilen veriler
Önce üç değişik veri serisi üretilmiştir. İstenilen gözlem sayısında ve istenilen olasılık dağılımında, simülasyonla R istatistik paketi özel simülasyon ile veri üretme komutası kullanılmıştır:
- X veri serisi için 50 gözlem üretilmiştir ve bunların (ortalaması 0 ve varyansı 1 olan) bir standart normal dağılıma sahip olarak (R yazılım paketi için X ← rnorm(50) komutası ile) simülasyonla elde edilmişlerdir.
- Y veri serisi için 40 gözlem standart normal dağılıma sahip olarak (R yazılım paketi için Y ← rnorm(40) komutası ile) simülasyonla elde edilmişlerdir.
- Z veri serisi için 30 gözlem (0 ile 1 arasında) sürekli tekdüze dağılıma sahip olarak (R yazılımı icin Y ← runif(30) komutası ile) simülasyonla elde edilmişlerdir.
Tek örneklem Kolmogorov-Smirnov sınaması örnek problemleri
Örnek problem 1:
Örneklem veri serilerinin nasıl ortaya çıktığının bilinmediğini düşünelim ve 50 gözlemli bir gerçek örneklem X veri serisi "(0-1) arasında sürekli tekdüze dağılım gösteren bir anakitle yığından gelmiş midir yoksa gelmemiş midir?" sorunu problem olsun. Bu soruna yanıt "tek örneklem Kolmogorov-Smirnov sınaması" ile bulunur:
Önce hipotezler verilir:
H0 : Bu n=50 örneklem serisi verilen U(0,1) (yani 0 ile 1 arasında sürekli tekdüze) dağılımlı bir anakitleden gelmektedir. H1 : Bu n=50 örneklem serisi verilen U(0,1) (yani 0 ile 1 arasında sürekli tekdüze) dağılımlı anakitleden gelmemektedir.
Bu sınama için alternatif hipotezde pozitif bir dağılım ifadesi bulunmaz ve anakitle dağılımının ne olmadığına dair negatif bir hipotezdir. Tek örneklem K-S sınaması iki-kuyruklu testtir.
İkinci aşamada da Kolmogorov-Smirnov istatistiği D-değeri ve bunun karşıtı olan olasılık p-değerini bulmak için R paketine özel bir komuta kullanılır; bu komuta şudur: ks.test(X, "punif") . Bundan sonra kompüter programı hesaplar başlar ve bir çıktı sonucunu (İngilizce olarak) ekrana verir. Bunu şu tabloda özetleyelim:
R yazılımı komutası | ks.test(X, "punif") |
---|---|
Ekranda gösterilen sonuç | One-sample Kolmogorov-Smirnov test data: X D = 0.5501, p-value = 1.033e-14 |
Burada 0.5551 olarak hesaplanan D istatistiğine tekabül eden kritik sınır p-değeri 1.033x10−14 çok küçük bir değerdir. Bu p-değeri istatistikçilerin kullandığı %5 veya %1'den çok daha küçük olduğundan reddetme alanındır. Bu nedenle X veri serisinin bir (0-1) arasında tekdüze dağılımlı anakitleden gelmediği sonucuna varılması gerekir. Ama görüldüğü gibi sıfır hipotez reddedildiği zaman X veri serisinin hangi anakitle dağılımından geldiği bilinmez. Onun için yeni bir hipotez kurmak ve yeni bir sınama yapmak gerekir.
Örnek problem 2:
Yine X örneklem veri serilerinin nasıl elde edildiğini bilmediğimizi kabul edelim. 50 gözlemli bir X örneklem veri serisinin "standart normal dağılım gösteren bir yığından gelmiş midir yoksa gelmemiş midir?" sorununu problem olarak seçelim. Bu soruna yanıt "örneklemin veri serisinin verilmiş olan bir standart normal dağılımına uyum sınaması" yani "tek örneklem Kolmogorov-Smirnov sınaması" ile bulunur:
Hipotezler şunlardır:
H0 : Bu n=50 örneklem serisi verilen N(0,1) (yani standart normal) anakitleden gelmektedir. H1 : Bu n=50 örneklem serisi verilen N(0,1) (yani standart normal) anakitleden gelmemektedir.
Tek örneklem K-S sınaması iki-kuyruklu bir testtir.
İkinci aşamada da Kolmogorov-Smirnov istatistiği D-değeri ve bunun karşıtı olan olasılık p-değeri bulunur. Bunları hesaplamak için gereken formüller yukarıda verilmiştir. Burada hesaplama için R paketi kullanılmaktadır. Bu paketle tek örneklem K-S testi için gereken D istatistiğini ve bunun p değerini bulmak için şu özel komuta kullanılır: ks.test(x, "pnorm"). Bunu kullanan kompüter programı bir çıktı sonucunu ekrana verir ve sonucu şöyle özetleyelim:
R yazılımı komutası | ks.test(X, "pnorm") |
---|---|
Ekranda gösterilen sonuç | One-sample Kolmogorov-Smirnov test data: X D = 0.0824, p-value = 0.8586 |
Burada hesaplanan D istatistiğe tekabül eden kritik sınır p-değeri 0.8586 yani %85den daha büyüktür. Bu p-değeri istatistikçilerin kullandığı %5 veya %1'den çok büyük olduğu için kritik p-değeri kabul edilme alanındadır ve bu sıfır hipotez red edilemez. Bu nedenle X veri serisinin bir standart normal anakitleden geldiği sonucuna varılır.
İki örneklem Kolmogorov-Smirnov sınaması örnek problemleri
Örnek problem 3:
Bu problemde sorun 50 gözlemli X örneklem veri serisi ile 40 gözlemli Y örneklem veri serisinin aynı anakitle dağılımından mı yoksa değişik anakitle dağılımından mı geldikleri incelenir. Bu soruna yanıt "iki örneklem Kolmogorov-Smirnov sınaması" ile bulunur. Hipotezler şunlardır: H0 : Bu n=50 gözlemli verilen X örneklem serisi ile n=40 gözlemli örneklem Y serisi aynı anakitle dağılımından gelmektedir. H1 : X örneklem serisi ile Y örneklem serisi aynı anakitle dağılımından gelmemektedir.
İki örneklem K-S sınaması da iki-kuyruklu bir testtir.
İkinci aşamada da Kolmogorov-Smirnov istatistiği D-değeri ve bunun karşıtı olan olasılık p-değeri bulunur. Burada hesaplama için R paketi kullanılmakta ve paketle iki örneklem K-S testi için gereken D istatistiğini ve bunun p-değerini bulmak için özel komuta şudur: ks.test(X, Y). Ekrana verilen çıktı sonucunu şöyle özetlenir:
R yazılımı komutası | ks.test(X, Y) |
---|---|
Ekranda gösterilen sonuç | Two-sample Kolmogorov-Smirnov test data: X and Y D = 0.135, p-value = 0.7652 |
Burada bulunan D istatistiği 0.135 olup buna tekabül eden kritik sınır p-değeri 0.7652. Bu p-değeri istatistikçilerce kullanılan 0.05 veya 0.01 değerlerinden çok büyüktür ve açıkça H0 kabul alanındadır. Sonuç olarak X ve Y serilerinin aynı anakitle dağılımından geldiği kabul edilir.
Örnek problem 4:
Bu problemde sorun olarak 50 gözlemli X örneklem veri serisi ile 30 gözlemli Z örneklem veri serisinin aynı anakitle dağılımından mı yoksa değişik anakitle dağılımından mı geldikleri incelensin. Bu "iki örneklem K-S sınaması" için hipotezler şunlardır. H0 : X örneklem serisi ile Z örneklem serisi ayni anakitle dağılımından gelmektedir. H1 : X örneklem serisi ile Z örneklem serisi ayni anakitle dağılımından gelmemektedir.
İki örneklem K-S sınaması da iki-kuyruklu testtir. Kolmogorov-Smirnov istatistiği D-değeri ve bunun karşıtı olan olasılık p-değeri için hesaplama R paketi ile yapılır ve bu test için komuta ks.test(X, Z) olur. Komuta ve ekrandaki sonuçlar şöyle özetlenir:
R yazılımı komutası | ks.test(X, Z) |
---|---|
Ekranda gösterilen sonuç | Two-sample Kolmogorov-Smirnov test data: X and Z D = 0.48, p-value = 0.0002033 |
Burada D istatistiği 0.48 olarak hesaplanmıştır ve buna tekabül eden kritik sınır p-değeri 0.0002033 küçük bir değerdir. Bu p-değeri istatistikçilerin kullandığı %5 veya %1'den çok daha küçük olduğundan reddetme alanındadır. Bu nedenle X ve Z örneklem veri serilerinin aynı dağılımlı anakitleden gelmediği sonucuna varılır.
Örnek problem 5:
Son örnek problem için 40 gözlemli Y örneklem veri serisi ile 30 gözlemli Z örneklem veri serisinin aynı anakitle dağılımından mı geldikleri incelensin. Bu "iki örneklem K-S sınaması " için hipotezler şunlardır. H0 : Y ve Z örneklem serileri ayni anakitle dağılımından gelmektedir. H1 : Y ve Z örneklem serileri ayni anakitle dağılımından gelmemektedir.
İki örneklem K-S sınaması da iki-kuyruklu testtir. R paketi kullanarak Kolmogorov-Smirnov istatistiği D-değeri ve bunun karşıtı olan olasılık p-değeri için hesaplama için komuta ks.test(Y, Z) olur. Komuta ve ekrandaki sonuçlar şöyle özetlenir:
R yazılımı komutası | ks.test(Y, Z) |
---|---|
Ekranda gösterilen sonuç | Two-sample Kolmogorov-Smirnov test data: Y and Z D = 0.55, p-value = 2.889e-05 |
Burada 0.55 olarak bulunan D istatistiği ve buna tekabül eden kritik sınır p-değeri 2.889x10−5 küçük değerdir ve p-değeri istatistikçilerin kullandığı %5 veya %1'den çok daha küçük ve reddetme alanındadır. Bu nedenle Y ve Z örneklem veri serilerinin aynı dağılımlı anakitleden gelmediği sonucuna varılır.
Ayrıca bakınız
Kaynakça
- ^ R kullanılarak simulasyonla üç veri serisi üretme ve gereken sınamaların yapılıp ekranda sonuç alma için kaynak Fransizca Wikipedia maddesidir.
Dış bağlantılar
- İngilizce Wikipedia "Kolmogorov–Smirnov test" maddesi 10 Şubat 2010 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişim:4.10.2009)
- Kısa bir giriş10 Temmuz 2005 tarihinde Wayback Machine sitesinde . (İngilizce) (Erişim:4.10.2009)
- KS sınaması açıklaması 14 Ocak 2010 tarihinde Wayback Machine sitesinde . (İngilizce) (Erişim:4.10.2009)
- Bir- veya iki-kuyruklu sınamalarda kullanılmak için JavaScript uygulaması 10 Ocak 2010 tarihinde Wayback Machine sitesinde . (İngilizce) (Erişim:4.10.2009)
- K-S sınaması için Online hesaplayıcı 7 Ocak 2010 tarihinde Wayback Machine sitesinde . (İngilizce) (Erişim:4.10.2009)
- Kolmogorov dağılımı 28 Aralık 2009 tarihinde Wayback Machine sitesinde . nı hesaplamak ve K-S sınaması 28 Aralık 2009 tarihinde Wayback Machine sitesinde . yapmak için açık-kaynaklı C++ yazılım kodu. (İngilizce) (Erişim:4.10.2009)
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Istatistik bilim dalinda Kolmogorov Smirnov K S sinamasi parametrik olmayan istatistik olup Andrey Kolmogorov ve adlarindaki iki Sovyet bilim insani tarafindan olusturulmustur Bu sinama iki degisik problem icin olarak kullanilir Tek orneklem K S sinamasi Hedef verilmis olan bir deneysel olasilik dagilimi gosteren orneklem verilerinin dagilim parametreleri tam olarak bilinen tam tanimlanmis bir teorik anakitle olasilik dagilimina uyum gosterip gostermedigini sinamak Bu tip problemde sifir hipotez Ho orneklem verilerin deneysel dagiliminin tam tanimlanmis bir anakitle olasilik dagilimindan gelmis oldugudur Iki orneklem K S sinamasi Hedef verilmis iki tane degisik deneysel olasilik dagilimi gosteren iki orneklem veri serisinin ayni tek bir teorik anakitle olasilik dagilimindan gelip gelmedigini sinamak Bu tip problemde sifir hipotez Ho ise iki orneklem verilerin deneysel dagilimlarinin tek bir anakitle olasilik dagilimindan gelmis oldugudur Tek orneklem K S sinamasi cok populer olarak olarak bir normallik sinamasi olarak yani orneklem verilerinin tanimlanmis bir anakitle normal olasilik dagilimina uyumluluk gosterip gostermemesini sinamak icin kullanilir Orneklem verileri standardize edilerek yani her bir veri degerinden teorik anakitle olasiligi icin verilmis ortalama cikartip sonucu verilmis teorik yigin varyansina bolerek elde edilen normalize veriler standart normal dagilim ile karsilastirilir Fakat bu turlu donusum yapmanin sinamanin gucunu azalttigi ispat edilmistir Bu tarafliligin duzeltilmesi ortaya cikartir Fakat Anderson Darling sinamasi veya Shapiro Wilk sinamasi normallik sinamasi olarak hem Lilliefors sinamasi hem de K S tek orneklem normallik sinamasindan daha gucludur K S tek orneklem sinamasi gozlenen ve beklenen kumulatif frekans dagilis arasindaki mutlak farkliliklar dikkate alinarak gelistirilmistir Orneklem hacmi kucuk oldugu icin uygulanamadigi durumlarda Kolmogorov Simirnov testi kullanilabilir Iki orneklem K S sinamasi hem genel olarak uygulanabilen hem de cok kullanisli olan bir parametrik olmayan sinama yontemidir cunku bu sinama hem konum hem de dagilim sekline duyarlidir ve bu turlu problem cozumu icin populer olarak kullanilir PrensipBu test orneklem deneysel dagilim fonksiyonunun ozelliklerine baglidir n orneklem hacmi buyuklugu de orneklem verilerinin yani x1 xn displaystyle x 1 dots x n degerlerinin n tane birbirinden bagimsiz ve reel degerli rastgele degisken oldugunu kabul edelim Bu halde ornekleme deneysel dagilim fonksiyonu soyle tanimlanabilir Fn x 1n i 1ndxi x displaystyle F n x 1 over n sum i 1 n delta x i leq x burada dxi x 1eger evet ise xi x 0eger hayir ise displaystyle delta x i leq x left begin matrix 1 amp mathrm text eger evet ise x i leq x 0 amp mathrm text eger hayir ise end matrix right Tum c gt 0 displaystyle c gt 0 sabitleri icin bu surec icin deneysel dagilim fonksiyonu 0 displaystyle 0 ile 1 displaystyle 1 degerleri arasinda buyume fonksiyonlari uzayinda degerler alir ve bunun ozellikleri arasinda suna yakinsama gosterir P supx Fn x F x gt cn n a c 2 r 1 1 r 1exp 2r2c2 displaystyle mathbb P left sup x F n x F x gt frac c sqrt n right xrightarrow n to infty alpha c 2 sum r 1 infty 1 r 1 exp 2r 2 c 2 Eger c 1 36 displaystyle c 1 36 ise a c displaystyle alpha c teriminin degeri 0 05 displaystyle 0 05 ne yakinsar Dikkat edilirse saga dogru limit F displaystyle F ye dayanmadigi gorulur Kolmogorov dagilimi su rassal degiskenin dagilimidir K supt 0 1 B t displaystyle K sup t in 0 1 B t burada B t bir olur Knin birikimli dagilim fonksiyonu soyle verilir Pr K x 1 2 i 1 1 i 1e 2i2x2 2px i 1 e 2i 1 2p2 8x2 displaystyle operatorname Pr K leq x 1 2 sum i 1 infty 1 i 1 e 2i 2 x 2 frac sqrt 2 pi x sum i 1 infty e 2i 1 2 pi 2 8x 2 Sifir hipotezi dogru ise orneklem su hipotez olarak verilen F x dagilimindan gelir nDn n supt B F t displaystyle sqrt n D n xrightarrow n to infty sup t B F t burada B t Brown tipi kopru olur Eger sifir hipotezinde verilen F surekli ise nDn displaystyle sqrt n D n bir Kolmogorov dagilimina yakinsar ve bu F dagilimina dayanmaz Tek orneklem K S sinamasi yani uyumluluk iyiligi sinamasi Kolmogorov fonksiyonunun kritik degerlerini kullanilarak yapilir Sifir hipotezini a displaystyle alpha seviyesinde reddetmek icin Pr K Ka 1 a displaystyle operatorname Pr K leq K alpha 1 alpha ifadesinden bulunan Ka icin nDn gt Ka displaystyle sqrt n D n gt K alpha olmasi gerekir Bu testin asimptotik istatistik gucu 1e esittir Eger F x fonksiyonunun sekli veya parametreleri orneklem x1 xn displaystyle x 1 dots x n verileri ile bulunursa yukarida verilen kritik degerler uygun degildir Bu hallerde Monte Carlo simulasyon yontemi veya benzer sayisal yontemler kullanilmasi gerekir Ama bazi haller icin ozel tablolar kurulmustur Pearson ve Hartley 1957 Tablo 54de normal dagilim ve icin kritik degerleri ve test istatistigini vermektedir Ornek problemlerOrnek verilerini vermek ve K S sinamalarini uygulamak icin R adi altinda hazirlanmis olan ve standart olarak uygulanan ve telif hakki gerektirmeyen serbest kullanilma haklari verilmis bir istatistik yazilim paketi kullanilacaktir Simulasyonla uretilen veriler Once uc degisik veri serisi uretilmistir Istenilen gozlem sayisinda ve istenilen olasilik dagiliminda simulasyonla R istatistik paketi ozel simulasyon ile veri uretme komutasi kullanilmistir X veri serisi icin 50 gozlem uretilmistir ve bunlarin ortalamasi 0 ve varyansi 1 olan bir standart normal dagilima sahip olarak R yazilim paketi icin X rnorm 50 komutasi ile simulasyonla elde edilmislerdir Y veri serisi icin 40 gozlem standart normal dagilima sahip olarak R yazilim paketi icin Y rnorm 40 komutasi ile simulasyonla elde edilmislerdir Z veri serisi icin 30 gozlem 0 ile 1 arasinda surekli tekduze dagilima sahip olarak R yazilimi icin Y runif 30 komutasi ile simulasyonla elde edilmislerdir Tek orneklem Kolmogorov Smirnov sinamasi ornek problemleri Ornek problem 1 Orneklem veri serilerinin nasil ortaya ciktiginin bilinmedigini dusunelim ve 50 gozlemli bir gercek orneklem X veri serisi 0 1 arasinda surekli tekduze dagilim gosteren bir anakitle yigindan gelmis midir yoksa gelmemis midir sorunu problem olsun Bu soruna yanit tek orneklem Kolmogorov Smirnov sinamasi ile bulunur Once hipotezler verilir H0 Bu n 50 orneklem serisi verilen U 0 1 yani 0 ile 1 arasinda surekli tekduze dagilimli bir anakitleden gelmektedir H1 Bu n 50 orneklem serisi verilen U 0 1 yani 0 ile 1 arasinda surekli tekduze dagilimli anakitleden gelmemektedir Bu sinama icin alternatif hipotezde pozitif bir dagilim ifadesi bulunmaz ve anakitle dagiliminin ne olmadigina dair negatif bir hipotezdir Tek orneklem K S sinamasi iki kuyruklu testtir Ikinci asamada da Kolmogorov Smirnov istatistigi D degeri ve bunun karsiti olan olasilik p degerini bulmak icin R paketine ozel bir komuta kullanilir bu komuta sudur ks test X punif Bundan sonra komputer programi hesaplar baslar ve bir cikti sonucunu Ingilizce olarak ekrana verir Bunu su tabloda ozetleyelim R yazilimi komutasi ks test X punif Ekranda gosterilen sonuc One sample Kolmogorov Smirnov test data X D 0 5501 p value 1 033e 14 alternative hypothesis two sided Burada 0 5551 olarak hesaplanan D istatistigine tekabul eden kritik sinir p degeri 1 033x10 14 cok kucuk bir degerdir Bu p degeri istatistikcilerin kullandigi 5 veya 1 den cok daha kucuk oldugundan reddetme alanindir Bu nedenle X veri serisinin bir 0 1 arasinda tekduze dagilimli anakitleden gelmedigi sonucuna varilmasi gerekir Ama goruldugu gibi sifir hipotez reddedildigi zaman X veri serisinin hangi anakitle dagilimindan geldigi bilinmez Onun icin yeni bir hipotez kurmak ve yeni bir sinama yapmak gerekir Ornek problem 2 Yine X orneklem veri serilerinin nasil elde edildigini bilmedigimizi kabul edelim 50 gozlemli bir X orneklem veri serisinin standart normal dagilim gosteren bir yigindan gelmis midir yoksa gelmemis midir sorununu problem olarak secelim Bu soruna yanit orneklemin veri serisinin verilmis olan bir standart normal dagilimina uyum sinamasi yani tek orneklem Kolmogorov Smirnov sinamasi ile bulunur Hipotezler sunlardir H0 Bu n 50 orneklem serisi verilen N 0 1 yani standart normal anakitleden gelmektedir H1 Bu n 50 orneklem serisi verilen N 0 1 yani standart normal anakitleden gelmemektedir Tek orneklem K S sinamasi iki kuyruklu bir testtir Ikinci asamada da Kolmogorov Smirnov istatistigi D degeri ve bunun karsiti olan olasilik p degeri bulunur Bunlari hesaplamak icin gereken formuller yukarida verilmistir Burada hesaplama icin R paketi kullanilmaktadir Bu paketle tek orneklem K S testi icin gereken D istatistigini ve bunun p degerini bulmak icin su ozel komuta kullanilir ks test x pnorm Bunu kullanan komputer programi bir cikti sonucunu ekrana verir ve sonucu soyle ozetleyelim R yazilimi komutasi ks test X pnorm Ekranda gosterilen sonuc One sample Kolmogorov Smirnov test data X D 0 0824 p value 0 8586 alternative hypothesis two sided Burada hesaplanan D istatistige tekabul eden kritik sinir p degeri 0 8586 yani 85den daha buyuktur Bu p degeri istatistikcilerin kullandigi 5 veya 1 den cok buyuk oldugu icin kritik p degeri kabul edilme alanindadir ve bu sifir hipotez red edilemez Bu nedenle X veri serisinin bir standart normal anakitleden geldigi sonucuna varilir Iki orneklem Kolmogorov Smirnov sinamasi ornek problemleri Ornek problem 3 Bu problemde sorun 50 gozlemli X orneklem veri serisi ile 40 gozlemli Y orneklem veri serisinin ayni anakitle dagilimindan mi yoksa degisik anakitle dagilimindan mi geldikleri incelenir Bu soruna yanit iki orneklem Kolmogorov Smirnov sinamasi ile bulunur Hipotezler sunlardir H0 Bu n 50 gozlemli verilen X orneklem serisi ile n 40 gozlemli orneklem Y serisi ayni anakitle dagilimindan gelmektedir H1 X orneklem serisi ile Y orneklem serisi ayni anakitle dagilimindan gelmemektedir Iki orneklem K S sinamasi da iki kuyruklu bir testtir Ikinci asamada da Kolmogorov Smirnov istatistigi D degeri ve bunun karsiti olan olasilik p degeri bulunur Burada hesaplama icin R paketi kullanilmakta ve paketle iki orneklem K S testi icin gereken D istatistigini ve bunun p degerini bulmak icin ozel komuta sudur ks test X Y Ekrana verilen cikti sonucunu soyle ozetlenir R yazilimi komutasi ks test X Y Ekranda gosterilen sonuc Two sample Kolmogorov Smirnov test data X and Y D 0 135 p value 0 7652 alternative hypothesis two sided Burada bulunan D istatistigi 0 135 olup buna tekabul eden kritik sinir p degeri 0 7652 Bu p degeri istatistikcilerce kullanilan 0 05 veya 0 01 degerlerinden cok buyuktur ve acikca H0 kabul alanindadir Sonuc olarak X ve Y serilerinin ayni anakitle dagilimindan geldigi kabul edilir Ornek problem 4 Bu problemde sorun olarak 50 gozlemli X orneklem veri serisi ile 30 gozlemli Z orneklem veri serisinin ayni anakitle dagilimindan mi yoksa degisik anakitle dagilimindan mi geldikleri incelensin Bu iki orneklem K S sinamasi icin hipotezler sunlardir H0 X orneklem serisi ile Z orneklem serisi ayni anakitle dagilimindan gelmektedir H1 X orneklem serisi ile Z orneklem serisi ayni anakitle dagilimindan gelmemektedir Iki orneklem K S sinamasi da iki kuyruklu testtir Kolmogorov Smirnov istatistigi D degeri ve bunun karsiti olan olasilik p degeri icin hesaplama R paketi ile yapilir ve bu test icin komuta ks test X Z olur Komuta ve ekrandaki sonuclar soyle ozetlenir R yazilimi komutasi ks test X Z Ekranda gosterilen sonuc Two sample Kolmogorov Smirnov test data X and Z D 0 48 p value 0 0002033 alternative hypothesis two sided Burada D istatistigi 0 48 olarak hesaplanmistir ve buna tekabul eden kritik sinir p degeri 0 0002033 kucuk bir degerdir Bu p degeri istatistikcilerin kullandigi 5 veya 1 den cok daha kucuk oldugundan reddetme alanindadir Bu nedenle X ve Z orneklem veri serilerinin ayni dagilimli anakitleden gelmedigi sonucuna varilir Ornek problem 5 Son ornek problem icin 40 gozlemli Y orneklem veri serisi ile 30 gozlemli Z orneklem veri serisinin ayni anakitle dagilimindan mi geldikleri incelensin Bu iki orneklem K S sinamasi icin hipotezler sunlardir H0 Y ve Z orneklem serileri ayni anakitle dagilimindan gelmektedir H1 Y ve Z orneklem serileri ayni anakitle dagilimindan gelmemektedir Iki orneklem K S sinamasi da iki kuyruklu testtir R paketi kullanarak Kolmogorov Smirnov istatistigi D degeri ve bunun karsiti olan olasilik p degeri icin hesaplama icin komuta ks test Y Z olur Komuta ve ekrandaki sonuclar soyle ozetlenir R yazilimi komutasi ks test Y Z Ekranda gosterilen sonuc Two sample Kolmogorov Smirnov test data Y and Z D 0 55 p value 2 889e 05 alternative hypothesis two sided Burada 0 55 olarak bulunan D istatistigi ve buna tekabul eden kritik sinir p degeri 2 889x10 5 kucuk degerdir ve p degeri istatistikcilerin kullandigi 5 veya 1 den cok daha kucuk ve reddetme alanindadir Bu nedenle Y ve Z orneklem veri serilerinin ayni dagilimli anakitleden gelmedigi sonucuna varilir Ayrica bakinizNormallik sinamalari Anderson Darling sinamasiKaynakca R kullanilarak simulasyonla uc veri serisi uretme ve gereken sinamalarin yapilip ekranda sonuc alma icin kaynak Fransizca Wikipedia maddesidir Dis baglantilarIngilizce Wikipedia Kolmogorov Smirnov test maddesi 10 Subat 2010 tarihinde Wayback Machine sitesinde arsivlendi Ingilizce Erisim 4 10 2009 Kisa bir giris10 Temmuz 2005 tarihinde Wayback Machine sitesinde Ingilizce Erisim 4 10 2009 KS sinamasi aciklamasi 14 Ocak 2010 tarihinde Wayback Machine sitesinde Ingilizce Erisim 4 10 2009 Bir veya iki kuyruklu sinamalarda kullanilmak icin JavaScript uygulamasi 10 Ocak 2010 tarihinde Wayback Machine sitesinde Ingilizce Erisim 4 10 2009 K S sinamasi icin Online hesaplayici 7 Ocak 2010 tarihinde Wayback Machine sitesinde Ingilizce Erisim 4 10 2009 Kolmogorov dagilimi 28 Aralik 2009 tarihinde Wayback Machine sitesinde ni hesaplamak ve K S sinamasi 28 Aralik 2009 tarihinde Wayback Machine sitesinde yapmak icin acik kaynakli C yazilim kodu Ingilizce Erisim 4 10 2009