İstatistik bilim dalında, Spearman'ın sıralama korelasyon katsayısı veya Spearman'ın rho, bu istatistiksel ölçüyü ilk ortaya atan İngiliz psikolog Charles Edward Spearman'a atfen adlandırılmıştır. Matematik notasyon olarak çok defa eski Yunan harfi ρ (rho okunur) ile belirtilir. Bir parametrik olmayan istatistik ölçüsüdür ve iki değişken arasındaki bağımlılık, yani korelasyon, ölçüsü olarak bulunup kullanılır. Bu demektir ki Spearman'in rho (ρ) katsayısı iki değişken için hakkında hiçbir varsayım yapmayarak, bu iki değişken arasında bulunan bağlantının herhangi bir monotonik fonksiyon ile ne kadar iyi betimlenebilineceğini değerlendirmek amaçlı incelemedir.
Yöntem
Prensip olarak Spearman'ın sıralama korelasyon katsayısı ρ (Pearson çarpım-moment korelasyon katsayısının) özel bir halidir. ρ değerinin hesaplanması için iki değişken (Y ve X) içinde örneklem verilerinin sıralama düzeninde olmaları gereklidir. Genel olarak, örneklem verileri için bu koşul uygun değildir ve veriler sıralama düzeni halinde olmadan (oransal ölçekli) veya (aralıksal ölçekli) veya (sırasal ölçekli) olarak bulunur ve bu halde bir dönüşümle sıralama düzeni haline sokulurlar. Böylece ρ formülü için sıralama düzenli ve örneklem verileri kullanılır.
Sonra iki değişken için karşılıklı veri elemanları ( ve )nin sıra numaraları arasındaki fark i=1,...n olarak bulunur. Bu tüm karşılıklı veriler (i=1...n) için uygulanır. Eğer sıra numaraları arasında hiç beraberlik yoksa, ρ değerini bulmak için şu formül kullanılır:
Burada
- : i elamni ile sıra numaraları arasındaki fark;
- n : iki değişkenli örneklemde toplam gözlem sayısı.
Eğer sıralama esnasında beraberlikler bulunursa, sıralama numaraları verileri olarak kullanılarak klasik (Pearson çarpım-moment korelasyon katsayısı) formülü kullanılması tavsiye edilir. Bu halde sıralama düzeni hazırlanırken beraberlikler halinde kullanılacak strateji her beraber sıra numaralı veriye beraberlik sıra ortalama değeri verilmesidir (yani 1 2,5 2,5 4 stratejisinin uygulanmasıdır). Bu halde formül şu olur :
Spearman'in ρ katsayısı değerleri de (aynı Pearson'un çarpım-moment korelasyon katsayısı gibi) -1 ile +1 arasında değişir. Uç değerler (yani ρ=-1 ve ρ=+1 ve yakın değerler) iki değişken sıralaması arasında bağlantının çok iyi olduğunu (eğer sıralamalar noktalar olarak bir konulursa hepsinin çizilen bir doğru üzerinde olduğunu) gösterirler. Eğer ρ<0 ise, sıralamalar arasında indirek aksi değişme vardır; yani biri artınca diğeri azalır ve aksi olur. Eğer ρ>0 ise sıralamalar arasında birlikte (yani birlikte artma veya eksilme) değişme görülür. Eğer ρ=0 ise, sıralamalar arasında hiçbir bağlantını bulunmadığı (ve serpme diyagrami üzerinde noktaların rastgele dağıldıkları) sonucu çıkartılır.
Diğer sıralama korelasyon ölçüleriyle ilişki
Spearman'in ρ sıralama korelasyon katsayısı ile τ, bu ölçüleri destekleyen varsayımlara göre, birbiri ile aynıdır. Ancak aynı örneklem veriler serisi ile hesaplanan Spearman ρ katsayısı değeri ile Kendal'ın τ katsayısı değeri birbirinden farklı olacaktır. Buna başlıca neden hesaplama formüllerin geliştirilmesi için kullanılan mantıksal önerimlerin başka olması ve bu nedenle bibirinden çok değişik iki formülün ortaya çıkmasıdır. Bu iki katsayı arasındaki ilişki bir eşitsizlik ile ifade edilmiştir:
- -1 < = 3 * τ - 2 * ρ < = 1
Spearman'in ρ katsayısı sıralama düzeni verileri ile Pearson çarpım-moment korelasyon katsayısının hesaplanmasıdır ve temel mantik olarak bu iki katsayı aynı önerimlere dayanırlar. Halbuki Kendal'in τ katsayısı bir olasılık ifade eder ve uyuşma ve uyuşmama puanları için gerçek toplam ile maksimum mümkün toplam arasında bir orantıdır.
Örneğin
Tabloda iki değişken X ve Y için n=8 gözlem sayılı örneklem verileri için Spearman'ın sıralama korelasyon katsayısı ρ hesaplanması için örneğin verilmektedir. [A] ve [B] sütunlarında bu iki değişken X ve Y için örneklem verileri verilmiştir. [C] ve [D] sütunlarında bu iki değişkenlerin verileri için ayrı ayrı sıralama düzeni uygulanıp sıra numaraları x ve y olarak verilmiştir. X için verilerde 2 değişik beraberlik görülmektedir: 3 ve 10. Bu nedenle iki tekrarlı 3 için verilen sıra numaraları ortalaması (2+3)/2= 2,5 dur. Aynı şeklide 2 tekrarlı 10 için sıra numaraları 7,5 7,5 olarak verilmiştir. Y için verilerde ise 1,5 için 2 beraberlik ve 5 için 2 beraberlik bulunmaktadır ve bunlara da ortalama sıra numaraları verilmiştir. Sütun [E]de sıra numaraları farkları d verilmekte ve son [F] sütununda fark kareleri d2 hesaplanmaktadır.
[A] | [B] | [C] | [D] | [E] | [F] |
X | Y | x : X için sıralama | y : Y için sıralama | d : Sıralama farkları | d2 : Farkların karesi |
2 | 1,5 | 1 | 2,5 | -1,5 | 2,25 |
3 | 1,5 | 2,5 | 2,5 | 0 | 0 |
3 | 4 | 2,5 | 5 | -2,5 | 6,25 |
5 | 3 | 4 | 4 | 0 | 0 |
5,5 | 1 | 5 | 1 | 4 | 16 |
8 | 5 | 6 | 6,5 | -0,5 | 0,25 |
10 | 5 | 7,5 | 6,5 | 1 | 1 |
10 | 9,5 | 7,5 | 8 | -0,5 | 0,25 |
Kareler Toplamı | 26 |
Fark kareleri toplamı olarak bulunmuştur. Hesapların değerleri formüle şöyle konulur:
ve şu sonuç bulunur .
Bu ρ=0.6 değeri sıfıra yakın pozitiftir. Sıfıra yakınlığı X ve Y sıralamaları arasındaki bağlantının (korelasyonun) az olduğunu gösterir ve negatif olma ise var zayıf bağlantının aksi yönde olduğunu ifade eder (yani X sıralaması artarsa Y sıralaması düşer ve aksi olur).
Bu veriler içinde beraberlikler bulunmaktadır. Bu nedenle kullanılan genel ρ formülü uygun sonuç vermeyebilir. Daha uygun sonuç bulmak için x ve y sıra numaraları için Pearson'un çarpım-moment korelasyon katsayısı bulunması tavsiye edilmektedir.
ρ kestirimi için anlamlılık sınaması
Eğer hesaplar ve anlamlılık sınaması el hesap makineleri ile yapılmakta ise, klasik çıkarımsal istatistik yöntemleri kullanılmalıdır.
ρ kestirminin anlamlılık sınanması için en basit yaklaşım belirli gözlem sayısı ve belirli anlamlılık düzeyi değerleri için hazırlanmış özel tablolar kullanılarak başarılır. Ancak bu tablolar belirli veri sayısı ve anlamlılık düzeyi dışında ise kullanılamaz.
Önemli kompüter istatistik paketleri Spearman'in sıralamalı korelasyon katsayısını hesapladıkları zaman ek olarak anlamlılık sınaması için p-değerini de yanında vermektedirler.
Diğer bir alternatif yaklaşım eğer örneklem hacmi 20'den büyük ise uygulanabilir. Bu halde Student'in t dağılımına bir yaklaşım kullanılır:
değişkeni sıfır hipotez olan ρ=0 için bir Student'in t dağılımı gösterir. Ancak biraz zayıftır ve sifir hipotez ret edilnece ρ'nun ne değer alacağını göstermez.
Gözümlenen ρ değerinin anlamlı şekilde 0dan başka değerde olmasını sınama için modern yaklaşım olarak yöntemi kullanılmaktadır ve bu tip sınama için, sıfır hipotez verilmişse anakütle ρ değerinin örneklemle elde edilen değerde ve ondan büyük olma olasılığı hesap edilir. Bu modern sınama yöntemi ancak kompüter programı yazabilen ve kompüteri iyi kullanabilen bir bilim insanı için çok kolay olabilir.
Ayrıca bakınız
- Sıralama korelasyonu
- ,
- (Pearson çarpım-moment korelasyon katsayısı)
- Korelasyon
Kaynakça
- ^ Spearman,C.(1904) "The proof and measurement of association between two things" Amer.J.Psychol. C.15 say.72–101
- ^ Kendall,M.G. (1962) Rank correlation methods, Griffin
- ^ Hollander,M. ve Wolfe,D.A. (1973) Nonparametric statistical methods, New York:Wiley
- ^ a b Myers,J.L. ve Well,A.D. (2003), Research Design and Statistical Analysis (2.ed.), Lawrence Erlbaum
- ^ a b Siegel,S. ve Castellan,N.J. (1988), Nonparametric statistics for the behavioral sciences 2. ed. New York: McGraw-Hill
Dış bağlantılar
- [1]14 Nisan 2012 tarihinde Wayback Machine sitesinde . Küçük örneklemler için ρ için kritik değerler tablosu.
- [2] 17 Mayıs 2008 tarihinde Wayback Machine sitesinde . Online ρ hesaplayıcısı.
- Beraberlikler olursa kullanılabilecek bir diğer formül vermekte.
- [4]30 Mart 2012 tarihinde Wayback Machine sitesinde . Spearman'ın sıralama korelasyon katsayısı: Öğrenciler için hazırlanmış bir örnek problem çözümü ve notlar. Hesaplama için Microsoft Excel kullanılması da gösterilir.
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Istatistik bilim dalinda Spearman in siralama korelasyon katsayisi veya Spearman in rho bu istatistiksel olcuyu ilk ortaya atan Ingiliz psikolog Charles Edward Spearman a atfen adlandirilmistir Matematik notasyon olarak cok defa eski Yunan harfi r rho okunur ile belirtilir Bir parametrik olmayan istatistik olcusudur ve iki degisken arasindaki bagimlilik yani korelasyon olcusu olarak bulunup kullanilir Bu demektir ki Spearman in rho r katsayisi iki degisken icin hakkinda hicbir varsayim yapmayarak bu iki degisken arasinda bulunan baglantinin herhangi bir monotonik fonksiyon ile ne kadar iyi betimlenebilinecegini degerlendirmek amacli incelemedir YontemPrensip olarak Spearman in siralama korelasyon katsayisi r Pearson carpim moment korelasyon katsayisinin ozel bir halidir r degerinin hesaplanmasi icin iki degisken Y ve X icinde orneklem verilerinin siralama duzeninde olmalari gereklidir Genel olarak orneklem verileri icin bu kosul uygun degildir ve veriler siralama duzeni halinde olmadan oransal olcekli veya araliksal olcekli veya sirasal olcekli olarak bulunur ve bu halde bir donusumle siralama duzeni haline sokulurlar Boylece r formulu icin siralama duzenli xi displaystyle x i ve yi displaystyle y i orneklem verileri kullanilir Sonra iki degisken icin karsilikli veri elemanlari xi displaystyle x i ve yi displaystyle y i nin sira numaralari arasindaki fark di displaystyle d i i 1 n olarak bulunur Bu tum karsilikli veriler i 1 n icin uygulanir Eger sira numaralari arasinda hic beraberlik yoksa r degerini bulmak icin su formul kullanilir r 1 6 di2n n2 1 displaystyle rho 1 frac 6 sum d i 2 n n 2 1 Burada di xi yi displaystyle d i x i y i i elamni Xi displaystyle X i ile Yi displaystyle Y i sira numaralari arasindaki fark n iki degiskenli orneklemde toplam gozlem sayisi Eger siralama esnasinda beraberlikler bulunursa siralama numaralari verileri olarak kullanilarak klasik Pearson carpim moment korelasyon katsayisi formulu kullanilmasi tavsiye edilir Bu halde siralama duzeni hazirlanirken beraberlikler halinde kullanilacak strateji her beraber sira numarali veriye beraberlik sira ortalama degeri verilmesidir yani 1 2 5 2 5 4 stratejisinin uygulanmasidir Bu halde formul su olur r n xiyi xi yi n xi2 xi 2 n yi2 yi 2 displaystyle rho frac n sum x i y i sum x i sum y i sqrt n sum x i 2 sum x i 2 sqrt n sum y i 2 sum y i 2 Spearman in r katsayisi degerleri de ayni Pearson un carpim moment korelasyon katsayisi gibi 1 ile 1 arasinda degisir Uc degerler yani r 1 ve r 1 ve yakin degerler iki degisken siralamasi arasinda baglantinin cok iyi oldugunu eger siralamalar noktalar olarak bir konulursa hepsinin cizilen bir dogru uzerinde oldugunu gosterirler Eger r lt 0 ise siralamalar arasinda indirek aksi degisme vardir yani biri artinca digeri azalir ve aksi olur Eger r gt 0 ise siralamalar arasinda birlikte yani birlikte artma veya eksilme degisme gorulur Eger r 0 ise siralamalar arasinda hicbir baglantini bulunmadigi ve serpme diyagrami uzerinde noktalarin rastgele dagildiklari sonucu cikartilir Diger siralama korelasyon olculeriyle iliskiSpearman in r siralama korelasyon katsayisi ile t bu olculeri destekleyen varsayimlara gore birbiri ile aynidir Ancak ayni orneklem veriler serisi ile hesaplanan Spearman r katsayisi degeri ile Kendal in t katsayisi degeri birbirinden farkli olacaktir Buna baslica neden hesaplama formullerin gelistirilmesi icin kullanilan mantiksal onerimlerin baska olmasi ve bu nedenle bibirinden cok degisik iki formulun ortaya cikmasidir Bu iki katsayi arasindaki iliski bir esitsizlik ile ifade edilmistir 1 lt 3 t 2 r lt 1 Spearman in r katsayisi siralama duzeni verileri ile Pearson carpim moment korelasyon katsayisinin hesaplanmasidir ve temel mantik olarak bu iki katsayi ayni onerimlere dayanirlar Halbuki Kendal in t katsayisi bir olasilik ifade eder ve uyusma ve uyusmama puanlari icin gercek toplam ile maksimum mumkun toplam arasinda bir orantidir OrneginTabloda iki degisken X ve Y icin n 8 gozlem sayili orneklem verileri icin Spearman in siralama korelasyon katsayisi r hesaplanmasi icin ornegin verilmektedir A ve B sutunlarinda bu iki degisken X ve Y icin orneklem verileri verilmistir C ve D sutunlarinda bu iki degiskenlerin verileri icin ayri ayri siralama duzeni uygulanip sira numaralari x ve y olarak verilmistir X icin verilerde 2 degisik beraberlik gorulmektedir 3 ve 10 Bu nedenle iki tekrarli 3 icin verilen sira numaralari ortalamasi 2 3 2 2 5 dur Ayni seklide 2 tekrarli 10 icin sira numaralari 7 5 7 5 olarak verilmistir Y icin verilerde ise 1 5 icin 2 beraberlik ve 5 icin 2 beraberlik bulunmaktadir ve bunlara da ortalama sira numaralari verilmistir Sutun E de sira numaralari farklari d verilmekte ve son F sutununda fark kareleri d2 hesaplanmaktadir A B C D E F X Y x X icin siralama y Y icin siralama d Siralama farklari d2 Farklarin karesi2 1 5 1 2 5 1 5 2 253 1 5 2 5 2 5 0 03 4 2 5 5 2 5 6 255 3 4 4 0 05 5 1 5 1 4 168 5 6 6 5 0 5 0 2510 5 7 5 6 5 1 110 9 5 7 5 8 0 5 0 25 Kareler Toplami 26 Fark kareleri toplami di2 26 displaystyle sum d i 2 26 olarak bulunmustur Hesaplarin degerleri formule soyle konulur r 1 6 268 82 1 displaystyle rho 1 frac 6 times 26 8 8 2 1 ve su sonuc bulunur r 0 6 displaystyle rho 0 6 Bu r 0 6 degeri sifira yakin pozitiftir Sifira yakinligi X ve Y siralamalari arasindaki baglantinin korelasyonun az oldugunu gosterir ve negatif olma ise var zayif baglantinin aksi yonde oldugunu ifade eder yani X siralamasi artarsa Y siralamasi duser ve aksi olur Bu veriler icinde beraberlikler bulunmaktadir Bu nedenle kullanilan genel r formulu uygun sonuc vermeyebilir Daha uygun sonuc bulmak icin x ve y sira numaralari icin Pearson un carpim moment korelasyon katsayisi bulunmasi tavsiye edilmektedir r kestirimi icin anlamlilik sinamasiEger hesaplar ve anlamlilik sinamasi el hesap makineleri ile yapilmakta ise klasik cikarimsal istatistik yontemleri kullanilmalidir r kestirminin anlamlilik sinanmasi icin en basit yaklasim belirli gozlem sayisi ve belirli anlamlilik duzeyi degerleri icin hazirlanmis ozel tablolar kullanilarak basarilir Ancak bu tablolar belirli veri sayisi ve anlamlilik duzeyi disinda ise kullanilamaz Onemli komputer istatistik paketleri Spearman in siralamali korelasyon katsayisini hesapladiklari zaman ek olarak anlamlilik sinamasi icin p degerini de yaninda vermektedirler Diger bir alternatif yaklasim eger orneklem hacmi 20 den buyuk ise uygulanabilir Bu halde Student in t dagilimina bir yaklasim kullanilir t r 1 r2 n 2 displaystyle t frac rho sqrt 1 rho 2 n 2 r tn 2 t2 displaystyle rho frac t sqrt n 2 t 2 degiskeni sifir hipotez olan r 0 icin bir Student in t dagilimi gosterir Ancak biraz zayiftir ve sifir hipotez ret edilnece r nun ne deger alacagini gostermez Gozumlenen r degerinin anlamli sekilde 0dan baska degerde olmasini sinama icin modern yaklasim olarak yontemi kullanilmaktadir ve bu tip sinama icin sifir hipotez verilmisse anakutle r degerinin orneklemle elde edilen degerde ve ondan buyuk olma olasiligi hesap edilir Bu modern sinama yontemi ancak komputer programi yazabilen ve komputeri iyi kullanabilen bir bilim insani icin cok kolay olabilir Ayrica bakinizSiralama korelasyonu Pearson carpim moment korelasyon katsayisi KorelasyonKaynakca Spearman C 1904 The proof and measurement of association between two things Amer J Psychol C 15 say 72 101 Kendall M G 1962 Rank correlation methods Griffin Hollander M ve Wolfe D A 1973 Nonparametric statistical methods New York Wiley a b Myers J L ve Well A D 2003 Research Design and Statistical Analysis 2 ed Lawrence Erlbaum a b Siegel S ve Castellan N J 1988 Nonparametric statistics for the behavioral sciences 2 ed New York McGraw HillDis baglantilar 1 14 Nisan 2012 tarihinde Wayback Machine sitesinde Kucuk orneklemler icin r icin kritik degerler tablosu 2 17 Mayis 2008 tarihinde Wayback Machine sitesinde Online r hesaplayicisi Beraberlikler olursa kullanilabilecek bir diger formul vermekte 4 30 Mart 2012 tarihinde Wayback Machine sitesinde Spearman in siralama korelasyon katsayisi Ogrenciler icin hazirlanmis bir ornek problem cozumu ve notlar Hesaplama icin Microsoft Excel kullanilmasi da gosterilir