Korelasyon, olasılık kuramı ve istatistikte iki rassal değişken arasındaki doğrusal ilişkinin yönünü ve gücünü belirtir. Genel istatistiksel kullanımda korelasyon, bağımsızlık durumundan ne kadar uzaklaşıldığını gösterir.
Farklı durumlar için farklı korelasyon katsayıları geliştirilmiştir. Bunlardan en iyi bilineni Pearson çarpım-moment korelasyon katsayısıdır. İki değişkenin kovaryansının, yine bu değişkenlerin standart sapmalarının çarpımına bölünmesiyle elde edilir. Pearson ismiyle bilinmesine rağmen ilk olarak Francis Galton tarafından bulunmuştur.
Pearson çarpım-moment korelasyon katsayısı
İsimlendirme
Pearson çarpım-moment korelasyon katsayısı isminde, kovaryans hesaplanırken yapılan işlemin fiziksel moment hesabına benzerliği etkili olmuştur. Çift taraflı bir kaldıraçın iki yük kolundaki ağırlıkların momenti hesaplanırken kullanılan, ağırlık ile ağırlığın destek noktasına olan uzaklığın çarpımı ile her bir değişkenin ortalamaya olan uzaklıklarının bulunması arasındaki benzerlik bu isimlendirmeye neden olmuştur.
Matematiksel özellikleri
Korelasyon katsayısı, bağımsız değişkenler arasındaki ilişkinin yönü ve büyüklüğünü belirten katsayıdır. Bu katsayı, (-1) ile (+1) arasında bir değer alır. Pozitif değerler direkt yönlü doğrusal ilişkiyi; negatif değerler ise ters yönlü bir doğrusal ilişkiyi belirtir. Korelasyon katsayısı 0 ise söz konusu değişkenler arasında doğrusal bir ilişki yoktur.
Matematik beklenti değerleri μX ve μY, standart sapmaları σX ve σY olan iki bağımsız değişken X ve Y arasındaki Pearson'un çarpım-moment korelasyon katsayısı (ρX, Y), şu şekilde tanımlanır:
E değişkenin matematiksel beklenti değerini, cov ise kovaryansı ifade eder,
μX = E(X) olduğundan, σX2 = E(X2) - E2(X) ve
Y, için de aynısı geçerli olduğundan, şu ifadeyi yazabiliriz:
Korelasyon, yalnızca standart hataların ikisi de sonlu ve sıfırdan farklı ise, tanımlıdır. Korelasyon katsayısının 1'i (mutlak değer olarak) geçemeyeceği ise Cauchy-Schwarz eşitsizliğinin doğal bir sonucudur.
Tam bir artan doğrusal ilişkinin varlığı halinde korelasyon katsayısı 1 değerini alır, tam bir azalan ilişkinin varlığı halinde ise korelasyon katsayısı -1 değerini alır. Katsayının alabileceği diğer tüm değerler ise ilişkinin doğrusallığına bağlı olarak bu iki değer arasında olacaktır. Katsayı +1'e veya -1'e ne kadar yakınsa ilişkinin doğrusallığı o kadar güçlüdür.
Değişkenler istatistiksel olarak bağımsız ise korelasyon 0'dır fakat bunun tersi doğru değildir, çünkü korelasyon katsayısı yalnızca doğrusal olan ilişkiyi belirler.
Bir örnek: Rastgele X değişkeninin -1 ve +1 aralığında tekdüze dağılımına göre dağıldığını varsayalım ve Y = X2 ilişkisi geçerli olsun. Bu durumda Y tamamen X tarafından belirlenmiştir, öyle ki X ve Y birbirlerine bağımlıdır, fakat Pearson anlamdaki korelasyon 0 olacaktır. Ne var ki, X ve Y'nin birlikte normal dağıldığı durumda, istatistiksel bağımsızlık aynı zamanda korelasyonun da olmaması anlamına gelir..
Pearson'un çarpım-moment korelasyon katsayısı örneklem kestirimi
Bir rastgele örneklem olarak n büyüklükte X ve Y değişkenleri için veya sayısal veri serileri bulunmaktadır ve bu seriler n satırlı ve 2 sütunlu bir veri matrisi olarak ifade edilir. Bu veriler i = 1, 2, ..., n için xi ve yi olarak yazılır. Anakütle Pearson'un çarpım-moment korelasyon katsayısı olan ρXY; için, kestirim korelasyon katsayısı olan rxy şu formül ile hesaplanır:
Burada ve xi ve yi için örneklem aritmetik ortalamaları; sx and syxi ve yi için örneklem standart sapmaları ve toplama Σ i=1 ile n arasındadır. Bu formül biraz değişme ile şöyle de verilebilir:
Eğer X ve Y verileri normal dağılım gösteren bir anakütleden gelmişlerse, Pearson'un örneklem korelasyon katsayısı bu iki anakütle değişkeni arasında bulunan korelasyon için en iyi korelasyon kestirimi olduğu ispat edilmiştir. Yine, anakütle korelasyonu için doğru olduğu gibi, örneklem korelasyon katsayısı da -1 ile +1 arasında değişme gösterir.
Verilen formül kullanılarak, komputer kullanarak tek geçişli algoritm olarak örneklem korelasyon katsayısı hesaplanması kolay görülmesine rağmen, pratikte özellikle bu formülün kullanışı sayısal kararsız olarak pek şöhret kazanmıştır. Aşağıda daha kararlı ve kesin sonuç veren örneklem korelasyon katsayı hesaplaması verilecektir.
Örneklem korelasyon katsayısının karesi (belirtme katsayısı), xi'in yi'ye doğrusal uygunluğunun sağlanması halinde, açıklanan yi varyansı olarak da tanımlanabilir. Bu matematiksel biçimde şöyle yazılır:
Burada σy|x2 terimi xi'in yi'ye arasındaki ilişkinin bir y = a + bx doğrusu ile ifade edilmesinin kestirimi sırasında ortaya çıkan hata karelerinin toplamıdır.
ile σy2 y için varyansdır; yani
Örneklem korelasyon katsayısı hem xi'e hem yi'ya göre simetrik olduğu için, eğer bağımlı değişken olarak xi seçilip yi'in buna doğrusal uygunluğunun kestirimi elde edilirse, aynı değer
elde edilir.
Bu denklem daha yüksek boyutlarda korelasyon katsayısı bulunması için bazı ipuçları vermektedir. Yukarıda içinde bir 2-boyutlu vektör grubu için tek-boyutlu bir ölçü uygulaması halinde ortaya çıkartılan açıklanan varyans kısmı örneklem korelasyon olarak tanımlanmıştır. Aynı şekilde m boyutlu bir doğrusal alt-manifoldta n boyutlu vektörlerin uygulanması olan çoklu korelasyon katsayısı tanımlanabilir. Örneğin z için x ile y'ye göre bir düzey olan z = a + bx + cy uygulanırsa, 'z'nin x ile y'ye göre korelasyonu şöyle verilir:
Korelasyonun açıklanması
Örneklem korelasyon katsayısı iki rassal değişken olan X ve Y'yi temsil eden vektörlerin kosinus değeri olarak açıklanabilir.
Örneklem korelasyon katsayısı mümkün uçsal değerler olan -1 veya +1 olursa, çok iyi iki değişken arasında çok iyi bir doğrusal bağlantı bulunduğu kabul edilir. Eğer örneklem korelasyon katsayısı 0'a eşitse, iki değişken arasında hiç doğrusal bağlantı bulunmaz. Dikkat edilirse hep örneklem korelasyon katsayısı ile doğrusal bağlantı açıklanmakta ve genel olarak bağlantıdan bahis edilmemektedir. Örneğin iki değişken arasında çok yakın bir daire şeklinde bağlantı bulunsa, örneklem korelasyon katsayısı 0'a yakın olacaktır.
Değişik istatistikçiler örneklem korelasyon katsayısının değerlerini daha ayrıntılı olarak açıklamaktadırlar. Burada Cohen(1988), tarafından, özellikle psikoloji ilim dalında uygulamalı olarak, verilen ayrıntılı açıklama şu tabloda gösterilmektedir:
Korelasyon | Negatif | Pozitif |
Düşük | -0,29 to -0,10 | 0,10 to 0,29 |
Orta derecede | -0,49 to -0,30 | 0,30 to 0,49 |
Yüksek | -0,50 to -1,00 | 0,50 to 1,00 |
Bu ayrıntılı açıklama çok subjektifdir ve belli bir bilim dalı için (psikoloji) uygundur ama genelleştirilmesi uygun değildir. Değişik bilim dalları korelasyon katsayısı değerlerinin değişik olarak açıklamasını kabul etmektedirler. Örneğin çok dakik ölçüm aletleri ile ortaya çıkarılan ölçüler arasında bulunan 0,9 korelasyon değerinin çok düşük olduğu kabul edilebilir; halbuki ayni katsayı değeri bir sosyal bilimci veya iktisatçı tarafından çok yüksek (hatta gerçekliğine şüphe yaratırcasına büyük) olarak kabul edilmektedir.
Korelasyon hakkında yaygın bazı hatalı düşünceler
Korelasyon ve nedensellik
İstatistikte korelasyon hakkında çok kullanılan ve her istatistik kullananın bilmesi gerek bir cümle şudur:
- Korelasyon veya doğrusal ilişki nedensellik değildir.
Genellikle çok kişi iki değişken arasında bir ilişki kurulunca birinin sebep diğerinin sonuç olduğuna ve birinin diğerine neden olduğuna inanmış görünürler. Gerçekten nedensellik ve korelasyon birbirine bağlı kavramlardır: nedensellik ispat edilmesi için korelasyonun bulunması gereklidir ama bu nedensellik göstermek için yeterli değildir. Nedensellik ve korelasyon birbirlerine eşit değillerdir ama daha uygun cümleler ile
- Empirik olarak gözümlenen birlikte değişme nedensellik açıklaması için gereklidir ama yeterli değildir.
- Korelasyon nedensellik değildir; ama nedenseliğin daha ayrıntılı incelenmesini gerektiren ipucunu sağlar.
İstatistikte birbiri ile çok yakından doğrusal ilişkili gibi görülen ama biri diğerine sebep-sonuç olmayan birçok pratik örnek bilinmektedir. Genellikle bu türlü nedensellikden doğmayan yakın ilişkiye sahte korelasyon adı verilmektedir. Genellikle bu sahte korelasyon iki değişkenin de bir başka saklı olan değişken tarafından etkilenmesi dolayısı ile ortaya çıkar. Biraz abstre olarak A ve B arasında bulunan yakın korelasyon daha objektif olarak dikkatle incelenince üç tür mümkün ilişki olabilceği görülür:
- A nedendir B sonuçtur;
- B nedendir A sonuçtur;
yahut
- C neden A sonuçtur VE C neden B sonuçtur.
İşte sahte korelasyon üçüncü halde ortaya çıkar. A ve B arasında görülen yakın ilişki birbirinin sebep-sonuç olmasından doğmaz. Yakın korelasyon her hâlde sebep-sonuç ilişkisi ifade etmez: "korelasyon nedensellik değildir".
Sahte korelasyon hakkında birçok örnek verilmiştir ve bunlar bazen alaycı, bazen şaşırtıcı ve bazen gülünçtür. Bunlardan bazılarını verip niçin sahte korelasyon bulunduğunu açıklayalım:
- İskandinavya'da 19. yüzyıl sonu ve 20. yüzyıl için yıllık leylek sayısı ve yıllık çocuk doğumları inceleyince çok yakın bir pozitif korelasyon bulunmaktadır. Bu, doğan çocukların leylekler tarafından getirildikleri önermesini doğrulamaz. Hem çocuk doğum sayısı hem de leylek sayısı ekonomik gelişme ve şehirleşme dolayısıyla azalmış ve bu iki azalma birinin diğerine sebep-sonuç olmasından ortaya çıkmamıştır.
- Bir sahil şehrinde aylık dondurma satışları ile aylık denizde boğulma sayıları yıl içinde birlikte artıp eksilme gösterip yakın pozitif korelasyon gösterirler. Bu demek değildir ki fazla dondurma fazla boğulmalara sebep-sonuç olmakta veya boğulmaların azalması dondurma satışlarına aksi tesirde bulunmaktadır. Her ikisi de mevsim değiştiği için aynı yönde değişik etki görmektedir.
- Ayakkabı ile uyumak, baş ağrısı ile uyanmakla yakın pozitif korelasyon gösterir. Bu demek değildir ki ayakkabı ile yatmak baş ağrısı doğurur. Çok daha uygun bir açıklama, her ikisinin de fazla alkollü içki kullanımı sonucu ortaya çıkmasıdır.
- Bir yangına müdahale eden itfaiye mensuplarının sayısı ile yangından ortaya çıkan maddi hasar birbirleri ile yakın korelasyon gösterirler. Bu demek değildir ki itfaiye mensubu sayısı artışı (yağmacı artışı gibi) daha çok maddi hasar çıkmasına neden olur. Asıl açıklama yangının büyüklüğü ve şiddetine dayanır; büyük yangınlar daha çok itfaiyeci gerektirir ve daha çok hasar doğurur.
- 1950'lerden beri hava kirliliği göstergeleri ile polise bildirilen hırsızlık olayları sayısı pozitif korelasyon göstermektedir. Bu demek değildir ki hava kirliliği artışı hırsızlık olaylarının artışına; yahut hava kirliliğinin artışı hırsızlık sayısı artışına neden olmuştur. Her iki değişkende de hızlı şehirleşme dolayısı ile artış görülmektedir.
Korelasyon ve doğrusallık
Pearson'un korelasyon katsayısı iki değişken arasındaki doğrusal ilişkinin gücünü göstermekle beraber, kestirim olarak bulunan katsayı değeri bu ilişkiyi tam olarak açıklamak için yeterli değildir. Bu sonuç eğer veriler normal dağılım göstermiyorlarsa daha da önem kazanmaktadır.
Dört değişik veri çiftini ve dört serpme diyagramını kapsayan ve istatistikçiler arasında çok iyi bilinen yandaki gösterimler İngiliz asıllı Amerikan istatistikçi tarafından hazırlanan bir yazıda gösterilmiştir. Gösterilen 4 değişik y değişkeninin hepsi için de aynı olan ortalama (7,5), standart sapma (4,12), korelasyon katsayısı (0,81) ve regresyon doğrusu () bulunmaktadır. Fakat gösterimden açıkça görülmektedir ki dört Y değişkenin dağılımları çok farklıdır. Sol yukarıdaki göstergede iki değişken birbirine korelasyon ile ilişkili olup her iki değişkenin de normal dağılıma uyduğu varsayımlarının gerçeğe uygun olduğu kabul edilebilir. Üst sağdaki gösterim de değişkenlerin normal dağılım gösterdikleri kabul edilemez; iki değişken arasında ilişki olmakla beraber bunun doğrusal olduğu da kabul edilemez ve bu nedenle yüksek korelasyon katsayısı bu ilişkiyi açıklayamaz. Alt soldaki göstergeden görülmektedir ki iki değişken arasında tam bir doğrusal ilişki vardır, ancak tek bir aykırı değer bulunmakta ve bu da korelasyon katsayı değerini 1'den 0.81'e düşürmektedir. Alt sağdaki son gösterimden iki değişken arasındaki ilişkinin doğrusal olmadığı ve bulunan tek bir aykırı noktanın hesaplanan yüksek korelasyon katsayısına neden olduğu görülmektedir.
Bu örnek açıkça göstermektedir ki bir özetleme istatistiğine (burada korelasyon katsayı değerine) dayanarak, verilerin daha ayrıntılı incelenmesi yapılmadan, ortaya sonuç çıkartma iyi inceleme için gayet yetersizdir.
Korelasyon katsayısının kesin olarak tek-geçişli olarak bilgisayarla hesaplanması
Sayısal olarak kararlılığı ve kesinliği iyi olan Pearson'un çarpan-moment korelasyon katsayısı hesaplama algoritması için şu sözdekod verilmiştir:
sum_sq_x = 0 sum_sq_y = 0 sum_xy = 0 mean_x = x[1] mean_y = y[1] for i in 2 to N: sweep = (i - 1.0) / i delta_x = x[i] - mean_x delta_y = y[i] - mean_y sum_sq_x += delta_x * delta_x * sweep sum_sq_y += delta_y * delta_y * sweep sum_xy += delta_x * delta_y * sweep mean_x += delta_x / i mean_y += delta_y / i pop_sd_x = sqrt(sum_sq_x / N) pop_sd_y = sqrt(sum_sq_y / N) cov_x_y = sum_coproduct / N korelasyon = cov_x_y / (pop_sd_x * pop_sd_y)
Ayrıca bakınız
Kaynakça
- ^ Miles, J., & Banyard, P. (2007). Understanding and using statistics in psychology: a practical introduction. Sage.
- ^ Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.) Hillsdale, NJ: Lawrence Erlbaum Associates.
- ^ Anscombe, Francis J. (1973) Graphs in statistical analysis. American Statistician, C.27 say. 17-21.
Dış bağlantılar
- Korelasyon kavramını anlamak. Bir Hawaii Universitesi profesörü tarafından hazırlanan kılavuz 17 Aralık 2007 tarihinde Wayback Machine sitesinde . (en.)
- Statsoft Elektronik Ders Kitabı 16 Haziran 2008 tarihinde Wayback Machine sitesinde . (en.)
- Pearson'un korelasyonun katsayısının çabukca olarak hesaplanması 16 Haziran 2008 tarihinde Wayback Machine sitesinde . (en.)
- Korelasyon katsayısının dağılımı. Simulasyonlarla öğrenme 16 Mayıs 2008 tarihinde Wayback Machine sitesinde . (en.)
- İki değişken arasındaki bir doğrusal ilişkinin gücünü hesaplayan korelasyon 12 Haziran 2008 tarihinde Wayback Machine sitesinde . (en.)
- Bir örnek verileri için (çapraz) korelasyon katsayıları için MathWorld sayfası31 Ağustos 2019 tarihinde Wayback Machine sitesinde . (en.)
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Korelasyon olasilik kurami ve istatistikte iki rassal degisken arasindaki dogrusal iliskinin yonunu ve gucunu belirtir Genel istatistiksel kullanimda korelasyon bagimsizlik durumundan ne kadar uzaklasildigini gosterir Farkli durumlar icin farkli korelasyon katsayilari gelistirilmistir Bunlardan en iyi bilineni Pearson carpim moment korelasyon katsayisidir Iki degiskenin kovaryansinin yine bu degiskenlerin standart sapmalarinin carpimina bolunmesiyle elde edilir Pearson ismiyle bilinmesine ragmen ilk olarak Francis Galton tarafindan bulunmustur Pearson carpim moment korelasyon katsayisiIsimlendirme Pearson carpim moment korelasyon katsayisi isminde kovaryans hesaplanirken yapilan islemin fiziksel moment hesabina benzerligi etkili olmustur Cift tarafli bir kaldiracin iki yuk kolundaki agirliklarin momenti hesaplanirken kullanilan agirlik ile agirligin destek noktasina olan uzakligin carpimi ile her bir degiskenin ortalamaya olan uzakliklarinin bulunmasi arasindaki benzerlik bu isimlendirmeye neden olmustur Matematiksel ozellikleri Korelasyon katsayisi bagimsiz degiskenler arasindaki iliskinin yonu ve buyuklugunu belirten katsayidir Bu katsayi 1 ile 1 arasinda bir deger alir Pozitif degerler direkt yonlu dogrusal iliskiyi negatif degerler ise ters yonlu bir dogrusal iliskiyi belirtir Korelasyon katsayisi 0 ise soz konusu degiskenler arasinda dogrusal bir iliski yoktur Matematik beklenti degerleri mX ve mY standart sapmalari sX ve sY olan iki bagimsiz degisken X ve Y arasindaki Pearson un carpim moment korelasyon katsayisi rX Y su sekilde tanimlanir rX Y Cov X Y sXsY E X mX Y mY sXsY displaystyle rho X Y mathrm Cov X Y over sigma X sigma Y E X mu X Y mu Y over sigma X sigma Y E degiskenin matematiksel beklenti degerini cov ise kovaryansi ifade eder mX E X oldugundan sX2 E X2 E2 X ve Y icin de aynisi gecerli oldugundan su ifadeyi yazabiliriz rX Y E XY E X E Y E X2 E2 X E Y2 E2 Y displaystyle rho X Y frac E XY E X E Y sqrt E X 2 E 2 X sqrt E Y 2 E 2 Y Korelasyon yalnizca standart hatalarin ikisi de sonlu ve sifirdan farkli ise tanimlidir Korelasyon katsayisinin 1 i mutlak deger olarak gecemeyecegi ise Cauchy Schwarz esitsizliginin dogal bir sonucudur Tam bir artan dogrusal iliskinin varligi halinde korelasyon katsayisi 1 degerini alir tam bir azalan iliskinin varligi halinde ise korelasyon katsayisi 1 degerini alir Katsayinin alabilecegi diger tum degerler ise iliskinin dogrusalligina bagli olarak bu iki deger arasinda olacaktir Katsayi 1 e veya 1 e ne kadar yakinsa iliskinin dogrusalligi o kadar gucludur Degiskenler istatistiksel olarak bagimsiz ise korelasyon 0 dir fakat bunun tersi dogru degildir cunku korelasyon katsayisi yalnizca dogrusal olan iliskiyi belirler Bir seri x y noktalar ve her set icin x ile y arasindaki korelasyon katsayisi degeri Yukari siradan goruldugu gibi korelasyon bir dogrusal iliskinin yonunu ve rastgele yayilimini yansitir Orta siradan anlasilmaktadir ki korelasyon iliskinin egiliminden etkilenmez Dikkat edilirse tam merkezdeki gosterimde iliski 0 dir ama Y varyansi 0 oldugu icin korelasyon katsayisi tanimlanamamaktadir Son siranin amaci korelasyonun dogrusal olmayan baglantilardan da etkilenmedigini gostermektir Bir ornek Rastgele X degiskeninin 1 ve 1 araliginda tekduze dagilimina gore dagildigini varsayalim ve Y X2 iliskisi gecerli olsun Bu durumda Y tamamen X tarafindan belirlenmistir oyle ki X ve Y birbirlerine bagimlidir fakat Pearson anlamdaki korelasyon 0 olacaktir Ne var ki X ve Y nin birlikte normal dagildigi durumda istatistiksel bagimsizlik ayni zamanda korelasyonun da olmamasi anlamina gelir Pearson un carpim moment korelasyon katsayisi orneklem kestirimi Bir rastgele orneklem olarak n buyuklukte X ve Y degiskenleri icin veya sayisal veri serileri bulunmaktadir ve bu seriler n satirli ve 2 sutunlu bir veri matrisi olarak ifade edilir Bu veriler i 1 2 n icin xi ve yi olarak yazilir Anakutle Pearson un carpim moment korelasyon katsayisi olan rXY icin kestirim korelasyon katsayisi olan rxy su formul ile hesaplanir rxy xi x yi y n 1 sxsy displaystyle r xy frac sum x i bar x y i bar y n 1 s x s y Burada x displaystyle bar x ve y displaystyle bar y xi ve yi icin orneklem aritmetik ortalamalari sx and syxi ve yi icin orneklem standart sapmalari ve toplama S i 1 ile n arasindadir Bu formul biraz degisme ile soyle de verilebilir rxy n xiyi xi yin xi2 xi 2 n yi2 yi 2 displaystyle r xy frac n sum x i y i sum x i sum y i sqrt n sum x i 2 sum x i 2 sqrt n sum y i 2 sum y i 2 Eger X ve Y verileri normal dagilim gosteren bir anakutleden gelmislerse Pearson un orneklem korelasyon katsayisi bu iki anakutle degiskeni arasinda bulunan korelasyon icin en iyi korelasyon kestirimi oldugu ispat edilmistir Yine anakutle korelasyonu icin dogru oldugu gibi orneklem korelasyon katsayisi da 1 ile 1 arasinda degisme gosterir Verilen formul kullanilarak komputer kullanarak tek gecisli algoritm olarak orneklem korelasyon katsayisi hesaplanmasi kolay gorulmesine ragmen pratikte ozellikle bu formulun kullanisi sayisal kararsiz olarak pek sohret kazanmistir Asagida daha kararli ve kesin sonuc veren orneklem korelasyon katsayi hesaplamasi verilecektir Orneklem korelasyon katsayisinin karesi belirtme katsayisi xi in yi ye dogrusal uygunlugunun saglanmasi halinde aciklanan yi varyansi olarak da tanimlanabilir Bu matematiksel bicimde soyle yazilir rxy2 1 sy x2sy2 displaystyle r xy 2 1 frac sigma y x 2 sigma y 2 Burada sy x2 terimi xi in yi ye arasindaki iliskinin bir y a bx dogrusu ile ifade edilmesinin kestirimi sirasinda ortaya cikan hata karelerinin toplamidir sy x2 i 1n yi a bxi 2 displaystyle sigma y x 2 sum i 1 n y i a bx i 2 ile sy2 y icin varyansdir yani sy2 i 1n yi y 2 displaystyle sigma y 2 sum i 1 n y i bar y 2 Orneklem korelasyon katsayisi hem xi e hem yi ya gore simetrik oldugu icin eger bagimli degisken olarak xi secilip yi in buna dogrusal uygunlugunun kestirimi elde edilirse ayni deger rxy2 1 sx y2sx2 displaystyle r xy 2 1 frac sigma x y 2 sigma x 2 elde edilir Bu denklem daha yuksek boyutlarda korelasyon katsayisi bulunmasi icin bazi ipuclari vermektedir Yukarida icinde bir 2 boyutlu vektor grubu icin tek boyutlu bir olcu uygulamasi halinde ortaya cikartilan aciklanan varyans kismi orneklem korelasyon olarak tanimlanmistir Ayni sekilde m boyutlu bir dogrusal alt manifoldta n boyutlu vektorlerin uygulanmasi olan coklu korelasyon katsayisi tanimlanabilir Ornegin z icin x ile y ye gore bir duzey olan z a bx cy uygulanirsa z ninxiley ye gore korelasyonu soyle verilir r2 1 sz xy2sz2 displaystyle r 2 1 frac sigma z xy 2 sigma z 2 Korelasyonun aciklanmasi Orneklem korelasyon katsayisi iki rassal degisken olan X ve Y yi temsil eden vektorlerin kosinus degeri olarak aciklanabilir Orneklem korelasyon katsayisi mumkun ucsal degerler olan 1 veya 1 olursa cok iyi iki degisken arasinda cok iyi bir dogrusal baglanti bulundugu kabul edilir Eger orneklem korelasyon katsayisi 0 a esitse iki degisken arasinda hic dogrusal baglanti bulunmaz Dikkat edilirse hep orneklem korelasyon katsayisi ile dogrusal baglanti aciklanmakta ve genel olarak baglantidan bahis edilmemektedir Ornegin iki degisken arasinda cok yakin bir daire seklinde baglanti bulunsa orneklem korelasyon katsayisi 0 a yakin olacaktir Degisik istatistikciler orneklem korelasyon katsayisinin degerlerini daha ayrintili olarak aciklamaktadirlar Burada Cohen 1988 tarafindan ozellikle psikoloji ilim dalinda uygulamali olarak verilen ayrintili aciklama su tabloda gosterilmektedir Korelasyon Negatif PozitifDusuk 0 29 to 0 10 0 10 to 0 29Orta derecede 0 49 to 0 30 0 30 to 0 49Yuksek 0 50 to 1 00 0 50 to 1 00 Bu ayrintili aciklama cok subjektifdir ve belli bir bilim dali icin psikoloji uygundur ama genellestirilmesi uygun degildir Degisik bilim dallari korelasyon katsayisi degerlerinin degisik olarak aciklamasini kabul etmektedirler Ornegin cok dakik olcum aletleri ile ortaya cikarilan olculer arasinda bulunan 0 9 korelasyon degerinin cok dusuk oldugu kabul edilebilir halbuki ayni katsayi degeri bir sosyal bilimci veya iktisatci tarafindan cok yuksek hatta gercekligine suphe yaratircasina buyuk olarak kabul edilmektedir Korelasyon hakkinda yaygin bazi hatali dusuncelerKorelasyon ve nedensellik Istatistikte korelasyon hakkinda cok kullanilan ve her istatistik kullananin bilmesi gerek bir cumle sudur Korelasyon veya dogrusal iliski nedensellik degildir dd Genellikle cok kisi iki degisken arasinda bir iliski kurulunca birinin sebep digerinin sonuc olduguna ve birinin digerine neden olduguna inanmis gorunurler Gercekten nedensellik ve korelasyon birbirine bagli kavramlardir nedensellik ispat edilmesi icin korelasyonun bulunmasi gereklidir ama bu nedensellik gostermek icin yeterli degildir Nedensellik ve korelasyon birbirlerine esit degillerdir ama daha uygun cumleler ile Empirik olarak gozumlenen birlikte degisme nedensellik aciklamasi icin gereklidir ama yeterli degildir Korelasyon nedensellik degildir ama nedenseligin daha ayrintili incelenmesini gerektiren ipucunu saglar dd Istatistikte birbiri ile cok yakindan dogrusal iliskili gibi gorulen ama biri digerine sebep sonuc olmayan bircok pratik ornek bilinmektedir Genellikle bu turlu nedensellikden dogmayan yakin iliskiye sahte korelasyon adi verilmektedir Genellikle bu sahte korelasyon iki degiskenin de bir baska sakli olan degisken tarafindan etkilenmesi dolayisi ile ortaya cikar Biraz abstre olarak A ve B arasinda bulunan yakin korelasyon daha objektif olarak dikkatle incelenince uc tur mumkun iliski olabilcegi gorulur A nedendir B sonuctur B nedendir A sonuctur yahut C neden A sonuctur VE C neden B sonuctur Iste sahte korelasyon ucuncu halde ortaya cikar A ve B arasinda gorulen yakin iliski birbirinin sebep sonuc olmasindan dogmaz Yakin korelasyon her halde sebep sonuc iliskisi ifade etmez korelasyon nedensellik degildir Sahte korelasyon hakkinda bircok ornek verilmistir ve bunlar bazen alayci bazen sasirtici ve bazen gulunctur Bunlardan bazilarini verip nicin sahte korelasyon bulundugunu aciklayalim Iskandinavya da 19 yuzyil sonu ve 20 yuzyil icin yillik leylek sayisi ve yillik cocuk dogumlari inceleyince cok yakin bir pozitif korelasyon bulunmaktadir Bu dogan cocuklarin leylekler tarafindan getirildikleri onermesini dogrulamaz Hem cocuk dogum sayisi hem de leylek sayisi ekonomik gelisme ve sehirlesme dolayisiyla azalmis ve bu iki azalma birinin digerine sebep sonuc olmasindan ortaya cikmamistir Bir sahil sehrinde aylik dondurma satislari ile aylik denizde bogulma sayilari yil icinde birlikte artip eksilme gosterip yakin pozitif korelasyon gosterirler Bu demek degildir ki fazla dondurma fazla bogulmalara sebep sonuc olmakta veya bogulmalarin azalmasi dondurma satislarina aksi tesirde bulunmaktadir Her ikisi de mevsim degistigi icin ayni yonde degisik etki gormektedir Ayakkabi ile uyumak bas agrisi ile uyanmakla yakin pozitif korelasyon gosterir Bu demek degildir ki ayakkabi ile yatmak bas agrisi dogurur Cok daha uygun bir aciklama her ikisinin de fazla alkollu icki kullanimi sonucu ortaya cikmasidir Bir yangina mudahale eden itfaiye mensuplarinin sayisi ile yangindan ortaya cikan maddi hasar birbirleri ile yakin korelasyon gosterirler Bu demek degildir ki itfaiye mensubu sayisi artisi yagmaci artisi gibi daha cok maddi hasar cikmasina neden olur Asil aciklama yanginin buyuklugu ve siddetine dayanir buyuk yanginlar daha cok itfaiyeci gerektirir ve daha cok hasar dogurur 1950 lerden beri hava kirliligi gostergeleri ile polise bildirilen hirsizlik olaylari sayisi pozitif korelasyon gostermektedir Bu demek degildir ki hava kirliligi artisi hirsizlik olaylarinin artisina yahut hava kirliliginin artisi hirsizlik sayisi artisina neden olmustur Her iki degiskende de hizli sehirlesme dolayisi ile artis gorulmektedir Korelasyon ve dogrusallik Korelasyon katsayi degeri ayni r 0 81 olan dort degisik orneklem veri Pearson un korelasyon katsayisi iki degisken arasindaki dogrusal iliskinin gucunu gostermekle beraber kestirim olarak bulunan katsayi degeri bu iliskiyi tam olarak aciklamak icin yeterli degildir Bu sonuc eger veriler normal dagilim gostermiyorlarsa daha da onem kazanmaktadir Dort degisik veri ciftini ve dort serpme diyagramini kapsayan ve istatistikciler arasinda cok iyi bilinen yandaki gosterimler Ingiliz asilli Amerikan istatistikci tarafindan hazirlanan bir yazida gosterilmistir Gosterilen 4 degisik y degiskeninin hepsi icin de ayni olan ortalama 7 5 standart sapma 4 12 korelasyon katsayisi 0 81 ve regresyon dogrusu y 3 0 5x displaystyle y 3 0 5x bulunmaktadir Fakat gosterimden acikca gorulmektedir ki dort Y degiskenin dagilimlari cok farklidir Sol yukaridaki gostergede iki degisken birbirine korelasyon ile iliskili olup her iki degiskenin de normal dagilima uydugu varsayimlarinin gercege uygun oldugu kabul edilebilir Ust sagdaki gosterim de degiskenlerin normal dagilim gosterdikleri kabul edilemez iki degisken arasinda iliski olmakla beraber bunun dogrusal oldugu da kabul edilemez ve bu nedenle yuksek korelasyon katsayisi bu iliskiyi aciklayamaz Alt soldaki gostergeden gorulmektedir ki iki degisken arasinda tam bir dogrusal iliski vardir ancak tek bir aykiri deger bulunmakta ve bu da korelasyon katsayi degerini 1 den 0 81 e dusurmektedir Alt sagdaki son gosterimden iki degisken arasindaki iliskinin dogrusal olmadigi ve bulunan tek bir aykiri noktanin hesaplanan yuksek korelasyon katsayisina neden oldugu gorulmektedir Bu ornek acikca gostermektedir ki bir ozetleme istatistigine burada korelasyon katsayi degerine dayanarak verilerin daha ayrintili incelenmesi yapilmadan ortaya sonuc cikartma iyi inceleme icin gayet yetersizdir Korelasyon katsayisinin kesin olarak tek gecisli olarak bilgisayarla hesaplanmasiSayisal olarak kararliligi ve kesinligi iyi olan Pearson un carpan moment korelasyon katsayisi hesaplama algoritmasi icin su sozdekod verilmistir sum sq x 0 sum sq y 0 sum xy 0 mean x x 1 mean y y 1 for i in 2 to N sweep i 1 0 i delta x x i mean x delta y y i mean y sum sq x delta x delta x sweep sum sq y delta y delta y sweep sum xy delta x delta y sweep mean x delta x i mean y delta y i pop sd x sqrt sum sq x N pop sd y sqrt sum sq y N cov x y sum coproduct N korelasyon cov x y pop sd x pop sd y Ayrica bakinizOtokorelasyon Spearman in siralama korelasyon katsayisiKaynakca Miles J amp Banyard P 2007 Understanding and using statistics in psychology a practical introduction Sage Cohen J 1988 Statistical power analysis for the behavioral sciences 2nd ed Hillsdale NJ Lawrence Erlbaum Associates Anscombe Francis J 1973 Graphs in statistical analysis American Statistician C 27 say 17 21 Dis baglantilarKorelasyon kavramini anlamak Bir Hawaii Universitesi profesoru tarafindan hazirlanan kilavuz 17 Aralik 2007 tarihinde Wayback Machine sitesinde en Statsoft Elektronik Ders Kitabi 16 Haziran 2008 tarihinde Wayback Machine sitesinde en Pearson un korelasyonun katsayisinin cabukca olarak hesaplanmasi 16 Haziran 2008 tarihinde Wayback Machine sitesinde en Korelasyon katsayisinin dagilimi Simulasyonlarla ogrenme 16 Mayis 2008 tarihinde Wayback Machine sitesinde en Iki degisken arasindaki bir dogrusal iliskinin gucunu hesaplayan korelasyon 12 Haziran 2008 tarihinde Wayback Machine sitesinde en Bir ornek verileri icin capraz korelasyon katsayilari icin MathWorld sayfasi31 Agustos 2019 tarihinde Wayback Machine sitesinde en