İstatistikte aykırı değer, diğer gözlemlerden önemli ölçüde farklı olan bir Aykırı değer, ölçümdeki değişkenlikten kaynaklanabilir veya deneysel hatayı gösterebilir; ikincisi bazen hariç tutulur. Bir aykırı değer, istatistiksel analizlerde ciddi sorunlara neden olabilir.
Aykırı değerler herhangi bir dağılımda tesadüfen ortaya çıkabilir, ancak bunlar genellikle ya ya da popülasyonun yoğun bir dağılıma sahip olduğunu gösterir . İlk durumda, bir kişi bunları atmak veya aykırı değerlere karşı sağlam (Güçlü İstatistik) olan istatistikleri kullanmak isterken, ikinci durumda, dağılımın yüksek çarpıklığa sahip olduğunu ve normal bir dağılım varsayan araçları veya sezgileri kullanırken çok dikkatli olunması gerektiğini belirtirler. Aykırı değerlerin sık görülen bir nedeni, iki farklı alt popülasyon olabilen veya 'doğru deneme'ye karşı 'ölçüm hatası' gösterebilen iki dağılımın karışımıdır; bu bir ile modellenmiştir.
Daha büyük veri örneklemelerinin çoğunda, bazı veri noktaları örnek ortalamasından makul sayılandan daha uzak olacaktır. Bunun nedeni, varsayılan bir olasılık dağılımları ailesi oluşturan teorideki tesadüfi sistematik hata veya kusurlar olabilir veya bazı gözlemlerin verilerin merkezinden uzak olması olabilir. Bu nedenle aykırı değerler, hatalı verileri, hatalı prosedürleri veya belirli bir teorinin geçerli olmayabileceği alanları gösterebilir. Bununla birlikte, büyük örneklerde, az sayıda aykırı değer beklenmelidir (ve herhangi bir anormal durumdan dolayı değil).
En uç gözlemler olan aykırı değerler, aşırı yüksek veya düşük olmalarına bağlı olarak maksimum örnek veya minimum örnek veya her ikisini de içerebilir. Bununla birlikte, maksimum örnek ve minimum örnek her zaman aykırı değerler değildir çünkü bunlar diğer gözlemlerden alışılmadık şekilde uzak olmayabilir.
Aykırı değerleri içeren veri kümelerinden elde edilen istatistiklerin naif yorumu yanıltıcı olabilir. Örneğin, bir odadaki 10 nesnenin ortalama sıcaklığı hesaplanıyorsa ve bunlardan dokuzu 20 ila 25 santigrat derece arasındaysa, ancak bir fırın 175 °C sıcaklıktaysa, verilerin medyanı 20 ile 25 arasında olacaktır. Ancak ortalama sıcaklık 35.5 °C ile 40 °C arasında olacaktır. Bu durumda, medyan, rastgele örneklenmiş bir nesnenin sıcaklığını (ama odadaki sıcaklığı değil) ortalamadan daha iyi yansıtır; ortalamayı, medyana eşdeğer "tipik bir örnek" olarak saf bir şekilde yorumlamak yanlıştır. Bu durumun gösterildiği gibi, aykırı değerler, örnek kümenin geri kalanından farklı bir popülasyona ait veri noktalarını gösterebilir.
Aykırı değerlerle başa çıkabilen sağlam olduğu söylenir: medyan sağlam bir merkezi eğilim istatistiği iken, ortalama değildir. Bununla birlikte, ortalama genellikle daha kesin bir tahmin edicidir.
Kaynakça
- ^ Grubbs (February 1969). "Procedures for detecting outlying observations in samples". Technometrics. 11 (1): 1-21. doi:10.1080/00401706.1969.10490657.
An outlying observation, or "outlier," is one that appears to deviate markedly from other members of the sample in which it occurs.
- ^ "Outliers". Introduction to Econometrics. 2nd. New York: MacMillan. 1992. ss. 89. ISBN .
An outlier is an observation that is far removed from the rest of the observations.
- ^ Grubbs 1969 stating "An outlying observation may be merely an extreme manifestation of the random variability inherent in the data. ... On the other hand, an outlying observation may be the result of gross deviation from prescribed experimental procedure or an error in calculating or recording the numerical value."
- ^ Chandan Mukherjee, Howard White, Marc Wuyts, 1998, "Econometrics and Data Analysis for Developing Countries Vol. 1"
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Istatistikte aykiri deger diger gozlemlerden onemli olcude farkli olan bir Aykiri deger olcumdeki degiskenlikten kaynaklanabilir veya deneysel hatayi gosterebilir ikincisi bazen haric tutulur Bir aykiri deger istatistiksel analizlerde ciddi sorunlara neden olabilir Sekil 1 Orta sutunda dort aykiri degerin yani sira ilk sutunda bir aykiri deger gosteren Michelson Morley deneyinden elde edilen verilerin kutu grafigi Aykiri degerler herhangi bir dagilimda tesadufen ortaya cikabilir ancak bunlar genellikle ya ya da populasyonun yogun bir dagilima sahip oldugunu gosterir Ilk durumda bir kisi bunlari atmak veya aykiri degerlere karsi saglam Guclu Istatistik olan istatistikleri kullanmak isterken ikinci durumda dagilimin yuksek carpikliga sahip oldugunu ve normal bir dagilim varsayan araclari veya sezgileri kullanirken cok dikkatli olunmasi gerektigini belirtirler Aykiri degerlerin sik gorulen bir nedeni iki farkli alt populasyon olabilen veya dogru deneme ye karsi olcum hatasi gosterebilen iki dagilimin karisimidir bu bir ile modellenmistir Daha buyuk veri orneklemelerinin cogunda bazi veri noktalari ornek ortalamasindan makul sayilandan daha uzak olacaktir Bunun nedeni varsayilan bir olasilik dagilimlari ailesi olusturan teorideki tesadufi sistematik hata veya kusurlar olabilir veya bazi gozlemlerin verilerin merkezinden uzak olmasi olabilir Bu nedenle aykiri degerler hatali verileri hatali prosedurleri veya belirli bir teorinin gecerli olmayabilecegi alanlari gosterebilir Bununla birlikte buyuk orneklerde az sayida aykiri deger beklenmelidir ve herhangi bir anormal durumdan dolayi degil En uc gozlemler olan aykiri degerler asiri yuksek veya dusuk olmalarina bagli olarak maksimum ornek veya minimum ornek veya her ikisini de icerebilir Bununla birlikte maksimum ornek ve minimum ornek her zaman aykiri degerler degildir cunku bunlar diger gozlemlerden alisilmadik sekilde uzak olmayabilir Aykiri degerleri iceren veri kumelerinden elde edilen istatistiklerin naif yorumu yaniltici olabilir Ornegin bir odadaki 10 nesnenin ortalama sicakligi hesaplaniyorsa ve bunlardan dokuzu 20 ila 25 santigrat derece arasindaysa ancak bir firin 175 C sicakliktaysa verilerin medyani 20 ile 25 arasinda olacaktir Ancak ortalama sicaklik 35 5 C ile 40 C arasinda olacaktir Bu durumda medyan rastgele orneklenmis bir nesnenin sicakligini ama odadaki sicakligi degil ortalamadan daha iyi yansitir ortalamayi medyana esdeger tipik bir ornek olarak saf bir sekilde yorumlamak yanlistir Bu durumun gosterildigi gibi aykiri degerler ornek kumenin geri kalanindan farkli bir populasyona ait veri noktalarini gosterebilir Aykiri degerlerle basa cikabilen saglam oldugu soylenir medyan saglam bir merkezi egilim istatistigi iken ortalama degildir Bununla birlikte ortalama genellikle daha kesin bir tahmin edicidir Kaynakca Grubbs February 1969 Procedures for detecting outlying observations in samples Technometrics 11 1 1 21 doi 10 1080 00401706 1969 10490657 An outlying observation or outlier is one that appears to deviate markedly from other members of the sample in which it occurs Outliers Introduction to Econometrics 2nd New York MacMillan 1992 ss 89 ISBN 978 0 02 374545 4 An outlier is an observation that is far removed from the rest of the observations Grubbs 1969 stating An outlying observation may be merely an extreme manifestation of the random variability inherent in the data On the other hand an outlying observation may be the result of gross deviation from prescribed experimental procedure or an error in calculating or recording the numerical value Chandan Mukherjee Howard White Marc Wuyts 1998 Econometrics and Data Analysis for Developing Countries Vol 1