İstatistik veya sayım bilimi, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir. Belirli bir amaç için verilerin toplanması, sınıflandırılması, çözümlenmesi ve sonuçlarının yorumlanması esasına dayanır. Bu çerçevede yapılan işlemlerin tümüne sayımlama denir.
İstatistik doğa bilimlerinden sosyal bilimlere kadar geniş bir alanda uygulanabilmektedir. Aynı zamanda iş dünyası ve hükûmetle ilişkili tüm alanlarda karar almak amacıyla kullanılır. İstatistik yukarıdaki anlamıyla tekildir. Sözcüğün çoğul anlamı, "sistemli bir şekilde toplanan sayısal bilgiler"dir. Örnek olarak nüfus istatistikleri, çevre istatistikleri, spor istatistikleri, millî eğitim istatistikleri verilebilir.
İstatistiği öğrenmedeki amaç, bir araştırmada, elde edilen verilerin hangi istatistiksel yöntemler kullanılarak yorumlanacağını bilmektir.
İstatistiksel yöntemler, toplanmış verilerin özetlenmesi veya açıklanması amacıyla kullanılır. Bu tür bir yaklaşım betimsel istatistik adını alır. Buna ek olarak verilerdeki örtüşmelerin (kalıplar veya örüntüler), gözlemlerdeki rassallığı ve belirsizliği göze alacak şekilde, üzerinde çalışılan anakütle veya süreç hakkında sonuç çıkarma amacıyla modellenmesi, çıkarımsal istatistik adını alır. Hem betimsel istatistik hem de tahminsel istatistik, uygulamalı istatistiğin parçaları olarak sayılabilir. Matematiksel istatistik adı verilen disiplin ise konunun teorik matematiksel altyapısını inceleyen disiplindir.
İstatistiğin diğer bölümlerle olan ilişkilerinden doğan kavramlar şu şekilde gösterilebilir: Ekonomi+İstatistik = Ekonometri, Psikoloji+İstatistik = Psikometri, Tıp+İstatistik = Biyoistatistik, Sosyoloji+İstatistik = Sosyometri, Tarih+İstatistik=Kliometri.
İstatistiğin tarihçesi
İstatistik kelimesi Modern Latincedeki statisticum collegium (devlet konseyi) ve İtalyancadaki statista (devlet adamı, politikacı) kelimelerinden türemiştir. Kelime ilk olarak Almancada Gottfried Achenwall tarafından devlete ait verilerin sunulduğu Statistik (1749) adlı eserde devlet bilimi anlamında kullanılmıştır. Bu tanımı içeren İngilizce terim ise o dönemde political arithmetic (siyasi aritmetik) olarak geçmekteydi. İstatistik kelimesi veri toplama ve sınıflandırma anlamını ise yaklaşık olarak 19. yüzyılın başlarında kazandı. Terim İngilizceye Sir John Sinclair tarafından aktarıldı. Statistik adlı eserin temel amacı hükûmet tarafından ve yönetimsel organlar tarafından kullanılacak veriler sunmaktı. Eyaletler ve yerel bölgeler hakkında bilgi toplama işi ulusal ve uluslararası istatistik kurumları tarafından sürdürülmektedir. Daha dar anlamda nüfus hakkında düzenli bilgiler ise nüfus sayımları ile elde edilir.20. yüzyıl boyunca kamu sağlığı ile ilgili konularda (epidemiyoloji, biyoistatistik), ekonomik ve sosyal (işsizlik, ekonometri gibi) alanlarda daha titiz araçlara ihtiyaç duyulması istatistiksel uygulamalarda ilerlemeyi zorunlu kılmıştır. Bu ihtiyaç özellikle I. Dünya Savaşı sonucu gelişen, nüfusları hakkında derin bilgi sahibi olmak isteyen refah devletlerinde daha belirgin olmuştur. Bu anlamda "toplum yönetimi adına bilgi toplama isteği" filozof Michel Foucault tarafından olarak nitelendirilmiştir, bu terim daha sonra pek çok yazar tarafından da kullanılmıştır. İstatistiğin matematiksel temelleri Pierre Fermat ve Blaise Pascal'ın 1654 yılına kadar giden olasılık kuramı hakkındaki yazışmalarına dayanır. Christiaan Huygens (1657) konunun bilinen ilk bilimsel uygulamasını sunmuştur. Jakob Bernoulli'nin Ars Conjectandi (posthumous, 1713) ve Abraham de Moivre'nin Doctrine of Chances (1718) adlı eserleri konuya matematiğin bir dalı olarak yaklaşmıştır.
Hata teorisi Roger Cotes'nin Opera Miscellanea (posthumous, 1722) adlı eserine dayanır, fakat teorinin gözlem hatalarına uygulanmasının ilk örneği Thomas Simpson tarafından 1755'te yazılan (basım: 1756) bir bildiride bulunur. Bu bildirinin 1757 yılındaki tekrar basımı pozitif ve negatif hataların eşit derecede olasılıklı olduğu aksiyomunu kabul ederken, bütün hataları içinde bulunduracağını varsayabileceğimiz belirli tanımlanabilir limitlerin varlığından söz ederek "sürekli hatalar"ı ve bir olasılık eğrisini sunar.
Pierre-Simon Laplace, olasılık teorisinin ilkelerine dayanarak gözlem kombinasyonları için bir kural geliştirmeye çalıştı (1774). Hata olasılıkları kanununu bir eğri ile gösterdi.
; biyoloji, tıp ve sosyoloji'de istatistik metotlarını kullanmıştır.
; kalıtım, varyasyon, regresyon ve korelasyon konularını incelemiştir.
ve Fisher biyoistatiksel genetik ve populasyon genetiği alanında çalışmışlardır.
Kavramsal Bakış
İstatistiğin bilimsel, endüstriyel veya toplumsal bir probleme uygulanmasında önce üzerinde çalışılan süreç veya anakütle ele alınır. Bu anakütle bir ülkedeki insanların nüfusu, kayadaki kristal miktarı veya belirli bir fabrikanın belirli bir dönemde ürettiği mallar olabilir. Bunun yerine farklı zamanlarda gözlenen bir süreç de olabilir; bu şekilde toplanan veri zaman serisi adını alır.
Pratik nedenlerden ötürü, bütün bir anakütle hakkında veri toplamak yerine genelde anakütleden seçilen bir altküme (örnek veya örneklem) üzerinde çalışılır. Örnek hakkındaki veri deney veya gözlem yoluyla elde edilir. Bundan sonra veri istatistiksel analize tâbi tutulur. Bunun iki amacı vardır: açıklama (betimleme) ve sonuç çıkartma.
- Betimsel istatistik, örneklemi sayısal veya grafiksel olarak özetlemek amacıyla kullanılabilir. Sayısal göstergelere temel örnek olarak ortalama ve standart sapma gösterilebilir. Grafiksel özetler çeşitli türde grafik ve tabloları içerir.
- Çıkarımsal istatistik verideki örtüşmeleri modellemek için kullanılır, olasılığı göze alır ve daha büyük bir istatistiksel yığın hakkında sonuç çıkarır. Bu sonuçlar, evet/hayır şeklinde cevaplar olabileceği gibi (hipotez testi), sayısal özelliklerin tahmin edilmesi () gelecekteki değerlerin öngörülmesi (), veriler arasındaki doğrusal ilişkinin yorumlanması (korelasyon) veya bu ilişkilerin modellenmesi (regresyon analizi) şeklinde olur. Diğer belli başlı matematiksel modelleme teknikleri varyanslar analizi ANOVA, zaman serisi ve veri madenciliğidir.
Burada özellikle korelasyon konusu ele almaya değerdir. Bir veri kümesinin analizi iki değişkenin beraber hareket ettiğini (yani ele alınan ana kütlenin iki özelliğinin benzerlik gösterdiğini) ortaya çıkarabilir. Örneğin yıllık gelirle yaşam süresini ele alan bir çalışma fakir insanların varlıklı insanlardan daha kısa bir yaşam süresine sahip olduğunu bulabilir. Burada gelirle yaşam süresi arasında bir korelasyon olduğu söylenebilir. Fakat buradan asla gelir yaşam süresinin sebebidir veya sonucudur anlamı çıkarılmamalıdır.
Eğer örneklem, anakütleyi temsil etme yeterliliğine sahipse, örnekten elde edilen sonuçlar ve çıkarımlar bir bütün olarak anakütle hakkında bilgi verebilir. Burada asıl problem seçilen örneklemin anakütleyi temsil kabiliyetine sahip olup olmamasıdır. İstatistik, örneklemde ve veri toplama sürecinde ortaya çıkan hataları gideren, örneklemin rassal olmasını sağlayan araçlar sunar. Aynı zamanda güvenilir deneysel sonuçların elde edilmesini sağlayan yöntemler de sunar.
Bu şekilde bir rassallığın anlaşılmasını sağlayan temel matematiksel kavram olasılıktır. Matematiksel İstatistik (), İstatistiğin Matematiksel altyapısını incelemek için Olasılık kuramı ve Matematiksel Analizden faydalanan Uygulamalı Matematik dalıdır.
İstatistiksel yöntemler
Deneye ve gözleme dayalı çalışmalar
İstatistiksel araştırmaların ortak amaçlarından biri nedenselliği incelemek ve özelde tahmin edicilerdeki veya bağımsız değişkenlerdeki bir değişimin bağımlı değişken üzerindeki etkisini incelemektir. Nedenselliği ele alan temelde iki tür istatistiksel yöntem bulunur: deneysel çalışmalar ve gözleme dayalı çalışmalar. İki çalışma türünde de bağımsız değişken veya değişkenlerdeki farklılıkların gözlenen bağımlı değişken üzerindeki etkisi incelenir. Bu çalışma türlerinde oluşan fark ise yöntemin uygulanma biçimidir. Yöntemlerin ikisi de verimli sonuçlar ortaya koyabilir.
Deneysel yöntemde çalışılan sistem üzerinde bir takım ölçümler yapılır, sistem üzerinde oynamalar yapılır ve bu oynamaların sistem üzerinde etkisi olup olmadığını anlamak için tekrar ölçüm yapılır. Gözleme dayalı yöntemde ise sisteme müdahale olmaz, bunun yerine veri toplanır ve tahmin edicilerle (bağımsız değişkenler) tepki değişkenleri(bağımlı değişkenler) arasındaki örüntüler araştırılır.
Deneysel çalışmaya örnek olarak Western Elektrik Şirketi'nde aydınlatmanın çalışanlar üzerindeki etkisini araştıran verilebilir. Deneyde önce santraldeki üretim ölçülmüş, daha sonra kayan bant etrafında çalışan işçilerin aydınlatma koşulları değiştirilmiştir. Bütün deney sonuçları aydınlatmanın verimliliği arttırdığını göstermiştir. Ne var ki bu çalışmanın sonuçları deneysel yöntemdeki hatalar sebebiyle ciddi eleştiriler almıştır. Örneğin çalışmada kontrol grubu kullanılmamıştır.
Gözleme dayalı çalışmaya örnek olarak sigara kullanımı ve akciğer kanseri arasındaki bağınıtıyı inceleyen bir araştırma gösterilebilir. Bu tür çalışmada ilgi alanları hakkında bilgi toplamak için anket yöntemini kullanır ve sonra bilgiler istatistiksel analiz altında incelenir. Bu örnekte araştırmacılar sigara içen ve sigara içmeyen gruplardan bilgi toplar ve her iki gruptaki kanser vakası sayısı ele alınarak karşılaştırılır.
Bir deneyin temel adımları:
1. Araştırmanın planlanması, bilgi kaynaklarının, araştırmanın konusunun belirlenmesi, öne sürülen yöntemdeki ahlaki yönlerin ele alınması.
2. Sistemin modellenmesi, bağımlı ve bağımsız değişkenler arasındaki ilişkiye odaklanma.
3. Bir gözlem grubunu ortak yönlerini ele alacak şekilde özetlemek.
4. Gözlemlediğimiz dünya hakkında sayıların bize neler söylediğini açıklamak.
5. Çalışmanın sonuçlarını belgelemek ve sunmak.
Ölçülme ölçekleri
İstatistik verileri sayılar halinde olup bu sayılar için dört çeşit ölçülme ölçeği şeklinde elde edilme olabilirliği vardır. Bu verilerin dört çeşit ölçülme ölçeği olabileceğini ilk defa 1946'da Amerikan istatistikçi Stanley Stevens ortaya atmıştır. Stevens'in dört ölçülme ölçeği şunlardır: isimsel, sırasal, aralıksal ve oransal. Her bir değişik ölçülme ölçeğine göre elde edilen istatistiksel veriler değişik matematiksel güçte olup her biri için kullanılabilecek matematik işlemler ve betimleyici ve çıkarımsal istatistiksel işlemler ve analizler değişiktir.
(İsimsel ölçekte) verilerde sayılar sadece birbirinden karşılıklı ayrılık gösteren kategorilere verilen adlardır ve bu isim/sayı sırası ve aralığı veya orijini için hiçbir matematiksel özellik yoktur. Bu çeşit ölçekte verilere ancak çok zayıf istatistik betimleyici ölçüler ve çıkarımsal analizler uygulanabilir.
(Sırasal ölçek) verilerdeki sayılar birbirinden karşılıklı ayrantılı kategorilere isim verdiği gibi, bu kategoriler arasındaki rütbe ve sıralı düzeni de açıklarlar. Sayı değerleri arasındaki sırasal düzen değiştirilemeden her kategoriye atıf edilen gerçek sayı değiştirilebilir (yani monotonik dönüşüm uygulanabilir.) Sayılar arasında büyüklük farkı önemli olmadığı için değişik kategori sayıları üzerinde uygulanan bir basit aritmetik işlem (toplama, çıkarma, çarpma veya bölme) anlamsız sonuçlar verebilir.
(Aralıksal ölçekte) veri sayıları gerçekten sayı olup aralarındaki değişikler basit aritmetik işlem için bile anlamlıdır. Ancak aralıksal ölçekde veri değerleri için sayıların başlama orijini (yani 0 değer) keyfidir. Örneğin ısı derecesi olarak elde edilen veriler aralıksaldır. Ölçüm ölçeği santigrad olabilir; ancak değişik 0 orijin değerleri olan fahrenhayt da olabilirler.
(Oransal ölçekte) veriler hem değişik ölçümler arasında farklar anlamlıdır ve hem de bunlar için gerçek bir 0 başlangıç noktası mevcuttur. Yine ısı derecesi örneği verilirse Kelvin derecesi oransal ölçektedir; çünkü orijin (-273 °C mutlak sıfır) 0°Kelvin olur; bu bir gerçek) noktasıdır ve bu ısı derecesi altında ısı olamaz.
İsimsel veya sırasal ölçekle ölçülen değişkenler için veriler birlikte kategorik değişkenler olarak anılmakta ve aralıksal veya oransal ölçekte olan veriler kantitatif niceliksel değişkenler olarak adlandırılmaktadır.
Bilgisayar ile istatistiksel araştırma
20. yüzyılın ikinci yarısında bilgisayarların hesaplama gücü ve hızının inanılamayacak bir şekilde artması ve bilgisayar kullanımı yaygın bir hale gelmesi istatistik biliminin pratik uygulaması ve hatta teorik gelişmesi üzerine çok büyük etki yapmıştır. Pratik istatistik hesaplamanın çok zor olması dolayısıyla veri analizi devamlı olarak hesaplamanın kolaylaştırılması üzerine odaklanıp daha çok doğrusal modellere dayanmıştır. Çok yaygın kullanılan ve çok güçlü bilgisayarların kullanılmaya başlanılması ve sayısal algoritmaların geliştirilip bilgisayar yazılımları geliştirilmesi ile yeni doğrusal olmayan modeller (örneğin doğrusal olmayan regresyon, , gibi) pratikte kullanılmaya başlanmıştır.
Bilgisayar devrimi , , , gibi çok bilgisayara dayanan teknikler kullanılmaya başlamıştır. Diğer taraftan istatistik gibi temeli ileri matematiğe bağlı olmayan ve büyük bilgisayar gücüne dayanan (yapay sinir ağları veya veri madenciliği gibi) araştırma ve pratik veri inceleme yöntemleri gelişmiştir.
İstatistik biliminin geleceği 20. yüzyıl başındaki teorik gelişmelerden sonra, daha empirik ve pratik bir yaklaşım haline gelmektedir. Bu yaklaşımda genel hesaplama yazılım ve paketlere istatistik yöntemlerinin eklenmeleri (örneğin kutuzzilim programlarının istatistiksel bölümleri) ve özel şekil de hazırlanmış yaygın şekilde kullanılabilmesi büyük bir rol oynayacağı şüphesizdir.
İstatistiğin yanlış kullanılması
İstatistiğin yanlış kullanılması güç fark edilen ama çok ciddi tanımlama ve açıklama hataları ortaya çıkarabilir. Bu hatalar ciddidir çünkü ortaya yıkıcı hatalı kararlar çıkabilir. Örneğin sosyal siyaset, doktorluk ve tıp uygulamaları, köprüler gibi yapılar için yapısal güvenilirlik için veriler hep istatistiğin hatasız uygun şekilde kullanılmasına dayanır.
İstatistik doğru olarak uygulansa bile bu konu üzerinde pek az bilgi ve tecrübesi olanların istatistiksel sonuç çıkarımlarını yorumlayıp açıklaması çok zor olabilir. Veri setindeki bir trendin istatistiksel anlamlılığının (yani trendin bir örneklemde her ne kadar rastgele değişim tarafından ortaya çıkacağını açıklanabileceğinin) incelenmesi, bu anlamlılık kavramının sezgi yoluyla ortaya çıkmasıyla aynı olabildiği gibi, çok kere de değişiktir. Bu demektir ki sezgiye dayanan çıkarımlar uygun olmayan kararlara yol açabilir. Kişilerin istatistiksel cahilliğinden ayrılıp günlük yaşamlarında veriler ve enformasyon ile uygun şeklide uğraşmaları için yeterli derecede istatistiksel beceriye sahip olmaları (ve yeter derecede kuşkulu olmaları) için hiç olmazsa düşük bir seviyede istatistik eğitiminden geçmeleri ve niteliği kazanmaları gerekir.
İstatistik bilgisinin hatalı ve yanlış kullanıldığına dair epeyce geniş bir algı bulunmaktadır. Bu yetmezmiş gibi, çok kere yapılan hataların ve yanlış kullanılmanın bilinçli ve kasıtlı yapıldığı hissi doğmaktadır. Hatalı analiz sonucu alınan kararın istatistiksel sonuçları sunan kişiye yarar sağlayabilmesi imkânı olduğu bilinmektedir. Bir 19. yüzyıl İngiliz başbakanı olan Benjamin Disraeli'ye atıf edilen "Üç türlü yalan bulunmaktadır: yalanlar, lanetli yalanlar ve istatistikler." cümlesi nerede ise atasözü gibi kullanılmaktadır. Amerikan Harvard Üniversitesi Başkanı "Lawrence Lovell" 1909’da istatistik "börek gibidir ve ancak kimin tarafından yapıldığı bilinirse ve içindekilerden insan emin olabilirse o zaman tatmin edicidir" sözleri de bu kasıtlı bilinçli istatistik hatası yapma algısına biraz daha açıklama katar.
İstatiksel değerlendirme
İstatistiksel değerlendirme temelde 4 farklı metot uygulanır:[]
- Katılım grafikleri,
- Kontrol listeleri,
- Sıklık dağılımı,
- Sıklık çizelgeleri.
Kaynakça
- Büyüköztürk, Şener; Bökeoğlu, Ömay Çokluk ve Köklü, Nilgün (2009; 17.bas.:2015), Sosyal Bilimler İçin İstatistik, Ankara : Pegem Akademi Yayıncılık, s. 1-2.
- ISIS (Uluslararası İstatistik Enstitüsü), ISI Çoklu Dilli İstatistiksel Terimler Lugati (Multilingual Glossary of Statistical Terms) Türkçe [1] 29 Ağustos 2012 tarihinde Wayback Machine sitesinde .
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Istatistik veya sayim bilimi belirli bir amac icin veri toplama tablo ve grafiklerle ozetleme sonuclari yorumlama sonuclarin guven derecelerini aciklama orneklerden elde edilen sonuclari kitle icin genelleme ozellikler arasindaki iliskiyi arastirma cesitli konularda gelecege iliskin tahmin yapma deney duzenleme ve gozlem ilkelerini kapsayan bir bilimdir Belirli bir amac icin verilerin toplanmasi siniflandirilmasi cozumlenmesi ve sonuclarinin yorumlanmasi esasina dayanir Bu cercevede yapilan islemlerin tumune sayimlama denir Can egrisi gosteren istatistik vergi tahakkuku standart testinde kullanilir Istatistik doga bilimlerinden sosyal bilimlere kadar genis bir alanda uygulanabilmektedir Ayni zamanda is dunyasi ve hukumetle iliskili tum alanlarda karar almak amaciyla kullanilir Istatistik yukaridaki anlamiyla tekildir Sozcugun cogul anlami sistemli bir sekilde toplanan sayisal bilgiler dir Ornek olarak nufus istatistikleri cevre istatistikleri spor istatistikleri milli egitim istatistikleri verilebilir Istatistigi ogrenmedeki amac bir arastirmada elde edilen verilerin hangi istatistiksel yontemler kullanilarak yorumlanacagini bilmektir Istatistiksel yontemler toplanmis verilerin ozetlenmesi veya aciklanmasi amaciyla kullanilir Bu tur bir yaklasim betimsel istatistik adini alir Buna ek olarak verilerdeki ortusmelerin kaliplar veya oruntuler gozlemlerdeki rassalligi ve belirsizligi goze alacak sekilde uzerinde calisilan anakutle veya surec hakkinda sonuc cikarma amaciyla modellenmesi cikarimsal istatistik adini alir Hem betimsel istatistik hem de tahminsel istatistik uygulamali istatistigin parcalari olarak sayilabilir Matematiksel istatistik adi verilen disiplin ise konunun teorik matematiksel altyapisini inceleyen disiplindir Istatistigin diger bolumlerle olan iliskilerinden dogan kavramlar su sekilde gosterilebilir Ekonomi Istatistik Ekonometri Psikoloji Istatistik Psikometri Tip Istatistik Biyoistatistik Sosyoloji Istatistik Sosyometri Tarih Istatistik Kliometri Istatistigin tarihcesiIstatistik kelimesi Modern Latincedeki statisticum collegium devlet konseyi ve Italyancadaki statista devlet adami politikaci kelimelerinden turemistir Kelime ilk olarak Almancada Gottfried Achenwall tarafindan devlete ait verilerin sunuldugu Statistik 1749 adli eserde devlet bilimi anlaminda kullanilmistir Bu tanimi iceren Ingilizce terim ise o donemde political arithmetic siyasi aritmetik olarak gecmekteydi Istatistik kelimesi veri toplama ve siniflandirma anlamini ise yaklasik olarak 19 yuzyilin baslarinda kazandi Terim Ingilizceye Sir John Sinclair tarafindan aktarildi Statistik adli eserin temel amaci hukumet tarafindan ve yonetimsel organlar tarafindan kullanilacak veriler sunmakti Eyaletler ve yerel bolgeler hakkinda bilgi toplama isi ulusal ve uluslararasi istatistik kurumlari tarafindan surdurulmektedir Daha dar anlamda nufus hakkinda duzenli bilgiler ise nufus sayimlari ile elde edilir 20 yuzyil boyunca kamu sagligi ile ilgili konularda epidemiyoloji biyoistatistik ekonomik ve sosyal issizlik ekonometri gibi alanlarda daha titiz araclara ihtiyac duyulmasi istatistiksel uygulamalarda ilerlemeyi zorunlu kilmistir Bu ihtiyac ozellikle I Dunya Savasi sonucu gelisen nufuslari hakkinda derin bilgi sahibi olmak isteyen refah devletlerinde daha belirgin olmustur Bu anlamda toplum yonetimi adina bilgi toplama istegi filozof Michel Foucault tarafindan olarak nitelendirilmistir bu terim daha sonra pek cok yazar tarafindan da kullanilmistir Istatistigin matematiksel temelleri Pierre Fermat ve Blaise Pascal in 1654 yilina kadar giden olasilik kurami hakkindaki yazismalarina dayanir Christiaan Huygens 1657 konunun bilinen ilk bilimsel uygulamasini sunmustur Jakob Bernoulli nin Ars Conjectandi posthumous 1713 ve Abraham de Moivre nin Doctrine of Chances 1718 adli eserleri konuya matematigin bir dali olarak yaklasmistir Hata teorisi Roger Cotes nin Opera Miscellanea posthumous 1722 adli eserine dayanir fakat teorinin gozlem hatalarina uygulanmasinin ilk ornegi Thomas Simpson tarafindan 1755 te yazilan basim 1756 bir bildiride bulunur Bu bildirinin 1757 yilindaki tekrar basimi pozitif ve negatif hatalarin esit derecede olasilikli oldugu aksiyomunu kabul ederken butun hatalari icinde bulunduracagini varsayabilecegimiz belirli tanimlanabilir limitlerin varligindan soz ederek surekli hatalar i ve bir olasilik egrisini sunar Pierre Simon Laplace olasilik teorisinin ilkelerine dayanarak gozlem kombinasyonlari icin bir kural gelistirmeye calisti 1774 Hata olasiliklari kanununu bir egri ile gosterdi biyoloji tip ve sosyoloji de istatistik metotlarini kullanmistir kalitim varyasyon regresyon ve korelasyon konularini incelemistir ve Fisher biyoistatiksel genetik ve populasyon genetigi alaninda calismislardir Kavramsal BakisIstatistigin bilimsel endustriyel veya toplumsal bir probleme uygulanmasinda once uzerinde calisilan surec veya anakutle ele alinir Bu anakutle bir ulkedeki insanlarin nufusu kayadaki kristal miktari veya belirli bir fabrikanin belirli bir donemde urettigi mallar olabilir Bunun yerine farkli zamanlarda gozlenen bir surec de olabilir bu sekilde toplanan veri zaman serisi adini alir Pratik nedenlerden oturu butun bir anakutle hakkinda veri toplamak yerine genelde anakutleden secilen bir altkume ornek veya orneklem uzerinde calisilir Ornek hakkindaki veri deney veya gozlem yoluyla elde edilir Bundan sonra veri istatistiksel analize tabi tutulur Bunun iki amaci vardir aciklama betimleme ve sonuc cikartma Betimsel istatistik orneklemi sayisal veya grafiksel olarak ozetlemek amaciyla kullanilabilir Sayisal gostergelere temel ornek olarak ortalama ve standart sapma gosterilebilir Grafiksel ozetler cesitli turde grafik ve tablolari icerir Cikarimsal istatistik verideki ortusmeleri modellemek icin kullanilir olasiligi goze alir ve daha buyuk bir istatistiksel yigin hakkinda sonuc cikarir Bu sonuclar evet hayir seklinde cevaplar olabilecegi gibi hipotez testi sayisal ozelliklerin tahmin edilmesi gelecekteki degerlerin ongorulmesi veriler arasindaki dogrusal iliskinin yorumlanmasi korelasyon veya bu iliskilerin modellenmesi regresyon analizi seklinde olur Diger belli basli matematiksel modelleme teknikleri varyanslar analizi ANOVA zaman serisi ve veri madenciligidir Burada ozellikle korelasyon konusu ele almaya degerdir Bir veri kumesinin analizi iki degiskenin beraber hareket ettigini yani ele alinan ana kutlenin iki ozelliginin benzerlik gosterdigini ortaya cikarabilir Ornegin yillik gelirle yasam suresini ele alan bir calisma fakir insanlarin varlikli insanlardan daha kisa bir yasam suresine sahip oldugunu bulabilir Burada gelirle yasam suresi arasinda bir korelasyon oldugu soylenebilir Fakat buradan asla gelir yasam suresinin sebebidir veya sonucudur anlami cikarilmamalidir Eger orneklem anakutleyi temsil etme yeterliligine sahipse ornekten elde edilen sonuclar ve cikarimlar bir butun olarak anakutle hakkinda bilgi verebilir Burada asil problem secilen orneklemin anakutleyi temsil kabiliyetine sahip olup olmamasidir Istatistik orneklemde ve veri toplama surecinde ortaya cikan hatalari gideren orneklemin rassal olmasini saglayan araclar sunar Ayni zamanda guvenilir deneysel sonuclarin elde edilmesini saglayan yontemler de sunar Bu sekilde bir rassalligin anlasilmasini saglayan temel matematiksel kavram olasiliktir Matematiksel Istatistik Istatistigin Matematiksel altyapisini incelemek icin Olasilik kurami ve Matematiksel Analizden faydalanan Uygulamali Matematik dalidir Istatistiksel yontemlerDeneye ve gozleme dayali calismalar Istatistiksel arastirmalarin ortak amaclarindan biri nedenselligi incelemek ve ozelde tahmin edicilerdeki veya bagimsiz degiskenlerdeki bir degisimin bagimli degisken uzerindeki etkisini incelemektir Nedenselligi ele alan temelde iki tur istatistiksel yontem bulunur deneysel calismalar ve gozleme dayali calismalar Iki calisma turunde de bagimsiz degisken veya degiskenlerdeki farkliliklarin gozlenen bagimli degisken uzerindeki etkisi incelenir Bu calisma turlerinde olusan fark ise yontemin uygulanma bicimidir Yontemlerin ikisi de verimli sonuclar ortaya koyabilir Deneysel yontemde calisilan sistem uzerinde bir takim olcumler yapilir sistem uzerinde oynamalar yapilir ve bu oynamalarin sistem uzerinde etkisi olup olmadigini anlamak icin tekrar olcum yapilir Gozleme dayali yontemde ise sisteme mudahale olmaz bunun yerine veri toplanir ve tahmin edicilerle bagimsiz degiskenler tepki degiskenleri bagimli degiskenler arasindaki oruntuler arastirilir Deneysel calismaya ornek olarak Western Elektrik Sirketi nde aydinlatmanin calisanlar uzerindeki etkisini arastiran verilebilir Deneyde once santraldeki uretim olculmus daha sonra kayan bant etrafinda calisan iscilerin aydinlatma kosullari degistirilmistir Butun deney sonuclari aydinlatmanin verimliligi arttirdigini gostermistir Ne var ki bu calismanin sonuclari deneysel yontemdeki hatalar sebebiyle ciddi elestiriler almistir Ornegin calismada kontrol grubu kullanilmamistir Gozleme dayali calismaya ornek olarak sigara kullanimi ve akciger kanseri arasindaki baginitiyi inceleyen bir arastirma gosterilebilir Bu tur calismada ilgi alanlari hakkinda bilgi toplamak icin anket yontemini kullanir ve sonra bilgiler istatistiksel analiz altinda incelenir Bu ornekte arastirmacilar sigara icen ve sigara icmeyen gruplardan bilgi toplar ve her iki gruptaki kanser vakasi sayisi ele alinarak karsilastirilir Bir deneyin temel adimlari 1 Arastirmanin planlanmasi bilgi kaynaklarinin arastirmanin konusunun belirlenmesi one surulen yontemdeki ahlaki yonlerin ele alinmasi 2 Sistemin modellenmesi bagimli ve bagimsiz degiskenler arasindaki iliskiye odaklanma 3 Bir gozlem grubunu ortak yonlerini ele alacak sekilde ozetlemek 4 Gozlemledigimiz dunya hakkinda sayilarin bize neler soyledigini aciklamak 5 Calismanin sonuclarini belgelemek ve sunmak Olculme olcekleri Bakin Stanley Stevens Scales of measurement 1946 isimsel sirasal araliksal oransal Istatistik verileri sayilar halinde olup bu sayilar icin dort cesit olculme olcegi seklinde elde edilme olabilirligi vardir Bu verilerin dort cesit olculme olcegi olabilecegini ilk defa 1946 da Amerikan istatistikci Stanley Stevens ortaya atmistir Stevens in dort olculme olcegi sunlardir isimsel sirasal araliksal ve oransal Her bir degisik olculme olcegine gore elde edilen istatistiksel veriler degisik matematiksel gucte olup her biri icin kullanilabilecek matematik islemler ve betimleyici ve cikarimsal istatistiksel islemler ve analizler degisiktir Isimsel olcekte verilerde sayilar sadece birbirinden karsilikli ayrilik gosteren kategorilere verilen adlardir ve bu isim sayi sirasi ve araligi veya orijini icin hicbir matematiksel ozellik yoktur Bu cesit olcekte verilere ancak cok zayif istatistik betimleyici olculer ve cikarimsal analizler uygulanabilir Sirasal olcek verilerdeki sayilar birbirinden karsilikli ayrantili kategorilere isim verdigi gibi bu kategoriler arasindaki rutbe ve sirali duzeni de aciklarlar Sayi degerleri arasindaki sirasal duzen degistirilemeden her kategoriye atif edilen gercek sayi degistirilebilir yani monotonik donusum uygulanabilir Sayilar arasinda buyukluk farki onemli olmadigi icin degisik kategori sayilari uzerinde uygulanan bir basit aritmetik islem toplama cikarma carpma veya bolme anlamsiz sonuclar verebilir Araliksal olcekte veri sayilari gercekten sayi olup aralarindaki degisikler basit aritmetik islem icin bile anlamlidir Ancak araliksal olcekde veri degerleri icin sayilarin baslama orijini yani 0 deger keyfidir Ornegin isi derecesi olarak elde edilen veriler araliksaldir Olcum olcegi santigrad olabilir ancak degisik 0 orijin degerleri olan fahrenhayt da olabilirler Oransal olcekte veriler hem degisik olcumler arasinda farklar anlamlidir ve hem de bunlar icin gercek bir 0 baslangic noktasi mevcuttur Yine isi derecesi ornegi verilirse Kelvin derecesi oransal olcektedir cunku orijin 273 C mutlak sifir 0 Kelvin olur bu bir gercek noktasidir ve bu isi derecesi altinda isi olamaz Isimsel veya sirasal olcekle olculen degiskenler icin veriler birlikte kategorik degiskenler olarak anilmakta ve araliksal veya oransal olcekte olan veriler kantitatif niceliksel degiskenler olarak adlandirilmaktadir Bilgisayar ile istatistiksel arastirma gretl adli bir ucretsiz bilgisayar istatistik yazilim paketi 20 yuzyilin ikinci yarisinda bilgisayarlarin hesaplama gucu ve hizinin inanilamayacak bir sekilde artmasi ve bilgisayar kullanimi yaygin bir hale gelmesi istatistik biliminin pratik uygulamasi ve hatta teorik gelismesi uzerine cok buyuk etki yapmistir Pratik istatistik hesaplamanin cok zor olmasi dolayisiyla veri analizi devamli olarak hesaplamanin kolaylastirilmasi uzerine odaklanip daha cok dogrusal modellere dayanmistir Cok yaygin kullanilan ve cok guclu bilgisayarlarin kullanilmaya baslanilmasi ve sayisal algoritmalarin gelistirilip bilgisayar yazilimlari gelistirilmesi ile yeni dogrusal olmayan modeller ornegin dogrusal olmayan regresyon gibi pratikte kullanilmaya baslanmistir Bilgisayar devrimi gibi cok bilgisayara dayanan teknikler kullanilmaya baslamistir Diger taraftan istatistik gibi temeli ileri matematige bagli olmayan ve buyuk bilgisayar gucune dayanan yapay sinir aglari veya veri madenciligi gibi arastirma ve pratik veri inceleme yontemleri gelismistir Istatistik biliminin gelecegi 20 yuzyil basindaki teorik gelismelerden sonra daha empirik ve pratik bir yaklasim haline gelmektedir Bu yaklasimda genel hesaplama yazilim ve paketlere istatistik yontemlerinin eklenmeleri ornegin kutuzzilim programlarinin istatistiksel bolumleri ve ozel sekil de hazirlanmis yaygin sekilde kullanilabilmesi buyuk bir rol oynayacagi suphesizdir Istatistigin yanlis kullanilmasi Istatistigin yanlis kullanilmasi guc fark edilen ama cok ciddi tanimlama ve aciklama hatalari ortaya cikarabilir Bu hatalar ciddidir cunku ortaya yikici hatali kararlar cikabilir Ornegin sosyal siyaset doktorluk ve tip uygulamalari kopruler gibi yapilar icin yapisal guvenilirlik icin veriler hep istatistigin hatasiz uygun sekilde kullanilmasina dayanir Istatistik dogru olarak uygulansa bile bu konu uzerinde pek az bilgi ve tecrubesi olanlarin istatistiksel sonuc cikarimlarini yorumlayip aciklamasi cok zor olabilir Veri setindeki bir trendin istatistiksel anlamliliginin yani trendin bir orneklemde her ne kadar rastgele degisim tarafindan ortaya cikacagini aciklanabileceginin incelenmesi bu anlamlilik kavraminin sezgi yoluyla ortaya cikmasiyla ayni olabildigi gibi cok kere de degisiktir Bu demektir ki sezgiye dayanan cikarimlar uygun olmayan kararlara yol acabilir Kisilerin istatistiksel cahilliginden ayrilip gunluk yasamlarinda veriler ve enformasyon ile uygun seklide ugrasmalari icin yeterli derecede istatistiksel beceriye sahip olmalari ve yeter derecede kuskulu olmalari icin hic olmazsa dusuk bir seviyede istatistik egitiminden gecmeleri ve niteligi kazanmalari gerekir Istatistik bilgisinin hatali ve yanlis kullanildigina dair epeyce genis bir algi bulunmaktadir Bu yetmezmis gibi cok kere yapilan hatalarin ve yanlis kullanilmanin bilincli ve kasitli yapildigi hissi dogmaktadir Hatali analiz sonucu alinan kararin istatistiksel sonuclari sunan kisiye yarar saglayabilmesi imkani oldugu bilinmektedir Bir 19 yuzyil Ingiliz basbakani olan Benjamin Disraeli ye atif edilen Uc turlu yalan bulunmaktadir yalanlar lanetli yalanlar ve istatistikler cumlesi nerede ise atasozu gibi kullanilmaktadir Amerikan Harvard Universitesi Baskani Lawrence Lovell 1909 da istatistik borek gibidir ve ancak kimin tarafindan yapildigi bilinirse ve icindekilerden insan emin olabilirse o zaman tatmin edicidir sozleri de bu kasitli bilincli istatistik hatasi yapma algisina biraz daha aciklama katar Istatiksel degerlendirmeIstatistiksel degerlendirme temelde 4 farkli metot uygulanir kaynak belirtilmeli Katilim grafikleri Kontrol listeleri Siklik dagilimi Siklik cizelgeleri KaynakcaBuyukozturk Sener Bokeoglu Omay Cokluk ve Koklu Nilgun 2009 17 bas 2015 Sosyal Bilimler Icin Istatistik Ankara Pegem Akademi Yayincilik ISBN 9789756802335 s 1 2 ISIS Uluslararasi Istatistik Enstitusu ISI Coklu Dilli Istatistiksel Terimler Lugati Multilingual Glossary of Statistical Terms Turkce 1 29 Agustos 2012 tarihinde Wayback Machine sitesinde a b 29 Aralik 2018 tarihinde kaynagindan arsivlendi a b c d Tekin Mehmet Emin Mart 2019 Veterinerlik Biyoistatistik Genisletilmis 2 bas Konya Selcuk Universitesi Yayinevi s 2 ISBN 978 975 448 231 7