Naïve Bayes sınıflandırıcı, örüntü tanıma problemine ilk bakışta oldukça kısıtlayıcı görülen bir önerme ile kullanılabilen olasılıksal bir yaklaşımdır. Bu önerme, örüntü tanımada kullanılacak her bir tanımlayıcı öznitelik ya da parametrenin istatistik açıdan bağımsız olması gerekliliğidir. Her ne kadar bu önerme Naive Bayes sınıflandırıcının kullanım alanını kısıtlasa da istatistik bağımsızlık koşulu esnetilerek kullanıldığında da daha karmaşık yapay sinir ağları gibi metotlarla karşılaştırabilir sonuçlar vermektedir. Bir Naive Bayes sınıflandırıcı, her özniteliğin birbirinden koşulsal bağımsız olduğu ve öğrenilmek istenen kavramın tüm bu özniteliklere koşulsal bağlı olduğu bir Bayes ağı olarak da düşünülebilir.
Naïve Bayes sınıflandırıcısı adını İngiliz matematikçi Thomas Bayes'ten (yak. 1701 - 7 Nisan 1761) almaktadır.
Bayes teoremi
Naive Bayes sınıflandırıcısı Bayes teoreminin bağımsızlık önermesiyle basitleştirilmiş halidir. Bayes teoremi aşağıdaki denklemle ifade edilir;
- P(A|B) ; B olayı gerçekleştiği durumda A olayının meydana gelme olasılığıdır (bakınız koşullu olasılık)
- P(B|A) ; A olayı gerçekleştiği durumda B olayının meydana gelme olasılığıdır
- P(A) ve P(B) ; A ve B olaylarının önsel olasılıklarıdır.
Burada önsel olasılık Bayes teoreminine öznellik katar. Diğer bir ifadeyle örneğin P(A) henüz elde veri toplanmadan A olayı hakkında sahip olunan bilgidir. Diğer taraftan P(B|A) çünkü veri toplandıktan sonra, A olayının gerçekleşmiş olduğu durumlarda B olayının gerçekleşme ihtimali hakkında bilgi verir.
Sınıflandırma problemi
Naive Bayes Sınıflandırması Makine öğreniminde alt sınıfındadır. Daha açık bir ifadeyle sınıflandırılması gereken sınıflar(kümeler) ve örnek verilerin hangi sınıflara ait olduğu bellidir. E-posta kutusuna gelen e-postaların spam olarak ayrıştırılması işlemi buna örnek verilebilir. Bu örnekte spam e-posta ve spam olmayan e-posta ayrıştırılacak iki sınıfı temsil eder. Elimizdeki spam ve spam olmayan e-postalardan yaralanarak gelecekte elimize ulaşacak e-postaların spam olup olmadığına karar verecek bir Algoritma da öğreticili makine öğrenmesine örnektir.
Sınıflandırma işleminde genel olarak elde bir örüntü (pattern) vardır. Buradaki işlem de bu örüntüyü daha önceden tanımlanmış sınıflara sınıflandırmaktır. Her örüntü nicelik (feature ya da parametre) kümesi tarafından temsil edilir.
Nicelik kümesi
Yine yukarıda bahsedilen spam e-posta örneğinden devam edilecek olunursa; Posta kutumuzda bulunan spam e-postaları spam olmayan e-postalardan ayıran parametrelerden oluşan bir küme, mesela ikramiye,ödül gibi sözcüklerden oluşan, nicelik kümesine örnektir. Matematiksel bir ifadeyle nicelik kümesi;
- ,
ise
- ∈ RL L-boyutlu nicelik vektörünü oluşturur.
x ∈ RL verildiğine göre ve S ayrıştırılacak sınıflar kümesiyse, Bayes teoremine göre aşagıdaki ifade yazılır.
ve
- P(Si); Si'nin öncel olasılığı i = 1, 2, . . ., L,
- P(Si|x); Si'nin ardıl olasılığı
- p(x); x in Olasılık yoğunluk fonksiyonu (oyf)
- p(x|Si); i =1 = 2, . . ., L, x'in koşullu oyf'si
Bayes karar teoremi
Elimizde sınıfı belli olmayan bir örüntü olsun. Bu durumda
- ∈ RL
sınıfı belli olmayan örüntünün L-boyutlu nicelik vektörüdür. Spam e-posta örneğinden gidecek olursak spam olup olmadığını bilmediğimiz yeni bir e-posta sınıfı belli olmayan örüntüdür.
Yine Si x'in atanacağı sınıf ise;
Bayes karar teorisine göre x sınıf Si'ya aittir eğer
- , ∀j
diğer bir ifadeyle eğer
- , ∀j
Naive Bayes sınıflandırması
Verilen bir x'in (x = [x(1), x(2), . . ., x(L)]T ∈ RL) sınıf Si'ye ait olup olmadığına karar vermek için kullanılan yukarıda formüle edilen Bayes karar teoreminde istatistik olarak bağımsızlık önermesinden yararlanılırsa bu tip sınıflandırmaya Naive bayes sınıflandırılması denir. Matematiksel bir ifadeyle
- , ∀j
ifadesindeki - terimi yeniden aşağıdaki gibi yazılır
- , ∀j
böylece Bayes karar teoremi aşagıdaki şekli alır. Bayes karar teorisine göre x sınıf Si'ya aittir eğer
ve ) i ve j sınıflarının öncel olasılıklarıdır. Elde olan veri kümesinden değerleri kolayca hesaplanabilir.
Naive bayes sınıflandırıcının kullanım alanı her ne kadar kısıtlı gözükse de yüksek boyutlu uzayda ve yeterli sayıda veriyle x'in (nicelik kümesi) bileşenlerinin istatistik olarak bağımsız olması koşulu esnetilerek başarılı sonuçlar elde edilebilinir.
Uygulama alanları
Naive Bayes sınıflandırıcısı genel olarak veri madenciliğinde, biyomedikal mühendisliği alanında, hastalıkların ya da anormalliklerin (otomatik olarak mühendislik ürünü tıbbi cihazlar tarafından tanı konulması),elektrokardiyografi (EKG) grafiğinin sınıflandırılmasında,elektroensefalografi (EEG) grafiklerinin ayrıştırılmasında,genetik araştırmalarında,yığın mesaj tanımlanmasında, metin ayrıştırılmasında, ürün sınıflandırma ve diğer bazı alanlarda kullanılır.
Ayrıca bakınız
Kaynakça
- Theodoridis, Sergios and Koutroumbas, Konstantinos. Patern Recognition. San Diego : Academic Press, 2006.
- Rouveirol, edited by Claire Nellec, Cine. Machine Learning: ECML-98 10th European Conference on Machine Learning Chemnitz, Germany, April 2123, 1998 Proceedings. Berlin: Springer-Verlag. .
- Tom M. Mitchell. Machine Learning. McGraw-Hill, 1997
Notlar
- ^ Pawlak, Zdzisław. (PDF) (İngilizce). 2 Nisan 2016 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 3 Kasım 2012.
- ^ "Bayes Sınıflandırıcısı" (PDF). 11 Mart 2016 tarihinde kaynağından (PDF). Erişim tarihi: 3 Kasım 2012.
- ^ Lakoumentas, John (1 Ekim 2012). "Optimizations of the naïve-Bayes classifier for the prognosis of B-Chronic Lymphocytic Leukemia incorporating flow cytometry data". Computer Methods and Programs in Biomedicine. 108 (1). ss. 158-167. doi:10.1016/j.cmpb.2012.02.009.
- ^ Wiggins, M. (31 Aralık 2007). "Evolving a Bayesian classifier for ECG-based age classification in medical applications". Applied Soft Computing. 8 (1). ss. 599-608. doi:10.1016/j.asoc.2007.03.009.
- ^ Wang, Z (2011). "An EEG workload classifier for multiple subjects". Conference proceedings : ... Annual International Conference of the IEEE Engineering in Medicine and Biology Society. IEEE Engineering in Medicine and Biology Society. Conference. Cilt 2011. ss. 6534-7. (PMID) 22255836.
- ^ Malovini, Alberto (1 Ocak 2012). "Hierarchical Naive Bayes for genetic association studies". BMC Bioinformatics. 13 (Suppl 14). ss. S6. doi:10.1186/1471-2105-13-S14-S6.
- ^ Almeida, Tiago A. (1 Aralık 2010). "Spam filtering: how the dimensionality reduction affects the accuracy of Naive Bayes classifiers". Journal of Internet Services and Applications. 1 (3). ss. 183-200. doi:10.1007/s13174-010-0014-7.
- ^ Sebastiani, edited by Fabrizio (2003). Advances in Information Retrieval 25th European Conference on IR Research, ECIR 2003, Pisa, Italy, April 14-16, 2003. Proceedings. Berlin, Heidelberg: Springer-Verlag Berlin Heidelberg. ss. 335-350. ISBN .
- ^ "Naive Bayes ile ürün sınıflandırma örneği". 1 Eylül 2018 tarihinde kaynağından . Erişim tarihi: 2 Ekim 2020.
Dış bağlantılar
- Naive Bayes (matlab)23 Ekim 2012 tarihinde Wayback Machine sitesinde .
- Naive Bayes ile ürün sınıflandırma örneği (C++)1 Eylül 2018 tarihinde Wayback Machine sitesinde .
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Naive Bayes siniflandirici oruntu tanima problemine ilk bakista oldukca kisitlayici gorulen bir onerme ile kullanilabilen olasiliksal bir yaklasimdir Bu onerme oruntu tanimada kullanilacak her bir tanimlayici oznitelik ya da parametrenin istatistik acidan bagimsiz olmasi gerekliligidir Her ne kadar bu onerme Naive Bayes siniflandiricinin kullanim alanini kisitlasa da istatistik bagimsizlik kosulu esnetilerek kullanildiginda da daha karmasik yapay sinir aglari gibi metotlarla karsilastirabilir sonuclar vermektedir Bir Naive Bayes siniflandirici her ozniteligin birbirinden kosulsal bagimsiz oldugu ve ogrenilmek istenen kavramin tum bu ozniteliklere kosulsal bagli oldugu bir Bayes agi olarak da dusunulebilir Bayes teoremi Naive Bayes siniflandiricisi adini Ingiliz matematikci Thomas Bayes ten yak 1701 7 Nisan 1761 almaktadir Bayes teoremiNaive Bayes siniflandiricisi Bayes teoreminin bagimsizlik onermesiyle basitlestirilmis halidir Bayes teoremi asagidaki denklemle ifade edilir P A B P B A P A P B displaystyle P A B frac P B A P A P B P A B B olayi gerceklestigi durumda A olayinin meydana gelme olasiligidir bakiniz kosullu olasilik P B A A olayi gerceklestigi durumda B olayinin meydana gelme olasiligidir P A ve P B A ve B olaylarinin onsel olasiliklaridir Burada onsel olasilik Bayes teoreminine oznellik katar Diger bir ifadeyle ornegin P A henuz elde veri toplanmadan A olayi hakkinda sahip olunan bilgidir Diger taraftan P B A cunku veri toplandiktan sonra A olayinin gerceklesmis oldugu durumlarda B olayinin gerceklesme ihtimali hakkinda bilgi verir Siniflandirma problemiNaive Bayes Siniflandirmasi Makine ogreniminde alt sinifindadir Daha acik bir ifadeyle siniflandirilmasi gereken siniflar kumeler ve ornek verilerin hangi siniflara ait oldugu bellidir E posta kutusuna gelen e postalarin spam olarak ayristirilmasi islemi buna ornek verilebilir Bu ornekte spam e posta ve spam olmayan e posta ayristirilacak iki sinifi temsil eder Elimizdeki spam ve spam olmayan e postalardan yaralanarak gelecekte elimize ulasacak e postalarin spam olup olmadigina karar verecek bir Algoritma da ogreticili makine ogrenmesine ornektir Siniflandirma isleminde genel olarak elde bir oruntu pattern vardir Buradaki islem de bu oruntuyu daha onceden tanimlanmis siniflara siniflandirmaktir Her oruntu nicelik feature ya da parametre kumesi tarafindan temsil edilir Nicelik kumesi Yine yukarida bahsedilen spam e posta orneginden devam edilecek olunursa Posta kutumuzda bulunan spam e postalari spam olmayan e postalardan ayiran parametrelerden olusan bir kume mesela ikramiye odul gibi sozcuklerden olusan nicelik kumesine ornektir Matematiksel bir ifadeyle nicelik kumesi x i i 1 2 L displaystyle x i i 1 2 L isex x 1 x 2 x L T displaystyle x x 1 x 2 x L T RL L boyutlu nicelik vektorunu olusturur x RL verildigine gore ve S ayristirilacak siniflar kumesiyse Bayes teoremine gore asagidaki ifade yazilir P Si x p x p x Si P Si displaystyle P S i x times p x p x S i times P S i ve p x i 1Lp x Si P Si displaystyle p x sum i 1 L p x S i P S i P Si Si nin oncel olasiligi i 1 2 L P Si x Si nin ardil olasiligi p x x in Olasilik yogunluk fonksiyonu oyf p x Si i 1 2 L x in kosullu oyf siBayes karar teoremiElimizde sinifi belli olmayan bir oruntu olsun Bu durumda x x 1 x 2 x L T displaystyle x x 1 x 2 x L T RL sinifi belli olmayan oruntunun L boyutlu nicelik vektorudur Spam e posta orneginden gidecek olursak spam olup olmadigini bilmedigimiz yeni bir e posta sinifi belli olmayan oruntudur Yine Si x in atanacagi sinif ise Bayes karar teorisine gore x sinif Si ya aittir eger P Si x gt P Sj x displaystyle P S i x gt P S j x j i displaystyle neq i diger bir ifadeyle eger P x Si P Si gt P x Sj P Sj displaystyle P x S i P S i gt P x S j P S j j i displaystyle neq i Naive Bayes siniflandirmasiVerilen bir x in x x 1 x 2 x L T RL sinif Si ye ait olup olmadigina karar vermek icin kullanilan yukarida formule edilen Bayes karar teoreminde istatistik olarak bagimsizlik onermesinden yararlanilirsa bu tip siniflandirmaya Naive bayes siniflandirilmasi denir Matematiksel bir ifadeyle P x Si P Si gt P x Sj P Sj displaystyle P x S i P S i gt P x S j P S j j i displaystyle neq i ifadesindeki P x Si displaystyle P x S i terimi yeniden asagidaki gibi yazilir P x Si k 1LP xk Si displaystyle P x S i approx prod k 1 L P x k S i dd boylece Bayes karar teoremi asagidaki sekli alir Bayes karar teorisine gore x sinif Si ya aittir eger P Si k 1LP xk Si gt P Sj k 1LP xk Sj displaystyle P S i prod k 1 L P x k S i gt P S j prod k 1 L P x k S j P Si displaystyle P S i ve P Sj displaystyle P S j i ve j siniflarinin oncel olasiliklaridir Elde olan veri kumesinden degerleri kolayca hesaplanabilir Naive bayes siniflandiricinin kullanim alani her ne kadar kisitli gozukse de yuksek boyutlu uzayda ve yeterli sayida veriyle x in nicelik kumesi bilesenlerinin istatistik olarak bagimsiz olmasi kosulu esnetilerek basarili sonuclar elde edilebilinir Uygulama alanlariNaive Bayes siniflandiricisi genel olarak veri madenciliginde biyomedikal muhendisligi alaninda hastaliklarin ya da anormalliklerin otomatik olarak muhendislik urunu tibbi cihazlar tarafindan tani konulmasi elektrokardiyografi EKG grafiginin siniflandirilmasinda elektroensefalografi EEG grafiklerinin ayristirilmasinda genetik arastirmalarinda yigin mesaj tanimlanmasinda metin ayristirilmasinda urun siniflandirma ve diger bazi alanlarda kullanilir Ayrica bakinizThomas Bayes Bayes teoremi Bayes agi Bayesci olasilik Bayesci istatistik Yapay zeka Oruntu tanima Makine ogrenimiKaynakcaTheodoridis Sergios and Koutroumbas Konstantinos Patern Recognition San Diego Academic Press 2006 Rouveirol edited by Claire Nellec Cine Machine Learning ECML 98 10th European Conference on Machine Learning Chemnitz Germany April 2123 1998 Proceedings Berlin Springer Verlag ISBN 978 3 540 69781 7 Tom M Mitchell Machine Learning McGraw Hill 1997Notlar Pawlak Zdzislaw PDF Ingilizce 2 Nisan 2016 tarihinde kaynagindan PDF arsivlendi Erisim tarihi 3 Kasim 2012 Bayes Siniflandiricisi PDF 11 Mart 2016 tarihinde kaynagindan PDF Erisim tarihi 3 Kasim 2012 Lakoumentas John 1 Ekim 2012 Optimizations of the naive Bayes classifier for the prognosis of B Chronic Lymphocytic Leukemia incorporating flow cytometry data Computer Methods and Programs in Biomedicine 108 1 ss 158 167 doi 10 1016 j cmpb 2012 02 009 Wiggins M 31 Aralik 2007 Evolving a Bayesian classifier for ECG based age classification in medical applications Applied Soft Computing 8 1 ss 599 608 doi 10 1016 j asoc 2007 03 009 Wang Z 2011 An EEG workload classifier for multiple subjects Conference proceedings Annual International Conference of the IEEE Engineering in Medicine and Biology Society IEEE Engineering in Medicine and Biology Society Conference Cilt 2011 ss 6534 7 PMID 22255836 Malovini Alberto 1 Ocak 2012 Hierarchical Naive Bayes for genetic association studies BMC Bioinformatics 13 Suppl 14 ss S6 doi 10 1186 1471 2105 13 S14 S6 Almeida Tiago A 1 Aralik 2010 Spam filtering how the dimensionality reduction affects the accuracy of Naive Bayes classifiers Journal of Internet Services and Applications 1 3 ss 183 200 doi 10 1007 s13174 010 0014 7 Sebastiani edited by Fabrizio 2003 Advances in Information Retrieval 25th European Conference on IR Research ECIR 2003 Pisa Italy April 14 16 2003 Proceedings Berlin Heidelberg Springer Verlag Berlin Heidelberg ss 335 350 ISBN 978 3 540 36618 8 KB1 bakim Fazladan yazi yazar listesi link Naive Bayes ile urun siniflandirma ornegi 1 Eylul 2018 tarihinde kaynagindan Erisim tarihi 2 Ekim 2020 Dis baglantilarNaive Bayes matlab 23 Ekim 2012 tarihinde Wayback Machine sitesinde Naive Bayes ile urun siniflandirma ornegi C 1 Eylul 2018 tarihinde Wayback Machine sitesinde