Weka, makine öğrenimi amacıyla Waikato Üniversitesinde geliştirilmiş ve "Waikato Environment for Knowledge Analysis" kelimelerinin baş harflerinden oluşmuş yazılımın ismidir. Günümüzde yaygın kullanımı olan çoğu makine öğrenimi algoritmalarını ve metotlarını içermektedir.
Yeni Zelanda'da yaşayan bir kuş türü olan wekayı betimleyen belirtke | |
Geliştirici(ler) | |
---|---|
Güncel sürüm | 3.6.12 (son sürümü), 3.7.12 (geliştirme sürümü) / 15 Aralık 2014 |
Programlama dili | Java (programlama dili) |
İşletim sistemi | çapraz platform |
Tür | makine öğrenimi |
Lisans | GNU Genel Kamu Lisansı |
Resmî sitesi | http://www.cs.waikato.ac.nz/~ml/weka/ |
Kod deposu |
|
Java dilinde geliştirilmiş olması ve kütüphanelerinin .jar dosyaları halinde geliyor olması sayesinde, Java dilinde yazılan projelere kolayce entegre edilebilmesi kullanımını daha da yaygınlaştırmıştır.
Yazılım, GNU Genel Kamu Lisansı ile dağıtılmaktadır.
Genel Bilgiler
Weka, tamamen modüler bir tasarıma sahip olup, içerdiği özelliklerle veri kümeleri üzerinde görselleştirme, veri analizi, iş zekası uygulamaları, veri madenciliği gibi işlemler yapabilmektedir.
Weka yazılımı, kendisine özgü olarak bir .arff uzantısı desteği ile gelmektedir. Ancak Weka yazılımının içerisinde CSV dosyalarını da ARFF formatına çevirmeye yarayan araçlar mevcuttur.
Temel olarak aşağıdaki 3 Veri Madenciliği işlemi Weka ile yapılabilir:
- Sınıflandırma (Classification)
- Bölütleme (Clustering)
- İlişkilendirme (Association)
Ayrıca yukarıdaki işlemlere ilave olarak, veri kümeleri üzerinde ön ve son işlemler yapılabilir
- Veri Ön işleme (Data Pre-Processing)
- Görselleştirme (Visualization)
Son olarak Weka Kütüphanesi'nde veri kümelerini içeren dosyalar üzerinde çalışan çok sayıda hazır fonksiyon bulunmaktadır.
Kullanım Popülerliği
Weka, iş zekası alanında en çok kullanılan 10 yazılımdan birisi olup, yine iş zekası konusunda en çok kullanılan özgür yazılımlar sıralamasında ilk 3 sırada yer almaktadır.
Weka, 200'e yakın IEEE makalesinde doğrudan geçmekte olup 5,700 civarında ACM makalesinde de ismi doğrudan geçmektedir.
Weka, 2011 Ağustos ayı itibarıyla sadece sourceforge.net sitesinden, 2.5 milyona yakın indirme sayısı ile en çok indirilen ilk 200 Sourceforge Projesi arasında girmiştir.
ARFF Dosya Yapısı
İngilizce, Attribute Relationship File Format kelimelerinin baş harflerinden oluşmuştur. ARFF dosya yapısı, Weka'ya özel olarak geliştirilmiştir ve dosya, metin yapısında tutulmaktadır. Dosyanın ilk satırında, dosyadaki ilişki tipi (relation) tutulmakta olup ikinci satırdan itibaren veri kümesindeki özellikler (attributes) yazılmaktadır. Özelliklerin hemen ardından veri kümesi yer alır ve veri kümesindeki her satır bir örneğe (instance) işaret etmektedir. Ayrıca veri kümesindeki her örneğin her özelliği arasında da virgül ayıracı kullanılmaktadır.
@relation havatahmini @attribute nem numeric @attribute sıcaklık numeric @attribute basınç numeric @attribute tahmin numeric @data 53,25,1013,1 41,22,1011,-1 54,18,1012,-1 67,23,1000,1
Yukarıdaki örnek dosyada, hava tahmini için kullanılan nem, sıcaklık ve basınç değerleri bir dosya içerisinde 4 örnek içerecek şekilde gösterilmiştir. Bu değerler tip olarak sayısal değerler olduğundan "numeric" olarak ifade edilmiştir. Ancak bu değerler aşağıdaki tiplerde olabilir:
- NOMINAL: [Küme Değerleri] Tahmin değeridir ve bir tanım kümesi alır. Örneğin tahmin {güneşli,yağmurlu,sisli} şeklinde tanımlanan bir kümede, bu özellik kümedeki tanımlı değerlerden birisini alabilir.
- REAL: [Reel Sayılar] kümesinden bir değer verileceğinde kullanılır. Örneğin sıcaklık değeri 22.8 şeklinde ondalıklı değerleri de ifade edecek şekilde verilmek istenirse tip olarak numeric yerine reel kullanabiliriz.
- STRING: Veri kümesinin bu özelliğinin serbest yazı şeklinde olabileceğini ifade eder. Özellikle metin madenciliği çalışmaları için sıkça kullanılan bir tiptir.
- DATE: Veri kümesinin bu özelliğinin tarih olduğunu ifade eder. Örneğin veri kümesindeki kişilerin doğum tarihi veya örneklerin toplanma tarihi gibi özelliklerin tutulmasında kullanılabilir.
Tarihi
- 1993 yılında, tarafından ilk Weka paketi, TCL/TK, C ve Makefiles'dan oluşan bir şekilde dünyaya duyuruldu.
- 1997 yılında, JAVA'nın da gelişmesi ile, bütün Weka paketinin yeni baştan Java dilinde yazılması kabul edildi ve proje Java'ya taşındı.
- 2005 yılında, Weka, dünyanın en prestijli veri madenciliği ödüllerinden olan "Data Mining and Knowledge Discovery Service Award", ödülüne layık görüldü.
- 2006 yılında, Pentaho Corporation firması tarafından iş zekası uygulamalarında kullanılmak üzere Weka'nın lisansı satın alındı. Bu tarihten sonra Weka "Pentaho business intelligence suite" isimli paketin içinde de yer almaya başladı.
- 2011 yılı itibarıyla 2.487.213 indirme ile en popüler 200 Sourceforge projesinden birisi olmuştur. Tüm Zaman İndirmeleri 9 Eylül 2010 tarihinde Wayback Machine sitesinde .
Kaynakça
- ^ Şadi Evren Şeker (2013). İş Zekası ve Veri Madenciliği (Weka ile) . Cinius.
- ^ "Analytics Training Sitesi, 2011 yılı En popüler 10 iş zekası yazılımı". 3 Temmuz 2013 tarihinde kaynağından . Erişim tarihi: 6 Temmuz 2013.
- ^ "IEEE Xplore Weka arama sonuçları". 9 Ağustos 2020 tarihinde kaynağından . Erişim tarihi: 6 Temmuz 2013.
- ^ "ACM Dijital Kütüphanesi arama sonuçları". 9 Ağustos 2020 tarihinde kaynağından . Erişim tarihi: 6 Temmuz 2013.
- ^ Ian H. Witten (1999). "Weka: Practical Machine Learning Tools and Techniques with Java Implementations" (PDF). Proceedings of the ICONIP/ANZIIS/ANNES'99 Workshop on Emerging Knowledge Engineering and Connectionist-Based Information Systems. ss. 192-196. 28 Eylül 2007 tarihinde kaynağından (PDF). Erişim tarihi: 26 Haziran 2007.
- ^ Gregory Piatetsky-Shapiro (28 Haziran 2005). "KDnuggets news on SIGKDD Service Award 2005". 14 Temmuz 2007 tarihinde kaynağından . Erişim tarihi: 25 Haziran 2007.
- ^ . 2005. 1 Temmuz 2007 tarihinde kaynağından arşivlendi. Erişim tarihi: 25 Haziran 2007.
Dış bağlantılar
- Weka'nın Ekran görüntülerine genel bir bakış 13 Temmuz 2013 tarihinde Wayback Machine sitesinde .
- Weka ile eğitim modeli oluşturulması ve kaydedilmesi 30 Haziran 2013 tarihinde Wayback Machine sitesinde .
- Weka ile bilgi akışı sağlanması ve kullanılması 23 Temmuz 2013 tarihinde Wayback Machine sitesinde .
- en:Weka (machine learning)
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Weka makine ogrenimi amaciyla Waikato Universitesinde gelistirilmis ve Waikato Environment for Knowledge Analysis kelimelerinin bas harflerinden olusmus yazilimin ismidir Gunumuzde yaygin kullanimi olan cogu makine ogrenimi algoritmalarini ve metotlarini icermektedir WekaYeni Zelanda da yasayan bir kus turu olan wekayi betimleyen belirtkeGelistirici ler Guncel surum3 6 12 son surumu 3 7 12 gelistirme surumu 15 Aralik 2014Programlama diliJava programlama dili Isletim sistemicapraz platformTurmakine ogrenimiLisansGNU Genel Kamu LisansiResmi sitesihttp www cs waikato ac nz ml weka Kod deposugit cms waikato ac nz weka weka Java dilinde gelistirilmis olmasi ve kutuphanelerinin jar dosyalari halinde geliyor olmasi sayesinde Java dilinde yazilan projelere kolayce entegre edilebilmesi kullanimini daha da yayginlastirmistir Yazilim GNU Genel Kamu Lisansi ile dagitilmaktadir Genel BilgilerWeka tamamen moduler bir tasarima sahip olup icerdigi ozelliklerle veri kumeleri uzerinde gorsellestirme veri analizi is zekasi uygulamalari veri madenciligi gibi islemler yapabilmektedir Weka yazilimi kendisine ozgu olarak bir arff uzantisi destegi ile gelmektedir Ancak Weka yaziliminin icerisinde CSV dosyalarini da ARFF formatina cevirmeye yarayan araclar mevcuttur Temel olarak asagidaki 3 Veri Madenciligi islemi Weka ile yapilabilir Siniflandirma Classification Bolutleme Clustering Iliskilendirme Association Ayrica yukaridaki islemlere ilave olarak veri kumeleri uzerinde on ve son islemler yapilabilir Veri On isleme Data Pre Processing Gorsellestirme Visualization Son olarak Weka Kutuphanesi nde veri kumelerini iceren dosyalar uzerinde calisan cok sayida hazir fonksiyon bulunmaktadir Kullanim PopulerligiWeka is zekasi alaninda en cok kullanilan 10 yazilimdan birisi olup yine is zekasi konusunda en cok kullanilan ozgur yazilimlar siralamasinda ilk 3 sirada yer almaktadir Weka 200 e yakin IEEE makalesinde dogrudan gecmekte olup 5 700 civarinda ACM makalesinde de ismi dogrudan gecmektedir Weka 2011 Agustos ayi itibariyla sadece sourceforge net sitesinden 2 5 milyona yakin indirme sayisi ile en cok indirilen ilk 200 Sourceforge Projesi arasinda girmistir ARFF Dosya YapisiIngilizce Attribute Relationship File Format kelimelerinin bas harflerinden olusmustur ARFF dosya yapisi Weka ya ozel olarak gelistirilmistir ve dosya metin yapisinda tutulmaktadir Dosyanin ilk satirinda dosyadaki iliski tipi relation tutulmakta olup ikinci satirdan itibaren veri kumesindeki ozellikler attributes yazilmaktadir Ozelliklerin hemen ardindan veri kumesi yer alir ve veri kumesindeki her satir bir ornege instance isaret etmektedir Ayrica veri kumesindeki her ornegin her ozelligi arasinda da virgul ayiraci kullanilmaktadir relation havatahmini attribute nem numeric attribute sicaklik numeric attribute basinc numeric attribute tahmin numeric data 53 25 1013 1 41 22 1011 1 54 18 1012 1 67 23 1000 1 Yukaridaki ornek dosyada hava tahmini icin kullanilan nem sicaklik ve basinc degerleri bir dosya icerisinde 4 ornek icerecek sekilde gosterilmistir Bu degerler tip olarak sayisal degerler oldugundan numeric olarak ifade edilmistir Ancak bu degerler asagidaki tiplerde olabilir NOMINAL Kume Degerleri Tahmin degeridir ve bir tanim kumesi alir Ornegin tahmin gunesli yagmurlu sisli seklinde tanimlanan bir kumede bu ozellik kumedeki tanimli degerlerden birisini alabilir REAL Reel Sayilar kumesinden bir deger verileceginde kullanilir Ornegin sicaklik degeri 22 8 seklinde ondalikli degerleri de ifade edecek sekilde verilmek istenirse tip olarak numeric yerine reel kullanabiliriz STRING Veri kumesinin bu ozelliginin serbest yazi seklinde olabilecegini ifade eder Ozellikle metin madenciligi calismalari icin sikca kullanilan bir tiptir DATE Veri kumesinin bu ozelliginin tarih oldugunu ifade eder Ornegin veri kumesindeki kisilerin dogum tarihi veya orneklerin toplanma tarihi gibi ozelliklerin tutulmasinda kullanilabilir Tarihi1993 yilinda tarafindan ilk Weka paketi TCL TK C ve Makefiles dan olusan bir sekilde dunyaya duyuruldu 1997 yilinda JAVA nin da gelismesi ile butun Weka paketinin yeni bastan Java dilinde yazilmasi kabul edildi ve proje Java ya tasindi 2005 yilinda Weka dunyanin en prestijli veri madenciligi odullerinden olan Data Mining and Knowledge Discovery Service Award odulune layik goruldu 2006 yilinda Pentaho Corporation firmasi tarafindan is zekasi uygulamalarinda kullanilmak uzere Weka nin lisansi satin alindi Bu tarihten sonra Weka Pentaho business intelligence suite isimli paketin icinde de yer almaya basladi 2011 yili itibariyla 2 487 213 indirme ile en populer 200 Sourceforge projesinden birisi olmustur Tum Zaman Indirmeleri 9 Eylul 2010 tarihinde Wayback Machine sitesinde Kaynakca Sadi Evren Seker 2013 Is Zekasi ve Veri Madenciligi Weka ile ISBN 9786051276717 Cinius Analytics Training Sitesi 2011 yili En populer 10 is zekasi yazilimi 3 Temmuz 2013 tarihinde kaynagindan Erisim tarihi 6 Temmuz 2013 IEEE Xplore Weka arama sonuclari 9 Agustos 2020 tarihinde kaynagindan Erisim tarihi 6 Temmuz 2013 ACM Dijital Kutuphanesi arama sonuclari 9 Agustos 2020 tarihinde kaynagindan Erisim tarihi 6 Temmuz 2013 Ian H Witten 1999 Weka Practical Machine Learning Tools and Techniques with Java Implementations PDF Proceedings of the ICONIP ANZIIS ANNES 99 Workshop on Emerging Knowledge Engineering and Connectionist Based Information Systems ss 192 196 28 Eylul 2007 tarihinde kaynagindan PDF Erisim tarihi 26 Haziran 2007 Gregory Piatetsky Shapiro 28 Haziran 2005 KDnuggets news on SIGKDD Service Award 2005 14 Temmuz 2007 tarihinde kaynagindan Erisim tarihi 25 Haziran 2007 2005 1 Temmuz 2007 tarihinde kaynagindan arsivlendi Erisim tarihi 25 Haziran 2007 Dis baglantilarWeka nin Ekran goruntulerine genel bir bakis 13 Temmuz 2013 tarihinde Wayback Machine sitesinde Weka ile egitim modeli olusturulmasi ve kaydedilmesi 30 Haziran 2013 tarihinde Wayback Machine sitesinde Weka ile bilgi akisi saglanmasi ve kullanilmasi 23 Temmuz 2013 tarihinde Wayback Machine sitesinde en Weka machine learning