Veri madenciliği, büyük ölçekli veriler arasından faydalı bilgiye ulaşma, bilgiyi madenleme işidir. Büyük veri yığınları içerisinden gelecekle ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranması olarak da tanımlanabilir.
Kavram
Veri madenciliği deyimi yanlış kullanılan bir kavram olabileceğinden buna eş değer başka kullanımlar da literatüre geçmiştir. Veritabanlarında bilgi madenciliği (İng. knowledge mining in databases), bilgi çıkarımı (İng. knowledge extraction), veri ve örüntü analizi (İng. data/pattern analysis), veri arkeolojisi gibi. Bu terimler arasında "Veritabanlarında Bilgi Keşfi" (İng. VBK - knowledge discovery in databases - KDD) en yaygınıdır. Alternatif olarak veri madenciliği aslında bilgi keşfi sürecinin bir parçası şeklinde kabul görmektedir. Bu adımlar:
- Veri temizleme (gürültülü ve tutarsız verileri çıkarmak)
- Veri bütünleştirme (birçok veri kaynağını birleştirebilmek)
- Veri seçme (yapılacak olan analizle ilgili olan verileri belirlemek)
- Veri dönüşümü (verinin veri madenciliği tekniğinden kullanılabilecek hale dönüşümünü gerçekleştirmek)
- Veri madenciliği (veri örüntülerini yakalayabilmek için akıllı metotları uygulamak)
- Örüntü değerlendirme (bâzı ölçümlere göre elde edilmiş bilgiyi temsil eden ilginç örüntüleri tanımlamak)
- Bilgi sunumu (mâdenciliği yapılmış olan elde edilmiş bilginin kullanıcıya sunumunu gerçekleştirmek).
Yöntem
Veri madenciliği adımı, kullanıcı ve bilgi tabanıyla etkileşim halindedir. İlginç örüntüler kullanıcıya gösterilir ve bunun ötesinde istenirse bilgi tabanına da kaydedilebilir. Buna göre, veri madenciliği işlemi, gizli kalmış örüntüler bulunana kadar devam eder.
Bir veri madenciliği sistemi, aşağıdaki temel bileşenlere sahiptir:
- Veritabanı, veri ambarı ve diğer depolama teknikleri
- Veritabanı ya da Veri Ambarı Sunucusu
- Bilgi Tabanı
- Veri Madenciliği Motoru
- Örüntü Değerlendirme
- Kullanıcı Arayüzü
Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Bu da; kümeleme, veri özetleme, değişikliklerin analizi, sapmaların tespiti gibi belirli sayıda teknik yaklaşımları içerir.
Başka bir deyişle, veri madenciliği, verilerin içerisindeki desenlerin, ilişkilerin, değişimlerin, düzensizliklerin, kuralların ve istatistiksel olarak önemli olan yapıların yarı otomatik olarak keşfedilmesidir.
Temel olarak veri madenciliği, veri setleri arasındaki desenlerin ya da düzenin, verinin analizi ve yazılım tekniklerinin kullanılmasıyla ilgilidir. Veriler arasındaki ilişkiyi, kuralları ve özellikleri belirlemekten bilgisayar sorumludur. Amaç, daha önceden fark edilmemiş veri desenlerini tespit edebilmektir.
Veri madenciliğini istatistiksel bir yöntemler serisi olarak görmek mümkün olabilir. Ancak veri madenciliği, geleneksel istatistikten birkaç yönde farklılık gösterir. Veri madenciliğinde amaç, kolaylıkla mantıksal kurallara ya da görsel sunumlara çevrilebilecek nitel modellerin çıkarılmasıdır. Bu bağlamda, veri madenciliği insan merkezlidir ve bazen insan – bilgisayar arayüzü birleştirilir.
Veri madenciliği sahası, istatistik, makine bilgisi, veritabanları ve yüksek performanslı işlem gibi temelleri de içerir.
Veri sınıflandırma
Veri madenciliğinde üzerinde çalışılan veri farklı terimlerle sınıflandırılır. Geniş veri tek bir iş istasyonunun belleğine sığamayacak kadar büyük veri kümelerini ifade etmektedir. Yüksek hacimli veri ise, tek bir iş istasyonundaki ya da bir grup iş istasyonundaki disklere sığamayacak kadar fazla veri anlamındadır. Dağıtık veri ise, farklı coğrafi konumlarda bulunan verileri anlatır.
Ayrıca bakınız
Kaynakça
- ^ . vizyonergenc.com. 6 Kasım 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.
- ^ User, Alm (25 Eylül 2020). . G Teknoloji. 31 Ekim 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.
- ^ . www.guru99.com. 3 Haziran 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.
- ^ Pinustech. "Veri Madenciliği Nedir?". www.smartmind.com.tr. 4 Nisan 2021 tarihinde kaynağından . Erişim tarihi: 11 Mart 2021.
- ^ . Encyclopedia Britannica (İngilizce). 3 Temmuz 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.
- ^ . www.sas.com (İngilizce). 12 Ocak 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.
- ^ . 25 Ağustos 2020. 28 Eylül 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Veri madenciligi buyuk olcekli veriler arasindan faydali bilgiye ulasma bilgiyi madenleme isidir Buyuk veri yiginlari icerisinden gelecekle ilgili tahminde bulunabilmemizi saglayabilecek bagintilarin bilgisayar programi kullanarak aranmasi olarak da tanimlanabilir KavramVeri madenciligi deyimi yanlis kullanilan bir kavram olabileceginden buna es deger baska kullanimlar da literature gecmistir Veritabanlarinda bilgi madenciligi Ing knowledge mining in databases bilgi cikarimi Ing knowledge extraction veri ve oruntu analizi Ing data pattern analysis veri arkeolojisi gibi Bu terimler arasinda Veritabanlarinda Bilgi Kesfi Ing VBK knowledge discovery in databases KDD en yayginidir Alternatif olarak veri madenciligi aslinda bilgi kesfi surecinin bir parcasi seklinde kabul gormektedir Bu adimlar Veri temizleme gurultulu ve tutarsiz verileri cikarmak Veri butunlestirme bircok veri kaynagini birlestirebilmek Veri secme yapilacak olan analizle ilgili olan verileri belirlemek Veri donusumu verinin veri madenciligi tekniginden kullanilabilecek hale donusumunu gerceklestirmek Veri madenciligi veri oruntulerini yakalayabilmek icin akilli metotlari uygulamak Oruntu degerlendirme bazi olcumlere gore elde edilmis bilgiyi temsil eden ilginc oruntuleri tanimlamak Bilgi sunumu madenciligi yapilmis olan elde edilmis bilginin kullaniciya sunumunu gerceklestirmek YontemVeri madenciligi adimi kullanici ve bilgi tabaniyla etkilesim halindedir Ilginc oruntuler kullaniciya gosterilir ve bunun otesinde istenirse bilgi tabanina da kaydedilebilir Buna gore veri madenciligi islemi gizli kalmis oruntuler bulunana kadar devam eder Bir veri madenciligi sistemi asagidaki temel bilesenlere sahiptir Veritabani veri ambari ve diger depolama teknikleri Veritabani ya da Veri Ambari Sunucusu Bilgi Tabani Veri Madenciligi Motoru Oruntu Degerlendirme Kullanici Arayuzu Veri madenciligi eldeki verilerden ustu kapali cok net olmayan onceden bilinmeyen ancak potansiyel olarak kullanisli bilginin cikarilmasidir Bu da kumeleme veri ozetleme degisikliklerin analizi sapmalarin tespiti gibi belirli sayida teknik yaklasimlari icerir Baska bir deyisle veri madenciligi verilerin icerisindeki desenlerin iliskilerin degisimlerin duzensizliklerin kurallarin ve istatistiksel olarak onemli olan yapilarin yari otomatik olarak kesfedilmesidir Temel olarak veri madenciligi veri setleri arasindaki desenlerin ya da duzenin verinin analizi ve yazilim tekniklerinin kullanilmasiyla ilgilidir Veriler arasindaki iliskiyi kurallari ve ozellikleri belirlemekten bilgisayar sorumludur Amac daha onceden fark edilmemis veri desenlerini tespit edebilmektir Veri madenciligini istatistiksel bir yontemler serisi olarak gormek mumkun olabilir Ancak veri madenciligi geleneksel istatistikten birkac yonde farklilik gosterir Veri madenciliginde amac kolaylikla mantiksal kurallara ya da gorsel sunumlara cevrilebilecek nitel modellerin cikarilmasidir Bu baglamda veri madenciligi insan merkezlidir ve bazen insan bilgisayar arayuzu birlestirilir Veri madenciligi sahasi istatistik makine bilgisi veritabanlari ve yuksek performansli islem gibi temelleri de icerir Veri siniflandirmaVeri madenciliginde uzerinde calisilan veri farkli terimlerle siniflandirilir Genis veri tek bir is istasyonunun bellegine sigamayacak kadar buyuk veri kumelerini ifade etmektedir Yuksek hacimli veri ise tek bir is istasyonundaki ya da bir grup is istasyonundaki disklere sigamayacak kadar fazla veri anlamindadir Dagitik veri ise farkli cografi konumlarda bulunan verileri anlatir Ayrica bakinizVeritabani Makine ogrenimiKaynakca vizyonergenc com 6 Kasim 2020 tarihinde kaynagindan arsivlendi Erisim tarihi 11 Mart 2021 User Alm 25 Eylul 2020 G Teknoloji 31 Ekim 2020 tarihinde kaynagindan arsivlendi Erisim tarihi 11 Mart 2021 www guru99 com 3 Haziran 2019 tarihinde kaynagindan arsivlendi Erisim tarihi 11 Mart 2021 Pinustech Veri Madenciligi Nedir www smartmind com tr 4 Nisan 2021 tarihinde kaynagindan Erisim tarihi 11 Mart 2021 Encyclopedia Britannica Ingilizce 3 Temmuz 2015 tarihinde kaynagindan arsivlendi Erisim tarihi 11 Mart 2021 www sas com Ingilizce 12 Ocak 2014 tarihinde kaynagindan arsivlendi Erisim tarihi 11 Mart 2021 25 Agustos 2020 28 Eylul 2020 tarihinde kaynagindan arsivlendi Erisim tarihi 11 Mart 2021