K-ortalama kümeleme ya da K-means kümeleme (K-means clustering) yöntemi N adet veri nesnesinden oluşan bir veri kümesini giriş parametresi olarak verilen K adet kümeye bölümlemektir. Amaç, gerçekleştirilen bölümleme işlemi sonunda elde edilen kümelerin, küme içi benzerliklerinin maksimum ve kümeler arası benzerliklerinin ise minimum olmasını sağlamaktır.
K-means en sık kullanılan kümeleme algoritmalarındandır. Uygulanması kolaydır. Büyük ölçekli verileri hızlı ve etkin şekilde kümeleyebilir. “K” algoritmaya başlamadan önce ihtiyaç duyulan sabit küme sayısını ifade etmektedir. Tekrarlı bölümleyici yapısı ile K-means algoritması, her verinin ait olduğu kümeye olan uzaklıkları toplamını küçültmektedir. K-means algoritması karesel hatayı en küçük yapacak olan K adet kümeyi tespit etmeye çalışmaktadır.
K-means ile küme içi benzerlik büyük, kümeler arası benzerlik ise küçük olduğu sürece kümelenmenin doğruluğundan söz edilebilir. Problem NP-hard olmasına rağmen K-means algoritması bir iteratif (tekrarlayıcı) yaklaşım ile genelde iyi bir çözüm verir.
Tanım
Her bir veri n-boyutlu reel vektör olmak üzere bir {x1, x2, …, xN} veri kümesi ve K bölünecek küme sayısı olarak verilsin. K-means kümeleme, karesel hatayı en aza indirgemek için N tane veriyi K adet S = {S1, S2, …, SK} kümeye bölümlemeyi amaçlar. Başka bir deyişle,
burada , Sj 'deki noktaların ortalaması olmak üzere
bulmaktır.
K-means algoritması nasıl çalışır?
K-means algoritmasının çalışma mekanizmasına göre öncelikle her kümenin merkez noktasını veya ortalamasını temsil etmek üzere K adet nesne rastgele seçilir. Kalan diğer nesneler, kümelerin ortalama değerlerine olan uzaklıkları dikkate alınarak en benzer oldukları kümelere dahil edilir. Daha sonra, her bir kümenin ortalama değeri hesaplanarak yeni küme merkezleri belirlenir ve tekrar nesnelerin merkeze uzaklıkları incelenir. Herhangi bir değişim olmayıncaya kadar algoritma tekrarlamaya devam eder.
Algoritma temel olarak 4 aşamadan oluşur:
- 1.Küme merkezlerinin belirlenmesi
- 2.Merkez dışındaki verilerin mesafelerine göre kümelendirilmesi
- 3.Yapılan kümelendirmeye göre yeni merkezlerin belirlenmesi (veya eski merkezlerin yeni merkeze kaydırılması)
- 4.Kararlı hale (stable state) gelinene kadar 2. ve 3. adımların tekrarlanması.
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
K ortalama kumeleme ya da K means kumeleme K means clustering yontemi N adet veri nesnesinden olusan bir veri kumesini giris parametresi olarak verilen K adet kumeye bolumlemektir Amac gerceklestirilen bolumleme islemi sonunda elde edilen kumelerin kume ici benzerliklerinin maksimum ve kumeler arasi benzerliklerinin ise minimum olmasini saglamaktir K means en sik kullanilan kumeleme algoritmalarindandir Uygulanmasi kolaydir Buyuk olcekli verileri hizli ve etkin sekilde kumeleyebilir K algoritmaya baslamadan once ihtiyac duyulan sabit kume sayisini ifade etmektedir Tekrarli bolumleyici yapisi ile K means algoritmasi her verinin ait oldugu kumeye olan uzakliklari toplamini kucultmektedir K means algoritmasi karesel hatayi en kucuk yapacak olan K adet kumeyi tespit etmeye calismaktadir K means ile kume ici benzerlik buyuk kumeler arasi benzerlik ise kucuk oldugu surece kumelenmenin dogrulugundan soz edilebilir Problem NP hard olmasina ragmen K means algoritmasi bir iteratif tekrarlayici yaklasim ile genelde iyi bir cozum verir TanimHer bir veri n boyutlu reel vektor olmak uzere bir x1 x2 xN veri kumesi ve K bolunecek kume sayisi olarak verilsin K means kumeleme karesel hatayi en aza indirgemek icin N tane veriyi K adet S S1 S2 SK kumeye bolumlemeyi amaclar Baska bir deyisle mi 1 Sj xi Sjxi displaystyle mu i frac 1 S j sum x i in S j x i burada mi displaystyle mu i Sj deki noktalarin ortalamasi olmak uzere argminS j 1K xi Sj xi mj 2 displaystyle underset mathbf S operatorname arg min sum j 1 K sum mathbf x i in S j left mathbf x i boldsymbol mu j right 2 bulmaktir K means algoritmasi nasil calisir K means algoritmasinin calisma mekanizmasina gore oncelikle her kumenin merkez noktasini veya ortalamasini temsil etmek uzere K adet nesne rastgele secilir Kalan diger nesneler kumelerin ortalama degerlerine olan uzakliklari dikkate alinarak en benzer olduklari kumelere dahil edilir Daha sonra her bir kumenin ortalama degeri hesaplanarak yeni kume merkezleri belirlenir ve tekrar nesnelerin merkeze uzakliklari incelenir Herhangi bir degisim olmayincaya kadar algoritma tekrarlamaya devam eder Algoritma temel olarak 4 asamadan olusur 1 Kume merkezlerinin belirlenmesi 2 Merkez disindaki verilerin mesafelerine gore kumelendirilmesi 3 Yapilan kumelendirmeye gore yeni merkezlerin belirlenmesi veya eski merkezlerin yeni merkeze kaydirilmasi 4 Kararli hale stable state gelinene kadar 2 ve 3 adimlarin tekrarlanmasi dd