BLEU(İngilizce: bilingual evaluation understudy) bir makine çevirisi sistemi tarafından oluşturulan çevirilerin kalitesini ölçmeye yarayan bir algoritmadır. Burada "kalite", makinenin çevirisinin profesyonel bir insan çevirisine olabildiğince yakın sonuçlar oluşturabilmesi anlamına gelir. BLEU 2002'de yayınlanmış olup, günümüzde de yaygın otomatik biridir.[1][2]
Skorlar çevrilmiş birimlerin(genellikle cümleler), önceden insan tarafından kaliteli olarak belirlenmiş çevirilerle karşılaştırılarak bulunur. Sonrasında, genelinde bu skorların ortalaması alınarak çeviri sisteminin başarısına dair bir fikir elde edilinir.
BLEU'nun çıktıları 0 ve 1 arasında bir kayan nokta değerdir. Bu değer çevrilmiş metnin doğru çeviriyle benzerleğini gösterir, 1'e yakın değerler daha büyük benzerlik gösterir. Çevirilerin(insan dahil) büyük çoğunluklarının 1'e erişmediği unutulmamalıdır, nitekim ortalamanın 1 olması çevirinin hedef çeviriyle birebir aynı olduğu anlamına gelir, dolayısıyla sonucun 1 olması gerekli değildir. Olasılıkları artıracağından dolayı, daha çok karşılaştırılacak örnek eklemek genellikle skoru artırır.
Algoritma
Aday | masa | masa | masa | masa | masa |
---|---|---|---|---|---|
Örnek 1 | Masada | bir | kedi | var. | |
Örnek 2 | Masanın | üstünde | bir | kedi | bulunur. |
Aday çevirideki 5 kelimenin hepsi örneklerde bulunduğundan, uni-gram(yani kelime bazlı) kesinliği:
burada adaydaki kelimelerin kaçının örnekte bulunduğu, de örnekte bulunan toplam soru sayısıdır. 1 mükemmel skor olsa da, aday anlamlı veya doğru bir çeviri değildir ve örneklerle anlamsal veya biçimsel ortaklığı yoktur.
BLEU'nun bu sürece yaptığı değişiklikler nispeten bassittir. Aday çevirideki her kelime için maksimum toplam sayıyı temsil eden hesaplanır. Yukarıdaki örneğe uyacak şekilde "masa" kelimesi Örnek 1'de 1, Örnek 2'de de 1 kere görünür. Dolayısıyla 1'dir.
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
BLEU Ingilizce bilingual evaluation understudy bir makine cevirisi sistemi tarafindan olusturulan cevirilerin kalitesini olcmeye yarayan bir algoritmadir Burada kalite makinenin cevirisinin profesyonel bir insan cevirisine olabildigince yakin sonuclar olusturabilmesi anlamina gelir BLEU 2002 de yayinlanmis olup gunumuzde de yaygin otomatik biridir 1 2 Skorlar cevrilmis birimlerin genellikle cumleler onceden insan tarafindan kaliteli olarak belirlenmis cevirilerle karsilastirilarak bulunur Sonrasinda genelinde bu skorlarin ortalamasi alinarak ceviri sisteminin basarisina dair bir fikir elde edilinir BLEU nun ciktilari 0 ve 1 arasinda bir kayan nokta degerdir Bu deger cevrilmis metnin dogru ceviriyle benzerlegini gosterir 1 e yakin degerler daha buyuk benzerlik gosterir Cevirilerin insan dahil buyuk cogunluklarinin 1 e erismedigi unutulmamalidir nitekim ortalamanin 1 olmasi cevirinin hedef ceviriyle birebir ayni oldugu anlamina gelir dolayisiyla sonucun 1 olmasi gerekli degildir Olasiliklari artiracagindan dolayi daha cok karsilastirilacak ornek eklemek genellikle skoru artirir AlgoritmaBasarisiz bir makine cevirisi ornegi Aday masa masa masa masa masaOrnek 1 Masada bir kedi var Ornek 2 Masanin ustunde bir kedi bulunur Aday cevirideki 5 kelimenin hepsi orneklerde bulundugundan uni gram yani kelime bazli kesinligi P mwt 77 1 displaystyle P frac m w t frac 7 7 1 burada m displaystyle m adaydaki kelimelerin kacinin ornekte bulundugu wt displaystyle w t de ornekte bulunan toplam soru sayisidir 1 mukemmel skor olsa da aday anlamli veya dogru bir ceviri degildir ve orneklerle anlamsal veya bicimsel ortakligi yoktur BLEU nun bu surece yaptigi degisiklikler nispeten bassittir Aday cevirideki her kelime icin maksimum toplam sayiyi temsil eden mmax displaystyle m max hesaplanir Yukaridaki ornege uyacak sekilde masa kelimesi Ornek 1 de 1 Ornek 2 de de 1 kere gorunur Dolayisiyla mmax displaystyle m max 1 dir