İstatistiksel makine çevirisi, iki dilli metin derlemlerinin incelenmesinden elde edilen parametrelerin kullanıldığı istatistiksel modelleri içeren bir makine çevirisi yaklaşımıdır. İstatiksel çeviri yöntemi, makine çevirisi disiplini içerisinde kural tabanlı makine çevirisi ve örnek tabanlı makine çevirisi yaklaşımlarına göre farklılık gösterir.
İstatistiksel makine cevirisi yaklaşımına ilişkin ilk düşünceler Warren Weaver tarafından 1949 yılında ortaya atılmıştır. Bu düşünce, Claude Shannon'ın bilgi kuramına dayanmaktaydı. Uzun bir aradan sonra bu yöntem IBM araştırma laboratuvarlarında Thomas J. Watson Araştırma merkezinde 1991 yılında tekrar gündeme gelmiştir. Son yıllarda bu makine çevirisi yöntemine olan ilgi hızla artmıştır ve en fazla uygulanan yöntemlerden birisi haline gelmiştir.
Temelleri
İstatistiksel makine çevirisi yaklaşımının arka planındaki düşünce bilgi teorisine dayanır. Buna göre bir belgenin çevirisi, kaynak dildeki bir metnin (örnekte ile gösterilen Fransızca) hedef dildeki metne (örnekte
ile gösterilen İngilizce)
ile ifade edilen bir olasılık dağılımı altında karşılık gelen şeklidir.
ile ifade edilen olasılık dağılımını modellemek birkaç şekilde mümkündür. Öne çıkan yöntemlerden birisi Bayes teoremini uygulayarak problemi iki parçaya bölmektir. Çeviri problemi
şeklinde modellendiğinde
ifadesi, kaynak dildeki metin dizisinin hedef dildeki dizinin çevirisi olma olasılığını ifade eder ve olarak adlandırılır.
ifadesi ise çevirisi yapılan bu metnin hedef dilde karşılaşılabilen bir metin olma olasılığını ifade eder. Bu model ise dil modeli olarak adlandırılır.
ile ifade edilen en iyi çeviriyi bulma problemi, en yüksek koşullu olasılığı veren şu metin dizisini seçmekle çözülür:
.
Kısacası bir metnin hedef dildeki karşılığını bulma probleminin cevabı, iki ayrı modelin koşullu olasılığı alınarak en doğru biçimde elde edilmeye çalışılır.
Böyle bir modellemeyi güçlü şekilde uygulayabilmek için hedef dildeki bütün metin dizilerini arama sürecinden geçilmesi gerekir. Bu arama işini etkin şekilde halletmek için yabancı dildeki metni inceleyen ve üzerinde arama yapılan uzayı daraltan optimizasyon metotları kullanılır. Ne var ki bu türden optimizasyon yöntemleriyle arama süresinden kazanç sağlanırken doğru çevirinin bulunması ihtimalinde azalma da meydana gelebilir. Bu tür bir ödünleşme, yani kalite ve hız arasında seçim yapma durumu konuşma tanıma uygulamalarındaki ile benzerdir.
Çeviri sistemleri bütün metinleri ve çevirilerini saklayamayacağı için çeviri cümle bazında yapılır fakat bu bile tek başına yeterli olmaz. Dil modelleri elde edilirken modelleri kullanılarak kelime dizilerinin birbiri ardına gelme sıklığını gösteren tablolar oluşturulur. Çözücü program dil modelinin parametrelerini bu tablolardan elde eder.
İstatistiksel Çeviri Modelleri başlangıçta yalnızca kelime analizine dayalı modellerdi. IBM modelleri 1-5 ve Franz-Joseph Och'un 6. modeli bu çerçevededir. Deyim tabanlı çeviri modellerinin geliştirilmesiyle çeviri modellerinin kapasitesi yönünde büyük bir gelişme sağlanmıştır. Bu sayede çeviri birimlerinin yalnızca kelimelerden değil, biribiri ardına gelen kelime dizilerinden de meydana gelebileceği varsayımı altında daha gerçekçi modelleme yapılabilme imkânı doğmuştur. Son yıllarda ise cümlelerin kelime veya kelime grupları yerine bir ağacın dalları gibi tek bir yerden ayrışan yapılar şeklinde kurulduğunu varsayan ve iç içe geçmiş kelime gruplarının da olabileceğini varsayan modeller geliştirilmeye başlanmıştır.
Dış bağlantılar
- Statmt.org - İstatistiksel makine çevirisi ile ilgili araştırmalar 15 Ağustos 2021 tarihinde Wayback Machine sitesinde .
Kaynakça
- ^ W. Weaver (1955). Translation (1949). In: Machine Translation of Languages, MIT Press, Cambridge, MA.
- ^ S. Vogel, H. Ney and C. Tillmann. 1996. HMM-based Word Alignment in StatisticalTranslation. In COLING ’96: The 16th International Conference on Computational Linguistics, pp. 836-841, Copenhagen, Denmark.
- ^ F. Och and H. Ney. (2003). A Systematic Comparison of Various Statistical Alignment Models. Computational Linguistics, 29(1):19-51
- ^ P. Koehn, F.J. Och, and D. Marcu (2003). Statistical phrase based translation. In Proceedings of the Joint Conference on Human Language Technologies and the Annual Meeting of the North American Chapter of the Association of Computational Linguistics (HLT/NAACL).
- ^ D. Chiang (2005). A Hierarchical Phrase-Based Model for Statistical Machine Translation. In Proceedings of the 43rd Annual Meeting of the Association for Computational Linguistics (ACL'05).
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Istatistiksel makine cevirisi iki dilli metin derlemlerinin incelenmesinden elde edilen parametrelerin kullanildigi istatistiksel modelleri iceren bir makine cevirisi yaklasimidir Istatiksel ceviri yontemi makine cevirisi disiplini icerisinde kural tabanli makine cevirisi ve ornek tabanli makine cevirisi yaklasimlarina gore farklilik gosterir Istatistiksel makine cevirisi yaklasimina iliskin ilk dusunceler Warren Weaver tarafindan 1949 yilinda ortaya atilmistir Bu dusunce Claude Shannon in bilgi kuramina dayanmaktaydi Uzun bir aradan sonra bu yontem IBM arastirma laboratuvarlarinda Thomas J Watson Arastirma merkezinde 1991 yilinda tekrar gundeme gelmistir Son yillarda bu makine cevirisi yontemine olan ilgi hizla artmistir ve en fazla uygulanan yontemlerden birisi haline gelmistir TemelleriIstatistiksel makine cevirisi yaklasiminin arka planindaki dusunce bilgi teorisine dayanir Buna gore bir belgenin cevirisi kaynak dildeki bir metnin ornekte f displaystyle f ile gosterilen Fransizca hedef dildeki metne ornekte e displaystyle e ile gosterilen Ingilizce p e f displaystyle p e f ile ifade edilen bir olasilik dagilimi altinda karsilik gelen seklidir p e f displaystyle p e f ile ifade edilen olasilik dagilimini modellemek birkac sekilde mumkundur One cikan yontemlerden birisi Bayes teoremini uygulayarak problemi iki parcaya bolmektir Ceviri problemi p e f p f e p e displaystyle p e f propto p f e p e seklinde modellendiginde p f e displaystyle p f e ifadesi kaynak dildeki metin dizisinin hedef dildeki dizinin cevirisi olma olasiligini ifade eder ve olarak adlandirilir p e displaystyle p e ifadesi ise cevirisi yapilan bu metnin hedef dilde karsilasilabilen bir metin olma olasiligini ifade eder Bu model ise dil modeli olarak adlandirilir e displaystyle tilde e ile ifade edilen en iyi ceviriyi bulma problemi en yuksek kosullu olasiligi veren su metin dizisini secmekle cozulur e argmaxe e p e f argmaxe e p f e p e displaystyle tilde e arg max e in e p e f arg max e in e p f e p e Kisacasi bir metnin hedef dildeki karsiligini bulma probleminin cevabi iki ayri modelin kosullu olasiligi alinarak en dogru bicimde elde edilmeye calisilir Boyle bir modellemeyi guclu sekilde uygulayabilmek icin hedef dildeki butun metin dizilerini e displaystyle e arama surecinden gecilmesi gerekir Bu arama isini etkin sekilde halletmek icin yabanci dildeki metni inceleyen ve uzerinde arama yapilan uzayi daraltan optimizasyon metotlari kullanilir Ne var ki bu turden optimizasyon yontemleriyle arama suresinden kazanc saglanirken dogru cevirinin bulunmasi ihtimalinde azalma da meydana gelebilir Bu tur bir odunlesme yani kalite ve hiz arasinda secim yapma durumu konusma tanima uygulamalarindaki ile benzerdir Ceviri sistemleri butun metinleri ve cevirilerini saklayamayacagi icin ceviri cumle bazinda yapilir fakat bu bile tek basina yeterli olmaz Dil modelleri elde edilirken modelleri kullanilarak kelime dizilerinin birbiri ardina gelme sikligini gosteren tablolar olusturulur Cozucu program dil modelinin parametrelerini bu tablolardan elde eder Istatistiksel Ceviri Modelleri baslangicta yalnizca kelime analizine dayali modellerdi IBM modelleri 1 5 ve Franz Joseph Och un 6 modeli bu cercevededir Deyim tabanli ceviri modellerinin gelistirilmesiyle ceviri modellerinin kapasitesi yonunde buyuk bir gelisme saglanmistir Bu sayede ceviri birimlerinin yalnizca kelimelerden degil biribiri ardina gelen kelime dizilerinden de meydana gelebilecegi varsayimi altinda daha gercekci modelleme yapilabilme imkani dogmustur Son yillarda ise cumlelerin kelime veya kelime gruplari yerine bir agacin dallari gibi tek bir yerden ayrisan yapilar seklinde kuruldugunu varsayan ve ic ice gecmis kelime gruplarinin da olabilecegini varsayan modeller gelistirilmeye baslanmistir Dis baglantilarStatmt org Istatistiksel makine cevirisi ile ilgili arastirmalar 15 Agustos 2021 tarihinde Wayback Machine sitesinde Kaynakca W Weaver 1955 Translation 1949 In Machine Translation of Languages MIT Press Cambridge MA S Vogel H Ney and C Tillmann 1996 HMM based Word Alignment in StatisticalTranslation In COLING 96 The 16th International Conference on Computational Linguistics pp 836 841 Copenhagen Denmark F Och and H Ney 2003 A Systematic Comparison of Various Statistical Alignment Models Computational Linguistics 29 1 19 51 P Koehn F J Och and D Marcu 2003 Statistical phrase based translation In Proceedings of the Joint Conference on Human Language Technologies and the Annual Meeting of the North American Chapter of the Association of Computational Linguistics HLT NAACL D Chiang 2005 A Hierarchical Phrase Based Model for Statistical Machine Translation In Proceedings of the 43rd Annual Meeting of the Association for Computational Linguistics ACL 05