Çeviri belleği (ÇB) veya Çeviri hafızası (ÇB), insan çevirmenlere yardımcı olmak için daha önce çevrilmiş cümleler, paragraflar veya cümle benzeri birimler (başlıklar, başlıklar veya bir listedeki öğeler) olabilen "segmentleri" depolayan bir veritabanıdır. Çeviri belleği, kaynak metni ve karşılık gelen çevirisini “çeviri birimleri” adı verilen dil çiftlerinde saklar. Bireysel kelimeler terminoloji temelleri tarafından ele alınır ve ÇB'nin alanı içinde değildir.
Çeviri hafızasını kullanan yazılım programları bazen çeviri hafızası yöneticileri (ÇBY) veya çeviri hafızası sistemleri (ÇB sistemleri, çeviri sürecini yönetmeye odaklanan başka bir yazılım türü olan Çeviri yönetim sistemi (ÇYS) ile karıştırılmamalıdır) olarak bilinir.
Çeviri hafızaları tipik olarak özel bir bilgisayar destekli çeviri (BDÇ) aracı, kelime işlem programı, terminoloji yönetim sistemleri, çok dilli sözlük ve hatta ham makine çevirisi çıktısı ile birlikte kullanılır.
Araştırmalar, çok dilli belgeler üreten birçok şirketin çeviri hafızası sistemlerini kullandığını gösteriyor. 2006'da dil uzmanlarıyla yapılan bir ankette, 874 yanıtın %82,5'i ÇB kullanımını doğruladı. ÇB kullanımı, teknik terimler ve basit cümle yapısı (teknik, daha düşük derecede pazarlama ve finansal), bilgi işlem becerileri ve içeriğin tekrarlanabilirliği ile karakterize edilen metin türüyle ilişkilidir.
Çeviri hafızasını kullanma
Program kaynak metni (çevrilecek metni) bölümlere ayırır, bölümler arasındaki eşleşmeleri ve bir çeviri hafızasında depolanan daha önce çevrilmiş kaynak-hedef çiftlerinin kaynak yarısı arasındaki eşleşmeleri arar ve bu eşleşme çiftlerini çeviri tam ve/veya kısmi eşleşmeler olarak sunar. Çevirmen bir eşleşmeyi kabul edebilir, yeni bir çeviriyle değiştirebilir veya kaynağa uyacak şekilde değiştirebilir. Son iki durumda, yeni veya değiştirilmiş çeviri veritabanına gider.
Bazı çeviri hafızası sistemleri yalnızca %100 eşleşme arar, yani yalnızca veri tabanındaki girişlerle tam olarak eşleşen metin bölümlerini alabilirken, diğerleri çevirmene işaretli farklılıklarla sunulan benzer bölümleri almak için bulanık eşleştirme algoritmaları kullanır. Tipik çeviri hafızası sistemlerinin yalnızca kaynak bölümdeki metni aradığına dikkat etmek önemlidir.
Eşleştirme algoritmasının esnekliği ve sağlamlığı, çeviri hafızasının performansını büyük ölçüde belirler, ancak bazı uygulamalar için tam eşleşmelerin geri çağırma oranı %100 eşleşme yaklaşımını haklı çıkarmaya yetecek kadar yüksek olabilir.
Eşleşmenin bulunmadığı bölümlerin çevirmen tarafından manuel olarak çevrilmesi gerekecektir. Bu yeni çevrilen bölümler, gelecekteki çeviriler için ve aynı zamanda o bölümün mevcut metindeki tekrarları için kullanılabilecekleri veritabanında saklanır.
Çeviri hafızası, teknik kılavuzlar gibi çok tekrarlı metinlerde en iyi sonucu verir. Ayrıca, örneğin bir kullanım kılavuzunun yeni bir sürümündeki küçük değişikliklere karşılık gelen, daha önce çevrilmiş bir belgedeki artımlı değişiklikleri çevirmek için de yararlıdırlar. Geleneksel olarak çeviri hafızası, kullanılan dilde çok az tekrar olması gibi basit bir nedenle edebi veya yaratıcı metinler için uygun görülmemektedir. Bununla birlikte, diğerleri onları tekrar eÇBeyen metinler için bile değerli buluyor, çünkü oluşturulan veritabanı kaynakları, terimlerin uygun kullanımını belirlemek için uygunluk araştırmaları, kalite güvencesi (boş bölümler yok) ve inceleme sürecinin basitleştirilmesi (kaynak ve çevirmenler geleneksel bir inceleme ortamında iki belgeyle çalışmak zorundayken hedef segment her zaman birlikte görüntülenir).
Ana faydalar
Çeviri hafızası yöneticileri, teknik belgeleri ve özel sözlükler içeren belgeleri çevirmek için en uygun olanlardır. Avantajları şunlardır:
- Belgenin tamamen tercüme edilmesini sağlamak (çeviri hafızaları boş hedef segmentleri kabul eÇBez)
- Ortak tanımlar, ifadeler ve terminoloji dahil olmak üzere tercüme edilen belgelerin tutarlı olmasını sağlamak. Bu, farklı çevirmenler tek bir proje üzerinde çalışırken önemlidir.
- Çevirmenlerin, genellikle bu biçimleri işlemek için gereken yazılıma sahip olmak zorunda kalmadan çok çeşitli biçimlerdeki belgeleri çevirmesine olanak tanır.
- Genel çeviri sürecini hızlandırmak; Çeviri bellekleri daha önce çevrilmiş materyali "hatırladığından", çevirmenlerin onu yalnızca bir kez çevirmesi gerekir.
- Uzun vadeli çeviri projelerinin maliyetlerinin düşürülmesi; örneğin kılavuz metinleri, uyarı mesajları veya belge dizileri yalnızca bir kez çevrilmelidir ve birkaç kez kullanılabilir.
- Büyük dokümantasyon projeleri için, bir ÇB paketinin kullanımı sayesinde (zaman veya para olarak) tasarruf, yeni bir projenin ilk çevirisi için bile zaten belirgin olabilir, ancak normalde bu tür tasarruflar, yalnızca önceden yapılmış bir projenin sonraki sürümlerinin çevirisi sırasında görülür. çeviri belleğini kullanmadan önce çevrildi.
Ana engeller
Çeviri belleği yöneticilerinin daha geniş kullanımını engelleyen başlıca sorunlar şunlardır:
- "Çeviri bellekleri" kavramı, önceki çevirilerde kullanılan cümlelerin "geri dönüştürülebileceği" öncülüne dayanmaktadır. Bununla birlikte, çevirinin yol gösterici bir ilkesi, çevirmenin, metnin bileşenlerini değil, metnin mesajını çevirmesi gerektiğidir.
- Çeviri belleği yöneticileri, mevcut çeviri veya yerelleştirme süreçlerine kolayca uymazlar. ÇB teknolojisinden yararlanmak için çeviri süreçleri yeniden tasarlanmalıdır.
- Çeviri belleği yöneticileri şu anda tüm belge biçimlerini desteklememektedir ve tüm dosya türlerini desteklemek için filtreler mevcut olmayabilir.
- Çeviri belleği yöneticilerinin kullanılmasıyla ilgili bir öğrenme eğrisi vardır ve programlar en yüksek etkinlik için özelleştirilmelidir.
- Tercüme sürecinin tamamının veya bir kısmının dışarıdan temin edildiği veya saha dışında çalışan serbest çevirmenler tarafından yürütüldüğü durumlarda, saha dışındaki çalışanlar, çeviri belleği yöneticisi tarafından oluşturulan metinlerle çalışabilmek için özel araçlara ihtiyaç duyarlar.
- Birçok çeviri belleği yöneticisinin tam sürümleri, koltuk başına 500 ABD Doları ile 2,500 ABD Doları arasında olabilir ve bu da önemli bir yatırımı temsil edebilir (ancak daha düşük maliyetli programlar da mevcuttur). Bununla birlikte, bazı geliştiriciler, bireysel çevirmenlerin bu araçların tam sürümleriyle oluşturulmuş projeler üzerinde çalışmak için kullanabileceği azaltılmış özellik setleriyle araçlarının ücretsiz veya düşük maliyetli sürümlerini üretir. (Ücretsiz ve shareware ÇB paketleri olduğunu unutmayın, ancak bunların hiçbiri henüz büyük bir pazar payı kazanmamıştır.)
- Kullanıcının geçmiş çevirilerini çeviri belleği veritabanına aktarma, eğitim ve herhangi bir ek ürünle ilgili maliyetler de önemli bir yatırımı temsil edebilir.
- Çeviri belleği veritabanlarının bakımı çoğu durumda hala manuel bir işlem olma eğilimindedir ve bunların bakımının yapılmaması, ÇB eşleşmelerinin kullanılabilirliğinin ve kalitesinin önemli ölçüde azalmasına neden olabilir.
- Daha önce belirtildiği gibi, çeviri belleği yöneticileri, dahili tekrarı olmayan veya revizyonlar arasında değişmeyen kısımlar içermeyen metinler için uygun olmayabilir. Teknik metinler genellikle çeviri belleği için en uygun olanıdır, pazarlama veya yaratıcı metinler ise daha az uygun olacaktır.
Kalite üzerindeki etkiler
ÇB sistemlerinin kullanılması, tercüme edilen metinlerin kalitesi üzerinde etkili olabilir. Ana etkisi, açıkça "hata yayılımı" ile ilgilidir: belirli bir bölümün çevirisi yanlışsa, aslında yanlış çevirinin aynı kaynak metin veya benzer bir sonraki sefer tekrar kullanılması daha olasıdır. kaynak metin çevrilir, böylece hata devam eder. Geleneksel olarak, çevrilmiş metinlerin kalitesi üzerinde iki ana etki tanımlanmıştır: "cümle-salata" etkisi (Bédard 2000; O'Hagan 2009: 50'de aktarılmıştır) ve "gözetleme deliği" etkisi (Heyn 1998). İlki, bir metin, farklı tarzlarda farklı çevirmenler tarafından çevrilmiş olan bir ÇB'dan alınan cümleler kullanılarak çevrildiğinde metin düzeyinde tutarlılık eksikliğine atıfta bulunur. İkincisine göre, çevirmenler, metin içi referanslar içermemeleri için üsluplarını ÇB sisteminin kullanımına uyarlayabilirler, böylece bölümler gelecekteki metinlerde daha iyi kullanılabilir, böylece bağdaşıklık ve okunabilirlik etkilenir (O'Hagan 2009).
Çevrilen metin üzerinde potansiyel ve varsa muhtemelen bilinçsiz bir etki vardır. Farklı diller, bir cümle içindeki mantıksal öğeler için farklı sıralar kullanır ve yarısı çevrilmiş çok yan tümceli bir cümleyle sunulan bir çevirmenin, bir cümleyi tamamen yeniden oluşturma olasılığı daha düşüktür. Tutarlı ampirik kanıtlar (Martín-Mor 2011), çevirmenlerin bir ÇB sistemi yerine bir metin işlemcisi ile çalışırken çok yan tümceli bir cümlenin yapısını büyük olasılıkla değiştireceklerini göstermektedir.
Ayrıca çevirmenin, her bir cümlenin etrafındakilerle ve bir bütün olarak metinle nasıl bir ilişki kurduğuna odaklanmak yerine, metni cümle cümle mekanik olarak ele alma potansiyeli de vardır. Araştırmacılar (Dragsted 2004), bu programların otomatik bölümleme özelliği ile ilgili olan bu etkiyi tanımladılar, ancak bunun çevirilerin kalitesi üzerinde mutlaka olumsuz bir etkisi olması gerekmiyor.
Bu etkilerin, araca özgü olmaktan ziyade eğitimle yakından ilişkili olduğunu unutmayın. Martín-Mor'a (2011) göre, ÇB sistemlerinin kullanılması, özellikle yeni başlayanlar için çevrilen metinlerin kalitesi üzerinde bir etkiye sahiptir, ancak deneyimli çevirmenler bundan kaçınabilir. Pym (2013) "ÇB/MÇ kullanan çevirmenlerin, ilerledikçe her bölümü revize etme eğiliminde olduğunu ve sonunda tüm metnin nihai bir revizyonu için çok az zaman tanıdığını" hatırlatır; bu aslında burada açıklanan etkilerin bazı sorunların nihai nedeni olabilir.
Çeviri hafızası sistemleri türleri
- Masaüstü: Masaüstü çeviri hafızası araçları, genellikle bireysel çevirmenlerin çevirileri tamamlamak için kullandığı araçlardır. Serbest çevirmenlerin masaüstü bilgisayarına indirip yüklediği programlardır.
- Sunucu tabanlı veya merkezileştirilmiş: Merkezileştirilmiş çeviri belleği sistemleri, ÇB'yi merkezi bir sunucuda depolar. Masaüstü ÇB ile birlikte çalışırlar ve ÇB eşleşme oranlarını yalnızca masaüstü ÇB ile elde edilen ÇB kaldıracından %30-60 daha fazla artırabilirler.
İşlevler
Aşağıda, bir çeviri hafızasının ana işlevlerinin bir özeti yer almaktadır.
Çevrimdışı işlevler
İçe aktarma
Bu işlev, bir metni ve çevirisini bir metin dosyasından ÇB'ye aktarmak için kullanılır. İçe aktarma, çevirisiyle birlikte bir ÇB'ye içe aktarmak için harici bir kaynak metnin mevcut olduğu bir ham biçimden yapılabilir. Bazen metinlerin kullanıcı tarafından yeniden işlenmesi gerekir. İçe aktarma için kullanılabilecek başka bir biçim daha vardır: yerel biçim . Bu biçim, çeviri belleklerini bir dosyaya kaydeÇBek için ÇB'yi kullanan biçimdir.
Analiz
Analiz süreci aşağıdaki adımları içerir:
- Metinsel ayrıştırma
- Örneğin bir cümlenin sonundaki nokta ile kısaltmadaki nokta arasındaki farkı ayırt edebilmek için noktalama işaretlerini doğru tanımak çok önemlidir. Bu nedenle, işaretleme bir tür ön düzenlemedir. Genellikle, çevirmenlerin yardım programları aracılığıyla işlenen materyaller, çeviri aşaması çok dilli bir belge üretim hattına gömülü olduğundan, işaretleme içerir. Diğer özel metin öğeleri, işaretleme ile ayrılabilir. Özel adlar ve kodlar gibi çevrilmesi gerekmeyen özel öğeler bulunurken, diğerlerinin yerel biçime dönüştürülmesi gerekebilir.
- Dilsel ayrıştırma
- Temel form indirgemesi, bir terim bankasından terimlerin otomatik olarak alınması için kelime listeleri ve bir metin hazırlamak için kullanılır. Öte yandan, bir kaynak metinden çok kelimeli terimleri veya deyimleri çıkarmak için sözdizimsel ayrıştırma kullanılabilir. Bu nedenle ayrıştırma, deyimbilimin kelime sırası varyasyonunu normalleştirmek için kullanılır, bu, hangi kelimelerin bir cümle oluşturabileceğidir.
- Segmentasyon
- Amacı, en kullanışlı çeviri birimlerini seçmektir. Segmentasyon, bir tür ayrıştırma gibidir. Yüzeysel ayrıştırma kullanılarak tek dilli olarak yapılır ve hizalama, segmentasyona dayanır. Çevirmenler segmentasyonları manuel olarak düzeltirse, program kendi hatalarını tekrarlayacağından, belgenin sonraki sürümleri düzeltilmiş segmentasyona dayalı olarak ÇB ile eşleşme bulamaz. Çevirmenler genellikle cümle cümle ilerler, ancak bir cümlenin çevirisi çevredekilerin çevirisine bağlı olabilir.
- Hizalama
- Kaynak ve hedef metinler arasındaki çeviri yazışmalarını tanımlama görevidir. Hizalamadan segmentasyona geri bildirim olmalı ve iyi bir hizalama algoritması ilk segmentasyonu düzeltebilmelidir.
- Terim çıkarma
- Girdi olarak önceki bir sözlüğe sahip olabilir. Ayrıca, bilinmeyen terimleri ayıklarken, metin istatistiklerine dayalı ayrıştırmayı kullanabilir. Bunlar, bir çeviri işinde yer alan iş miktarını tahmin etmek için kullanılır. Bu, işi planlamak ve programlamak için çok yararlıdır. Çeviri istatistikleri genellikle kelimeleri sayar ve metindeki tekrar miktarını tahmin eder.
Dışa aktarma
Dışa Aktarma, metni ÇB'den harici bir metin dosyasına aktarır. İçe ve dışa aktarma ters olmalıdır.
Çevrimiçi işlevler
Çeviri yaparken, ÇB'nin temel amaçlarından biri, çevirmenin en iyisini seçebilmesi için bellekteki en yararlı eşleşmeleri almaktır. ÇB, kimlikleri ve farklılıkları gösteren hem kaynak hem de hedef metni göstermelidir.
Alma
Bir ÇB'den birkaç farklı eşleşme türü alınabilir.
- Tam eşleşme
- Geçerli kaynak segment ile depolanan arasındaki eşleşme karakter karakter eşleşme olduğunda tam eşleşmeler görünür. Bir cümleyi çevirirken, tam eşleşme, aynı cümlenin daha önce çevrildiği anlamına gelir. Tam eşleşmeler "%100 eşleşme" olarak da adlandırılır.
- Bağlam İçi Tam (ICE) eşleşme veya Garantili Eşleşme
- ICE eşleşmesi, tam olarak aynı bağlamda, yani bir paragrafta aynı yerde gerçekleşen tam eşleşmedir. Bağlam genellikle çevredeki cümleler ve belge dosya adı, tarih ve izinler gibi niteliklerle tanımlanır.
- Bulanık eşleşme
- Eşleşme tam olmadığında, "bulanık" bir eşleşmedir. Bazı sistemler bu tür eşleşmelere yüzdeler atar; bu durumda bir bulanık eşleşme %0'dan büyük ve %100'den küçüktür. Bu rakamlar, puanlama yöntemi belirtilmedikçe sistemler arasında karşılaştırılabilir değildir.
- Uyum
- Çevirmen kaynak segmentte bir veya daha fazla kelime seçtiğinde, sistem arama kriterleriyle eşleşen segment çiftlerini alır. Bu özellik, bir terminoloji veri tabanının yokluğunda terimlerin ve deyimlerin çevirilerini bulmak için yararlıdır.
Güncelleme
Bir ÇB, çevirmen tarafından kabul edildiğinde yeni bir çeviri ile güncellenir. Her zaman olduğu gibi, bir veritabanını güncellerken, veritabanının önceki içerikleriyle ne yapılacağı sorusu vardır. Bir ÇB, ÇB'deki girişleri değiştirerek veya silerek değiştirilebilir. Bazı sistemler, çevirmenlerin aynı kaynak segmentin birden çok çevirisini kaydetmesine izin verir.
Otomatik çeviri
Çeviri hafızası araçları genellikle otomatik alma ve değiştirme sağlar.
- Otomatik alma
- ÇB sistemleri aranır ve sonuçları, çevirmen bir belgede hareket ederken otomatik olarak görüntülenir.
- Otomatik ikame
- Otomatik değiştirme ile, bir belgenin yeni bir versiyonunun çevrilmesinde tam bir eşleşme ortaya çıkarsa, yazılım eski çeviriyi tekrarlayacaktır. Çevirmen, çeviriyi kaynakla karşılaştırmazsa, önceki çeviride yapılan bir hata tekrarlanır.
Ağ
Ağ oluşturma, bir çevirmen grubunun bir metni, her birinin ayrı ayrı çalıştığından daha hızlı bir şekilde birlikte çevirmesini sağlar, çünkü bir çevirmen tarafından çevrilen cümleler ve ifadeler diğerleri tarafından kullanılabilir. Ayrıca, çeviri bellekleri son çeviriden önce paylaşılırsa, bir çevirmenin yaptığı hataların diğer ekip üyeleri tarafından düzeltilmesi olasılığı vardır.
Metin belleği
"Metin belleği", önerilen Lisa OSCAR xml:TM standardının temelidir. Metin belleği, yazar belleği ve çeviri belleğinden oluşur.
Çeviri belleği
Benzersiz tanımlayıcılar çeviri sırasında hatırlanır, böylece hedef dil belgesi metin birimi düzeyinde 'tam' hizalanır. Kaynak belge sonradan değiştirilirse, değişmeyen metin birimleri, herhangi bir çevirmen etkileşimine gerek kalmadan doğrudan belgenin yeni hedef sürümüne aktarılabilir. Bu, çeviri belleğiyle 'tam' veya 'mükemmel' eşleşme kavramıdır. xml:TM, belge içi kaldıraçlı ve bulanık eşleştirme için mekanizmalar da sağlayabilir.
Tarih
1970'ler, bilim adamlarının bir ön keşif tartışması turu yürüttüğü ÇB sistemleri için emekleme aşamasıdır. ÇB sistemleri için orijinal fikir genellikle Martin Kay'in "Uygun Yer" makalesine, ancak ayrıntıları tam olarak verilmemiştir. Bu yazıda, depolama sisteminin temel kavramını göstermiştir: "Tercüman, sistemin mağazada ilgili olabilecek herhangi bir şeyi görüntülemesine neden olan bir komut vererek başlayabilir. . . . Devam etmeden önce, benzer malzeme içeren geçmiş ve gelecekteki metin parçalarını inceleyebilir". Kay'in bu gözlemi aslında Peter Arthern'in çevirmenlerin benzer, zaten tercüme edilmiş belgeleri çevrimiçi olarak kullanabileceği önerisinden etkilenmiştir. 1978 tarihli makalesinde bugün ÇB sistemleri dediğimiz şeyin tam olarak gösterilmesini sağladı: Herhangi bir yeni metin bir kelime işlem istasyonuna yazılacaktı ve bu metin yazılırken sistem bu metni daha önce depolanan metinlerle karşılaştıracaktı. [Avrupa Topluluğunun] diğer tüm resmi dillerine tercümesi ile birlikte hafızası. . . . Uygun makine çevirisine göre bir avantaj, bu şekilde alınan tüm pasajların dilbilgisi açısından doğru olmasıdır. Aslında, benim hesaplamalarıma göre, çevirmenlerin verimli bir şekilde çeviri üretmek için kullandıkları zamandan en az yüzde 15 tasarruf sağlayacak elektronik bir "kes ve yapıştır" süreci yürütüyor olmalıyız.
Fikir, ilk olarak Brigham Young Üniversitesi'nden araştırmacı tarafından geliştirilen ALPS (Otomatik Dil İşleme Sistemleri) Araçlarından birleştirildi ve o zamanlar ÇB sistemleri fikri, yalnızca eşleşen dizeleri bulmayı amaçlayan "Tekrar İşleme" adlı bir araçla karıştırıldı. Ancak uzun bir süre sonra, sözde çeviri belleği kavramı ortaya çıktı.
ÇB sistemlerinin gerçek keşif aşaması 1980'ler olacaktır. ÇB sisteminin ilk uygulamalarından biri Sadler ve Vendelmans'ın İki Dilli Bilgi Bankası'nda ortaya çıktı. İki Dilli Bilgi Bankası, biri diğerinin çevirisi olan ve çeviri birimlerinin tümceler arasında çapraz kodlandığı, sözdizimsel ve referanssal olarak yapılandırılmış bir bütünlük çiftidir. İki Dilli Bilgi Bankasının amacı, makine çevirisi ve bilgisayar destekli çeviri uygulamaları için derlemi tabanlı genel amaçlı bir bilgi kaynağı geliştirmektir (Sadler ve Vendelman, 1987). Bir diğer önemli adım ise Brian Harris tarafından "Bi-text" ile atıldı. Bi-text'i, Sadler'in İki Dilli Bilgi Bankası ile benzer yankılar uyandıran çeviri birimleri aracılığıyla çevirmenin etkinliği ile ilgili kaynak ve hedef metinleri "iki boyutta tek bir metin" (1988) olarak tanımlamıştır. Ve Harris'in çalışmasında, bu adı kullanmadan ÇB sistemi gibi bir şey önerdi: tek kelime veya "bütün çeviri birimi" ile aranabilen, eşleştirilmiş çevirilerden oluşan bir veri tabanı, ikinci durumda, aramanın özdeş birimler yerine benzerleri almasına izin verildi. .
ÇB teknolojisi ancak 1990'ların sonlarında geniş ölçekte ticari olarak kullanılabilir hale geldi, bu nedenle birkaç mühendis ve çevirmen tarafından yapılan çabalar. Unutulmaması gereken, Trados (günümüzde SDL Trados) adlı ilk ÇB aracıdır. Bu araçta, kaynak dosyayı açarken ve çeviri belleğini uygularken, metin içindeki herhangi bir "%100 eşleşme" (özdeş eşleşmeler) veya "bulanık eşleşmeler" (benzer, ancak aynı olmayan eşleşmeler) anında ayıklanır ve hedef dosya içine yerleştirilir. Ardından, çeviri belleği tarafından önerilen "eşleşmeler" kabul edilebilir veya yeni alternatiflerle geçersiz kılınabilir. Bir çeviri birimi manuel olarak güncellenirse, gelecekte kullanılmak üzere ve mevcut metinde tekrarlanmak üzere çeviri belleğinde saklanır. Benzer şekilde, hedef dosyadaki "eşleşme" olmayan tüm bölümler manuel olarak çevrilir ve ardından otomatik olarak çeviri belleğine eklenir.
2000'li yıllarda, çevrimiçi çeviri hizmetleri ÇB'yi dahil etmeye başladı. Google Translate gibi makine çevirisi hizmetleri ile Gengo ve Ackuna gibi siteler tarafından sağlanan profesyonel ve "hibrit" çeviri hizmetleri, diller arasında daha verimli bağlantılar kurmak için çevirmenler ve gönüllüler tarafından sağlanan ÇB verilerinin veritabanlarını birleştirir, son kullanıcılara daha hızlı çeviri hizmetleri sunar.
Son trendler
Yakın tarihli bir gelişme, çeviri belleğinin aksine 'metin belleği' (text memory) kavramıdır. Bu aynı zamanda önerilen LISA OSCAR standardının temelidir. xml:TM içindeki metin belleği, 'yazar belleği' ve 'çeviri belleği'nden oluşur. Yazar belleği, yazma döngüsü sırasında değişiklikleri takip etmek için kullanılır. Çeviri hafızası, çeviri hafızası eşleştirmesini uygulamak için yazar belleğindeki bilgileri kullanır. Öncelikle XML belgelerini hedeflese de, xml:TM, XLIFF biçimine dönüştürülebilen herhangi bir belgede kullanılabilir.
İkinci nesil çeviri hafızası
Birinci nesil ÇB sistemlerinden çok daha güçlüdürler, bir dilsel analiz motoru içerirler, segmentleri akıllı terminolojik gruplara ayırmak için yığın teknolojisini kullanırlar ve otomatik olarak belirli sözlükler oluştururlar.
İlgili standartlar
ÇBX
Translation Memory eXchange (ÇX), çeviri tedarikçileri arasında çeviri belleklerinin değişimini sağlayan bir standarttır. ÇBX, çeviri topluluğu tarafından çeviri belleklerini içe ve dışa aktarmanın en iyi yolu olarak benimsenmiştir.[] . Mevcut sürüm 1.4b'dir - orijinal kaynak ve hedef belgelerin ÇBX verilerinden yeniden oluşturulmasına izin verir.
TBX
TermBase eXchange . ISO 30042 olarak revize edilen ve yeniden yayınlanan bu LISA standardı, ayrıntılı sözlüksel bilgileri içeren terminoloji verilerinin değiş tokuşuna izin verir. TBX çerçevesi üç ISO standardı tarafından sağlanır: ISO 12620, ISO 12200 ve ISO 16642. ISO 12620, veri öğesi türleri veya önceden tanımlanmış değerler olarak işlev gören standart adlarla iyi tanımlanmış "veri kategorilerinin" bir envanterini sağlar. ISO 12200 (MARTIF olarak da bilinir), TBX'in temel yapısının temelini oluşturur. ISO 16642 (Terminolojik İşaretleme Çerçevesi olarak da bilinir), genel olarak Terminoloji İşaretleme Dilleri için yapısal bir meta-model içerir.
UTX
Universal Terminoloji eXchange (UTX) biçimi, makine çevirisinin kullanıcı sözlükleri için kullanılmak üzere özel olarak tasarlanmış bir standarttır, ancak genel, insan tarafından okunabilen sözlükler için kullanılabilir. UTX'in amacı, son derece basit ve pratik özelliği sayesinde sözlük paylaşımını ve yeniden kullanımını hızlandırmaktır.
SRX
Segmentation Rules eXchange (SRX), uygulamalar arasında değiş tokuş edilen çeviri belleği verilerinin daha etkin kullanılabilmesi için ÇBX standardını geliştirmeyi amaçlar. Önceki çeviride kullanılan segmentasyon kurallarını belirleme yeteneği, elde edilebilecek kaldıraçları artırabilir.
GMX
GILT Metrics. GILT, (Globalization, Internationalization, Localization, and Translation) anlamına gelir. GILT Metrics standardı üç bölümden oluşur: hacim ölçümleri için GMX-V, karmaşıklık ölçümleri için GMX-C ve kalite ölçümleri için GMX-Q. Önerilen GILT Metrikleri standardı, verilen herhangi bir GILT görevi için iş yükünü ve kalite gereksinimlerini ölçmekle görevlendirilmiştir.
OLIF
Open Lexicon Interchange Format. OLIF, terminolojik ve sözlüksel verilerin değişimi için açık, XML uyumlu bir standarttır. Başlangıçta tescilli makine çevirisi sözlükleri arasında sözlüksel veri alışverişi için bir araç olarak tasarlanmasına rağmen, terminoloji alışverişi için daha genel bir standart haline geldi.
XLIFF
XML Localisation Interchange File Format (XLIFF), herhangi bir yerelleştirme sağlayıcısı tarafından anlaşılabilen tek bir değişim dosyası biçimi sağlamayı amaçlamaktadır. XLIFF, çeviri endüstrisinde XML formatında veri alışverişi için tercih edilen yoludur.
TransWS
Translation Web Services. TransWS, yerelleştirme projeleriyle ilgili dosya ve mesajların gönderilmesi ve alınması için Web hizmetlerini kullanmak için gereken çağrıları belirtir. Web Hizmetlerinin kullanımıyla mevcut yerelleştirme sürecinin çoğunun otomasyonu için ayrıntılı bir çerçeve olarak tasarlanmıştır.
xml:TM
Çeviri belleğine xml:TM (XML tabanlı Metin Belleği) yaklaşımı, yazar ve çeviri belleğinden oluşan metin belleği kavramına dayanır. xml:ÇB, XML-INTL tarafından Lisa OSCAR'a bağışlanmıştır.
PO
Gettext Portable Object format. Genellikle bir çeviri belleği formatı olarak kabul edilmese de, Gettext PO dosyaları, çeviri belleklerinde olduğu gibi çeviri belleği süreçlerinde de kullanılan iki dilli dosyalardır. Tipik olarak, bir PO çeviri belleği sistemi, bir dizin ağacı yapısındaki çeşitli ayrı dosyalardan oluşacaktır. PO dosyalarıyla çalışan yaygın araçlar arasında GNU Gettext Tools ve Translate Toolkit bulunur. PO dosyalarını yalnızca kaynak metin dosyalarıymış gibi düzenleyen çeşitli araçlar ve programlar da mevcuttur.
Ayrıca bakınız
- Bilgisayar destekli çeviri araçlarının karşılaştırılması
- Çeviri yazılımı listesi
- Tercüme
- Text corpus
- Bilgisayar destekli inceleme
- Çeviri yazılımı
- Paralel metin
- Çevrimiçi iki dilli uyum
Kaynakça
- ^ a b Elina Lagoudaki (2006), "Translation Memory systems: Enlightening users' perspective. Key finding of the TM Survey 2006 carried out during July and August 2006. (Imperial College London, Translation Memories Survey 2006), p.16 (PDF). 25 Mart 2007 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 25 Mart 2007.
- ^ Kay (March 1997). "The Proper Place of Men and Machines in Language Translation". Machine Translation. 12 (1–2): 3-23. doi:10.1023/A:1007911416676.
- ^ Arthern (1978). (PDF). Translating and the Computer: Proceedings of a Seminar, London, 14th November, 1978. ISBN . 19 Ağustos 2019 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 7 Ekim 2022.
- ^ Google's AI translation tool seems to have invented its own secret internal language 7 Ekim 2022 tarihinde Wayback Machine sitesinde . Devin Coldewey, TechCrunch, November 22, 2016
- ^ "Translating XML Documents with xml:tm". 6 Kasım 2020 tarihinde kaynağından . Erişim tarihi: 7 Ekim 2022.
- ^ "xml:tm". 6 Kasım 2020 tarihinde kaynağından . Erişim tarihi: 7 Ekim 2022.
- ^ "XLIFF". 26 Nisan 2021 tarihinde kaynağından . Erişim tarihi: 7 Ekim 2022.
- ^ "Open Lexicon Interchange Format". 24 Mart 2021 tarihinde kaynağından . Erişim tarihi: 7 Ekim 2022.
- ^ . www.oasis-open.org. 19 Haziran 2006 tarihinde kaynağından arşivlendi. Erişim tarihi: 29 Ocak 2021.
- ^ O’Hagan, Minako, (Ed.) (23 Ağustos 2019), "XML for translation technology", The Routledge Handbook of Translation and Technology, 1 (İngilizce), Abingdon, Oxon: Routledge, ss. 45-60, doi:10.4324/9781315311258-3, ISBN , erişim tarihi: 29 Ocak 2021 Yazar
|ad1=
eksik|soyadı1=
() - ^ "XML Localisation Interchange File Format". 26 Nisan 2021 tarihinde kaynağından . Erişim tarihi: 7 Ekim 2022.
- ^ "Translation Web Services". 4 Aralık 2020 tarihinde kaynağından . Erişim tarihi: 7 Ekim 2022.
- ^ Andrzej Zydroń (August 2008). . CIDM Information Management News. 17 Mayıs 2013 tarihinde kaynağından arşivlendi. Erişim tarihi: 30 Mart 2013.
At the core of xml:tm are the following concepts which together make up 'Text Memory': Author Memory and Translation Memory.
İleri okumalar
- Dragsted, Barbara. (2004). Segmentation in translation and translation memory systems: An empirical investigation of cognitive segmentation and effects of integrating a ÇB system into the translation process. Copenhagen: Samfundslitteratur. 369 p.
- Heyn, Matthias. (1998). “Translation memories: Insights and prospects”. In: Lynne Bowker; et al. (eds.), Unity in diversity? Current trends in translation studies. Manchester: St. Jerome. P. 123–136.
- Martín-Mor, Adrià (2011), La interferència lingüística en entorns de Traducció Assistida per Ordinador: Recerca empíricoexperimental. Bellaterra: Universitat Autònoma de Barcelona. URL: http://www.tdx.cat/handle/10803/83987.
- O’Hagan, Minako. (2009). “Computer-aided translation (CAT)”. In: Mona Baker & Gabriela Saldanha (eds.), Routledge encyclopedia of translation studies. London: Routledge. P. 48–51.
- Pym, Anthony (2013). Translation Skill-Sets in a Machine-Translation Age. Meta: Translators' Journal, 58 (3), p. 487-503. URL: http://id.erudit.org/iderudit/1025047ar
Dış bağlantılar
- Çeviri anıları 21 Ekim 2008 tarihinde Wayback Machine sitesinde .
- Çeviri belleklerini kıyaslama 16 Haziran 2008 tarihinde Wayback Machine sitesinde .
- Web Tabanlı Çeviri Belleğinde Güç Kaymaları
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Ceviri bellegi CB veya Ceviri hafizasi CB insan cevirmenlere yardimci olmak icin daha once cevrilmis cumleler paragraflar veya cumle benzeri birimler basliklar basliklar veya bir listedeki ogeler olabilen segmentleri depolayan bir veritabanidir Ceviri bellegi kaynak metni ve karsilik gelen cevirisini ceviri birimleri adi verilen dil ciftlerinde saklar Bireysel kelimeler terminoloji temelleri tarafindan ele alinir ve CB nin alani icinde degildir Ceviri hafizasini kullanan yazilim programlari bazen ceviri hafizasi yoneticileri CBY veya ceviri hafizasi sistemleri CB sistemleri ceviri surecini yonetmeye odaklanan baska bir yazilim turu olan Ceviri yonetim sistemi CYS ile karistirilmamalidir olarak bilinir Ceviri hafizalari tipik olarak ozel bir bilgisayar destekli ceviri BDC araci kelime islem programi terminoloji yonetim sistemleri cok dilli sozluk ve hatta ham makine cevirisi ciktisi ile birlikte kullanilir Arastirmalar cok dilli belgeler ureten bircok sirketin ceviri hafizasi sistemlerini kullandigini gosteriyor 2006 da dil uzmanlariyla yapilan bir ankette 874 yanitin 82 5 i CB kullanimini dogruladi CB kullanimi teknik terimler ve basit cumle yapisi teknik daha dusuk derecede pazarlama ve finansal bilgi islem becerileri ve icerigin tekrarlanabilirligi ile karakterize edilen metin turuyle iliskilidir Ceviri hafizasini kullanmaProgram kaynak metni cevrilecek metni bolumlere ayirir bolumler arasindaki eslesmeleri ve bir ceviri hafizasinda depolanan daha once cevrilmis kaynak hedef ciftlerinin kaynak yarisi arasindaki eslesmeleri arar ve bu eslesme ciftlerini ceviri tam ve veya kismi eslesmeler olarak sunar Cevirmen bir eslesmeyi kabul edebilir yeni bir ceviriyle degistirebilir veya kaynaga uyacak sekilde degistirebilir Son iki durumda yeni veya degistirilmis ceviri veritabanina gider Bazi ceviri hafizasi sistemleri yalnizca 100 eslesme arar yani yalnizca veri tabanindaki girislerle tam olarak eslesen metin bolumlerini alabilirken digerleri cevirmene isaretli farkliliklarla sunulan benzer bolumleri almak icin bulanik eslestirme algoritmalari kullanir Tipik ceviri hafizasi sistemlerinin yalnizca kaynak bolumdeki metni aradigina dikkat etmek onemlidir Eslestirme algoritmasinin esnekligi ve saglamligi ceviri hafizasinin performansini buyuk olcude belirler ancak bazi uygulamalar icin tam eslesmelerin geri cagirma orani 100 eslesme yaklasimini hakli cikarmaya yetecek kadar yuksek olabilir Eslesmenin bulunmadigi bolumlerin cevirmen tarafindan manuel olarak cevrilmesi gerekecektir Bu yeni cevrilen bolumler gelecekteki ceviriler icin ve ayni zamanda o bolumun mevcut metindeki tekrarlari icin kullanilabilecekleri veritabaninda saklanir Ceviri hafizasi teknik kilavuzlar gibi cok tekrarli metinlerde en iyi sonucu verir Ayrica ornegin bir kullanim kilavuzunun yeni bir surumundeki kucuk degisikliklere karsilik gelen daha once cevrilmis bir belgedeki artimli degisiklikleri cevirmek icin de yararlidirlar Geleneksel olarak ceviri hafizasi kullanilan dilde cok az tekrar olmasi gibi basit bir nedenle edebi veya yaratici metinler icin uygun gorulmemektedir Bununla birlikte digerleri onlari tekrar eCBeyen metinler icin bile degerli buluyor cunku olusturulan veritabani kaynaklari terimlerin uygun kullanimini belirlemek icin uygunluk arastirmalari kalite guvencesi bos bolumler yok ve inceleme surecinin basitlestirilmesi kaynak ve cevirmenler geleneksel bir inceleme ortaminda iki belgeyle calismak zorundayken hedef segment her zaman birlikte goruntulenir Ana faydalar Ceviri hafizasi yoneticileri teknik belgeleri ve ozel sozlukler iceren belgeleri cevirmek icin en uygun olanlardir Avantajlari sunlardir Belgenin tamamen tercume edilmesini saglamak ceviri hafizalari bos hedef segmentleri kabul eCBez Ortak tanimlar ifadeler ve terminoloji dahil olmak uzere tercume edilen belgelerin tutarli olmasini saglamak Bu farkli cevirmenler tek bir proje uzerinde calisirken onemlidir Cevirmenlerin genellikle bu bicimleri islemek icin gereken yazilima sahip olmak zorunda kalmadan cok cesitli bicimlerdeki belgeleri cevirmesine olanak tanir Genel ceviri surecini hizlandirmak Ceviri bellekleri daha once cevrilmis materyali hatirladigindan cevirmenlerin onu yalnizca bir kez cevirmesi gerekir Uzun vadeli ceviri projelerinin maliyetlerinin dusurulmesi ornegin kilavuz metinleri uyari mesajlari veya belge dizileri yalnizca bir kez cevrilmelidir ve birkac kez kullanilabilir Buyuk dokumantasyon projeleri icin bir CB paketinin kullanimi sayesinde zaman veya para olarak tasarruf yeni bir projenin ilk cevirisi icin bile zaten belirgin olabilir ancak normalde bu tur tasarruflar yalnizca onceden yapilmis bir projenin sonraki surumlerinin cevirisi sirasinda gorulur ceviri bellegini kullanmadan once cevrildi Ana engeller Ceviri bellegi yoneticilerinin daha genis kullanimini engelleyen baslica sorunlar sunlardir Ceviri bellekleri kavrami onceki cevirilerde kullanilan cumlelerin geri donusturulebilecegi onculune dayanmaktadir Bununla birlikte cevirinin yol gosterici bir ilkesi cevirmenin metnin bilesenlerini degil metnin mesajini cevirmesi gerektigidir Ceviri bellegi yoneticileri mevcut ceviri veya yerellestirme sureclerine kolayca uymazlar CB teknolojisinden yararlanmak icin ceviri surecleri yeniden tasarlanmalidir Ceviri bellegi yoneticileri su anda tum belge bicimlerini desteklememektedir ve tum dosya turlerini desteklemek icin filtreler mevcut olmayabilir Ceviri bellegi yoneticilerinin kullanilmasiyla ilgili bir ogrenme egrisi vardir ve programlar en yuksek etkinlik icin ozellestirilmelidir Tercume surecinin tamaminin veya bir kisminin disaridan temin edildigi veya saha disinda calisan serbest cevirmenler tarafindan yurutuldugu durumlarda saha disindaki calisanlar ceviri bellegi yoneticisi tarafindan olusturulan metinlerle calisabilmek icin ozel araclara ihtiyac duyarlar Bircok ceviri bellegi yoneticisinin tam surumleri koltuk basina 500 ABD Dolari ile 2 500 ABD Dolari arasinda olabilir ve bu da onemli bir yatirimi temsil edebilir ancak daha dusuk maliyetli programlar da mevcuttur Bununla birlikte bazi gelistiriciler bireysel cevirmenlerin bu araclarin tam surumleriyle olusturulmus projeler uzerinde calismak icin kullanabilecegi azaltilmis ozellik setleriyle araclarinin ucretsiz veya dusuk maliyetli surumlerini uretir Ucretsiz ve shareware CB paketleri oldugunu unutmayin ancak bunlarin hicbiri henuz buyuk bir pazar payi kazanmamistir Kullanicinin gecmis cevirilerini ceviri bellegi veritabanina aktarma egitim ve herhangi bir ek urunle ilgili maliyetler de onemli bir yatirimi temsil edebilir Ceviri bellegi veritabanlarinin bakimi cogu durumda hala manuel bir islem olma egilimindedir ve bunlarin bakiminin yapilmamasi CB eslesmelerinin kullanilabilirliginin ve kalitesinin onemli olcude azalmasina neden olabilir Daha once belirtildigi gibi ceviri bellegi yoneticileri dahili tekrari olmayan veya revizyonlar arasinda degismeyen kisimlar icermeyen metinler icin uygun olmayabilir Teknik metinler genellikle ceviri bellegi icin en uygun olanidir pazarlama veya yaratici metinler ise daha az uygun olacaktir Kalite uzerindeki etkiler CB sistemlerinin kullanilmasi tercume edilen metinlerin kalitesi uzerinde etkili olabilir Ana etkisi acikca hata yayilimi ile ilgilidir belirli bir bolumun cevirisi yanlissa aslinda yanlis cevirinin ayni kaynak metin veya benzer bir sonraki sefer tekrar kullanilmasi daha olasidir kaynak metin cevrilir boylece hata devam eder Geleneksel olarak cevrilmis metinlerin kalitesi uzerinde iki ana etki tanimlanmistir cumle salata etkisi Bedard 2000 O Hagan 2009 50 de aktarilmistir ve gozetleme deligi etkisi Heyn 1998 Ilki bir metin farkli tarzlarda farkli cevirmenler tarafindan cevrilmis olan bir CB dan alinan cumleler kullanilarak cevrildiginde metin duzeyinde tutarlilik eksikligine atifta bulunur Ikincisine gore cevirmenler metin ici referanslar icermemeleri icin usluplarini CB sisteminin kullanimina uyarlayabilirler boylece bolumler gelecekteki metinlerde daha iyi kullanilabilir boylece bagdasiklik ve okunabilirlik etkilenir O Hagan 2009 Cevrilen metin uzerinde potansiyel ve varsa muhtemelen bilincsiz bir etki vardir Farkli diller bir cumle icindeki mantiksal ogeler icin farkli siralar kullanir ve yarisi cevrilmis cok yan tumceli bir cumleyle sunulan bir cevirmenin bir cumleyi tamamen yeniden olusturma olasiligi daha dusuktur Tutarli ampirik kanitlar Martin Mor 2011 cevirmenlerin bir CB sistemi yerine bir metin islemcisi ile calisirken cok yan tumceli bir cumlenin yapisini buyuk olasilikla degistireceklerini gostermektedir Ayrica cevirmenin her bir cumlenin etrafindakilerle ve bir butun olarak metinle nasil bir iliski kurduguna odaklanmak yerine metni cumle cumle mekanik olarak ele alma potansiyeli de vardir Arastirmacilar Dragsted 2004 bu programlarin otomatik bolumleme ozelligi ile ilgili olan bu etkiyi tanimladilar ancak bunun cevirilerin kalitesi uzerinde mutlaka olumsuz bir etkisi olmasi gerekmiyor Bu etkilerin araca ozgu olmaktan ziyade egitimle yakindan iliskili oldugunu unutmayin Martin Mor a 2011 gore CB sistemlerinin kullanilmasi ozellikle yeni baslayanlar icin cevrilen metinlerin kalitesi uzerinde bir etkiye sahiptir ancak deneyimli cevirmenler bundan kacinabilir Pym 2013 CB MC kullanan cevirmenlerin ilerledikce her bolumu revize etme egiliminde oldugunu ve sonunda tum metnin nihai bir revizyonu icin cok az zaman tanidigini hatirlatir bu aslinda burada aciklanan etkilerin bazi sorunlarin nihai nedeni olabilir Ceviri hafizasi sistemleri turleriMasaustu Masaustu ceviri hafizasi araclari genellikle bireysel cevirmenlerin cevirileri tamamlamak icin kullandigi araclardir Serbest cevirmenlerin masaustu bilgisayarina indirip yukledigi programlardir Sunucu tabanli veya merkezilestirilmis Merkezilestirilmis ceviri bellegi sistemleri CB yi merkezi bir sunucuda depolar Masaustu CB ile birlikte calisirlar ve CB eslesme oranlarini yalnizca masaustu CB ile elde edilen CB kaldiracindan 30 60 daha fazla artirabilirler IslevlerAsagida bir ceviri hafizasinin ana islevlerinin bir ozeti yer almaktadir Cevrimdisi islevler Ice aktarma Bu islev bir metni ve cevirisini bir metin dosyasindan CB ye aktarmak icin kullanilir Ice aktarma cevirisiyle birlikte bir CB ye ice aktarmak icin harici bir kaynak metnin mevcut oldugu bir ham bicimden yapilabilir Bazen metinlerin kullanici tarafindan yeniden islenmesi gerekir Ice aktarma icin kullanilabilecek baska bir bicim daha vardir yerel bicim Bu bicim ceviri belleklerini bir dosyaya kaydeCBek icin CB yi kullanan bicimdir Analiz Analiz sureci asagidaki adimlari icerir Metinsel ayristirma Ornegin bir cumlenin sonundaki nokta ile kisaltmadaki nokta arasindaki farki ayirt edebilmek icin noktalama isaretlerini dogru tanimak cok onemlidir Bu nedenle isaretleme bir tur on duzenlemedir Genellikle cevirmenlerin yardim programlari araciligiyla islenen materyaller ceviri asamasi cok dilli bir belge uretim hattina gomulu oldugundan isaretleme icerir Diger ozel metin ogeleri isaretleme ile ayrilabilir Ozel adlar ve kodlar gibi cevrilmesi gerekmeyen ozel ogeler bulunurken digerlerinin yerel bicime donusturulmesi gerekebilir Dilsel ayristirma Temel form indirgemesi bir terim bankasindan terimlerin otomatik olarak alinmasi icin kelime listeleri ve bir metin hazirlamak icin kullanilir Ote yandan bir kaynak metinden cok kelimeli terimleri veya deyimleri cikarmak icin sozdizimsel ayristirma kullanilabilir Bu nedenle ayristirma deyimbilimin kelime sirasi varyasyonunu normallestirmek icin kullanilir bu hangi kelimelerin bir cumle olusturabilecegidir Segmentasyon Amaci en kullanisli ceviri birimlerini secmektir Segmentasyon bir tur ayristirma gibidir Yuzeysel ayristirma kullanilarak tek dilli olarak yapilir ve hizalama segmentasyona dayanir Cevirmenler segmentasyonlari manuel olarak duzeltirse program kendi hatalarini tekrarlayacagindan belgenin sonraki surumleri duzeltilmis segmentasyona dayali olarak CB ile eslesme bulamaz Cevirmenler genellikle cumle cumle ilerler ancak bir cumlenin cevirisi cevredekilerin cevirisine bagli olabilir Hizalama Kaynak ve hedef metinler arasindaki ceviri yazismalarini tanimlama gorevidir Hizalamadan segmentasyona geri bildirim olmali ve iyi bir hizalama algoritmasi ilk segmentasyonu duzeltebilmelidir Terim cikarma Girdi olarak onceki bir sozluge sahip olabilir Ayrica bilinmeyen terimleri ayiklarken metin istatistiklerine dayali ayristirmayi kullanabilir Bunlar bir ceviri isinde yer alan is miktarini tahmin etmek icin kullanilir Bu isi planlamak ve programlamak icin cok yararlidir Ceviri istatistikleri genellikle kelimeleri sayar ve metindeki tekrar miktarini tahmin eder Disa aktarma Disa Aktarma metni CB den harici bir metin dosyasina aktarir Ice ve disa aktarma ters olmalidir Cevrimici islevler Ceviri yaparken CB nin temel amaclarindan biri cevirmenin en iyisini secebilmesi icin bellekteki en yararli eslesmeleri almaktir CB kimlikleri ve farkliliklari gosteren hem kaynak hem de hedef metni gostermelidir Alma Bir CB den birkac farkli eslesme turu alinabilir Tam eslesme Gecerli kaynak segment ile depolanan arasindaki eslesme karakter karakter eslesme oldugunda tam eslesmeler gorunur Bir cumleyi cevirirken tam eslesme ayni cumlenin daha once cevrildigi anlamina gelir Tam eslesmeler 100 eslesme olarak da adlandirilir Baglam Ici Tam ICE eslesme veya Garantili Eslesme ICE eslesmesi tam olarak ayni baglamda yani bir paragrafta ayni yerde gerceklesen tam eslesmedir Baglam genellikle cevredeki cumleler ve belge dosya adi tarih ve izinler gibi niteliklerle tanimlanir Bulanik eslesme Eslesme tam olmadiginda bulanik bir eslesmedir Bazi sistemler bu tur eslesmelere yuzdeler atar bu durumda bir bulanik eslesme 0 dan buyuk ve 100 den kucuktur Bu rakamlar puanlama yontemi belirtilmedikce sistemler arasinda karsilastirilabilir degildir Uyum Cevirmen kaynak segmentte bir veya daha fazla kelime sectiginde sistem arama kriterleriyle eslesen segment ciftlerini alir Bu ozellik bir terminoloji veri tabaninin yoklugunda terimlerin ve deyimlerin cevirilerini bulmak icin yararlidir Guncelleme Bir CB cevirmen tarafindan kabul edildiginde yeni bir ceviri ile guncellenir Her zaman oldugu gibi bir veritabanini guncellerken veritabaninin onceki icerikleriyle ne yapilacagi sorusu vardir Bir CB CB deki girisleri degistirerek veya silerek degistirilebilir Bazi sistemler cevirmenlerin ayni kaynak segmentin birden cok cevirisini kaydetmesine izin verir Otomatik ceviri Ceviri hafizasi araclari genellikle otomatik alma ve degistirme saglar Otomatik alma CB sistemleri aranir ve sonuclari cevirmen bir belgede hareket ederken otomatik olarak goruntulenir Otomatik ikame Otomatik degistirme ile bir belgenin yeni bir versiyonunun cevrilmesinde tam bir eslesme ortaya cikarsa yazilim eski ceviriyi tekrarlayacaktir Cevirmen ceviriyi kaynakla karsilastirmazsa onceki ceviride yapilan bir hata tekrarlanir Ag Ag olusturma bir cevirmen grubunun bir metni her birinin ayri ayri calistigindan daha hizli bir sekilde birlikte cevirmesini saglar cunku bir cevirmen tarafindan cevrilen cumleler ve ifadeler digerleri tarafindan kullanilabilir Ayrica ceviri bellekleri son ceviriden once paylasilirsa bir cevirmenin yaptigi hatalarin diger ekip uyeleri tarafindan duzeltilmesi olasiligi vardir Metin bellegi Metin bellegi onerilen Lisa OSCAR xml TM standardinin temelidir Metin bellegi yazar bellegi ve ceviri belleginden olusur Ceviri bellegi Benzersiz tanimlayicilar ceviri sirasinda hatirlanir boylece hedef dil belgesi metin birimi duzeyinde tam hizalanir Kaynak belge sonradan degistirilirse degismeyen metin birimleri herhangi bir cevirmen etkilesimine gerek kalmadan dogrudan belgenin yeni hedef surumune aktarilabilir Bu ceviri bellegiyle tam veya mukemmel eslesme kavramidir xml TM belge ici kaldiracli ve bulanik eslestirme icin mekanizmalar da saglayabilir Tarih1970 ler bilim adamlarinin bir on kesif tartismasi turu yuruttugu CB sistemleri icin emekleme asamasidir CB sistemleri icin orijinal fikir genellikle Martin Kay in Uygun Yer makalesine ancak ayrintilari tam olarak verilmemistir Bu yazida depolama sisteminin temel kavramini gostermistir Tercuman sistemin magazada ilgili olabilecek herhangi bir seyi goruntulemesine neden olan bir komut vererek baslayabilir Devam etmeden once benzer malzeme iceren gecmis ve gelecekteki metin parcalarini inceleyebilir Kay in bu gozlemi aslinda Peter Arthern in cevirmenlerin benzer zaten tercume edilmis belgeleri cevrimici olarak kullanabilecegi onerisinden etkilenmistir 1978 tarihli makalesinde bugun CB sistemleri dedigimiz seyin tam olarak gosterilmesini sagladi Herhangi bir yeni metin bir kelime islem istasyonuna yazilacakti ve bu metin yazilirken sistem bu metni daha once depolanan metinlerle karsilastiracakti Avrupa Toplulugunun diger tum resmi dillerine tercumesi ile birlikte hafizasi Uygun makine cevirisine gore bir avantaj bu sekilde alinan tum pasajlarin dilbilgisi acisindan dogru olmasidir Aslinda benim hesaplamalarima gore cevirmenlerin verimli bir sekilde ceviri uretmek icin kullandiklari zamandan en az yuzde 15 tasarruf saglayacak elektronik bir kes ve yapistir sureci yurutuyor olmaliyiz Fikir ilk olarak Brigham Young Universitesi nden arastirmaci tarafindan gelistirilen ALPS Otomatik Dil Isleme Sistemleri Araclarindan birlestirildi ve o zamanlar CB sistemleri fikri yalnizca eslesen dizeleri bulmayi amaclayan Tekrar Isleme adli bir aracla karistirildi Ancak uzun bir sure sonra sozde ceviri bellegi kavrami ortaya cikti CB sistemlerinin gercek kesif asamasi 1980 ler olacaktir CB sisteminin ilk uygulamalarindan biri Sadler ve Vendelmans in Iki Dilli Bilgi Bankasi nda ortaya cikti Iki Dilli Bilgi Bankasi biri digerinin cevirisi olan ve ceviri birimlerinin tumceler arasinda capraz kodlandigi sozdizimsel ve referanssal olarak yapilandirilmis bir butunluk ciftidir Iki Dilli Bilgi Bankasinin amaci makine cevirisi ve bilgisayar destekli ceviri uygulamalari icin derlemi tabanli genel amacli bir bilgi kaynagi gelistirmektir Sadler ve Vendelman 1987 Bir diger onemli adim ise Brian Harris tarafindan Bi text ile atildi Bi text i Sadler in Iki Dilli Bilgi Bankasi ile benzer yankilar uyandiran ceviri birimleri araciligiyla cevirmenin etkinligi ile ilgili kaynak ve hedef metinleri iki boyutta tek bir metin 1988 olarak tanimlamistir Ve Harris in calismasinda bu adi kullanmadan CB sistemi gibi bir sey onerdi tek kelime veya butun ceviri birimi ile aranabilen eslestirilmis cevirilerden olusan bir veri tabani ikinci durumda aramanin ozdes birimler yerine benzerleri almasina izin verildi CB teknolojisi ancak 1990 larin sonlarinda genis olcekte ticari olarak kullanilabilir hale geldi bu nedenle birkac muhendis ve cevirmen tarafindan yapilan cabalar Unutulmamasi gereken Trados gunumuzde SDL Trados adli ilk CB aracidir Bu aracta kaynak dosyayi acarken ve ceviri bellegini uygularken metin icindeki herhangi bir 100 eslesme ozdes eslesmeler veya bulanik eslesmeler benzer ancak ayni olmayan eslesmeler aninda ayiklanir ve hedef dosya icine yerlestirilir Ardindan ceviri bellegi tarafindan onerilen eslesmeler kabul edilebilir veya yeni alternatiflerle gecersiz kilinabilir Bir ceviri birimi manuel olarak guncellenirse gelecekte kullanilmak uzere ve mevcut metinde tekrarlanmak uzere ceviri belleginde saklanir Benzer sekilde hedef dosyadaki eslesme olmayan tum bolumler manuel olarak cevrilir ve ardindan otomatik olarak ceviri bellegine eklenir 2000 li yillarda cevrimici ceviri hizmetleri CB yi dahil etmeye basladi Google Translate gibi makine cevirisi hizmetleri ile Gengo ve Ackuna gibi siteler tarafindan saglanan profesyonel ve hibrit ceviri hizmetleri diller arasinda daha verimli baglantilar kurmak icin cevirmenler ve gonulluler tarafindan saglanan CB verilerinin veritabanlarini birlestirir son kullanicilara daha hizli ceviri hizmetleri sunar Son trendlerYakin tarihli bir gelisme ceviri belleginin aksine metin bellegi text memory kavramidir Bu ayni zamanda onerilen LISA OSCAR standardinin temelidir xml TM icindeki metin bellegi yazar bellegi ve ceviri bellegi nden olusur Yazar bellegi yazma dongusu sirasinda degisiklikleri takip etmek icin kullanilir Ceviri hafizasi ceviri hafizasi eslestirmesini uygulamak icin yazar bellegindeki bilgileri kullanir Oncelikle XML belgelerini hedeflese de xml TM XLIFF bicimine donusturulebilen herhangi bir belgede kullanilabilir Ikinci nesil ceviri hafizasi Birinci nesil CB sistemlerinden cok daha gucludurler bir dilsel analiz motoru icerirler segmentleri akilli terminolojik gruplara ayirmak icin yigin teknolojisini kullanirlar ve otomatik olarak belirli sozlukler olustururlar Ilgili standartlarCBX Translation Memory eXchange CX ceviri tedarikcileri arasinda ceviri belleklerinin degisimini saglayan bir standarttir CBX ceviri toplulugu tarafindan ceviri belleklerini ice ve disa aktarmanin en iyi yolu olarak benimsenmistir kaynak belirtilmeli Mevcut surum 1 4b dir orijinal kaynak ve hedef belgelerin CBX verilerinden yeniden olusturulmasina izin verir TBX TermBase eXchange ISO 30042 olarak revize edilen ve yeniden yayinlanan bu LISA standardi ayrintili sozluksel bilgileri iceren terminoloji verilerinin degis tokusuna izin verir TBX cercevesi uc ISO standardi tarafindan saglanir ISO 12620 ISO 12200 ve ISO 16642 ISO 12620 veri ogesi turleri veya onceden tanimlanmis degerler olarak islev goren standart adlarla iyi tanimlanmis veri kategorilerinin bir envanterini saglar ISO 12200 MARTIF olarak da bilinir TBX in temel yapisinin temelini olusturur ISO 16642 Terminolojik Isaretleme Cercevesi olarak da bilinir genel olarak Terminoloji Isaretleme Dilleri icin yapisal bir meta model icerir UTX Universal Terminoloji eXchange UTX bicimi makine cevirisinin kullanici sozlukleri icin kullanilmak uzere ozel olarak tasarlanmis bir standarttir ancak genel insan tarafindan okunabilen sozlukler icin kullanilabilir UTX in amaci son derece basit ve pratik ozelligi sayesinde sozluk paylasimini ve yeniden kullanimini hizlandirmaktir SRX Segmentation Rules eXchange SRX uygulamalar arasinda degis tokus edilen ceviri bellegi verilerinin daha etkin kullanilabilmesi icin CBX standardini gelistirmeyi amaclar Onceki ceviride kullanilan segmentasyon kurallarini belirleme yetenegi elde edilebilecek kaldiraclari artirabilir GMX GILT Metrics GILT Globalization Internationalization Localization and Translation anlamina gelir GILT Metrics standardi uc bolumden olusur hacim olcumleri icin GMX V karmasiklik olcumleri icin GMX C ve kalite olcumleri icin GMX Q Onerilen GILT Metrikleri standardi verilen herhangi bir GILT gorevi icin is yukunu ve kalite gereksinimlerini olcmekle gorevlendirilmistir OLIF Open Lexicon Interchange Format OLIF terminolojik ve sozluksel verilerin degisimi icin acik XML uyumlu bir standarttir Baslangicta tescilli makine cevirisi sozlukleri arasinda sozluksel veri alisverisi icin bir arac olarak tasarlanmasina ragmen terminoloji alisverisi icin daha genel bir standart haline geldi XLIFF XML Localisation Interchange File Format XLIFF herhangi bir yerellestirme saglayicisi tarafindan anlasilabilen tek bir degisim dosyasi bicimi saglamayi amaclamaktadir XLIFF ceviri endustrisinde XML formatinda veri alisverisi icin tercih edilen yoludur TransWS Translation Web Services TransWS yerellestirme projeleriyle ilgili dosya ve mesajlarin gonderilmesi ve alinmasi icin Web hizmetlerini kullanmak icin gereken cagrilari belirtir Web Hizmetlerinin kullanimiyla mevcut yerellestirme surecinin cogunun otomasyonu icin ayrintili bir cerceve olarak tasarlanmistir xml TM Ceviri bellegine xml TM XML tabanli Metin Bellegi yaklasimi yazar ve ceviri belleginden olusan metin bellegi kavramina dayanir xml CB XML INTL tarafindan Lisa OSCAR a bagislanmistir PO Gettext Portable Object format Genellikle bir ceviri bellegi formati olarak kabul edilmese de Gettext PO dosyalari ceviri belleklerinde oldugu gibi ceviri bellegi sureclerinde de kullanilan iki dilli dosyalardir Tipik olarak bir PO ceviri bellegi sistemi bir dizin agaci yapisindaki cesitli ayri dosyalardan olusacaktir PO dosyalariyla calisan yaygin araclar arasinda GNU Gettext Tools ve Translate Toolkit bulunur PO dosyalarini yalnizca kaynak metin dosyalariymis gibi duzenleyen cesitli araclar ve programlar da mevcuttur Ayrica bakinizBilgisayar destekli ceviri araclarinin karsilastirilmasi Ceviri yazilimi listesi Tercume Text corpus Bilgisayar destekli inceleme Ceviri yazilimi Paralel metin Cevrimici iki dilli uyumKaynakca a b Elina Lagoudaki 2006 Translation Memory systems Enlightening users perspective Key finding of the TM Survey 2006 carried out during July and August 2006 Imperial College London Translation Memories Survey 2006 p 16 PDF 25 Mart 2007 tarihinde kaynagindan PDF arsivlendi Erisim tarihi 25 Mart 2007 Kay March 1997 The Proper Place of Men and Machines in Language Translation Machine Translation 12 1 2 3 23 doi 10 1023 A 1007911416676 Arthern 1978 PDF Translating and the Computer Proceedings of a Seminar London 14th November 1978 ISBN 0444853022 19 Agustos 2019 tarihinde kaynagindan PDF arsivlendi Erisim tarihi 7 Ekim 2022 Google s AI translation tool seems to have invented its own secret internal language 7 Ekim 2022 tarihinde Wayback Machine sitesinde Devin Coldewey TechCrunch November 22 2016 Translating XML Documents with xml tm 6 Kasim 2020 tarihinde kaynagindan Erisim tarihi 7 Ekim 2022 xml tm 6 Kasim 2020 tarihinde kaynagindan Erisim tarihi 7 Ekim 2022 XLIFF 26 Nisan 2021 tarihinde kaynagindan Erisim tarihi 7 Ekim 2022 Open Lexicon Interchange Format 24 Mart 2021 tarihinde kaynagindan Erisim tarihi 7 Ekim 2022 www oasis open org 19 Haziran 2006 tarihinde kaynagindan arsivlendi Erisim tarihi 29 Ocak 2021 O Hagan Minako Ed 23 Agustos 2019 XML for translation technology The Routledge Handbook of Translation and Technology 1 Ingilizce Abingdon Oxon Routledge ss 45 60 doi 10 4324 9781315311258 3 ISBN 978 1 315 31125 8 erisim tarihi 29 Ocak 2021 Yazar ad1 eksik soyadi1 yardim XML Localisation Interchange File Format 26 Nisan 2021 tarihinde kaynagindan Erisim tarihi 7 Ekim 2022 Translation Web Services 4 Aralik 2020 tarihinde kaynagindan Erisim tarihi 7 Ekim 2022 Andrzej Zydron August 2008 CIDM Information Management News 17 Mayis 2013 tarihinde kaynagindan arsivlendi Erisim tarihi 30 Mart 2013 At the core of xml tm are the following concepts which together make up Text Memory Author Memory and Translation Memory Ileri okumalarDragsted Barbara 2004 Segmentation in translation and translation memory systems An empirical investigation of cognitive segmentation and effects of integrating a CB system into the translation process Copenhagen Samfundslitteratur 369 p Heyn Matthias 1998 Translation memories Insights and prospects In Lynne Bowker et al eds Unity in diversity Current trends in translation studies Manchester St Jerome P 123 136 Martin Mor Adria 2011 La interferencia linguistica en entorns de Traduccio Assistida per Ordinador Recerca empiricoexperimental Bellaterra Universitat Autonoma de Barcelona URL http www tdx cat handle 10803 83987 O Hagan Minako 2009 Computer aided translation CAT In Mona Baker amp Gabriela Saldanha eds Routledge encyclopedia of translation studies London Routledge P 48 51 Pym Anthony 2013 Translation Skill Sets in a Machine Translation Age Meta Translators Journal 58 3 p 487 503 URL http id erudit org iderudit 1025047arDis baglantilarCeviri anilari 21 Ekim 2008 tarihinde Wayback Machine sitesinde Ceviri belleklerini kiyaslama 16 Haziran 2008 tarihinde Wayback Machine sitesinde Web Tabanli Ceviri Belleginde Guc Kaymalari