Otomatik Duyuru İsveç'te perona yaklaşan bir trenin anonsu | |
Dinlerken sorun mu yaşıyorsunuz? alın. |
Konuşma sentezleyici (İngilizce: speech synthesizer), İnsan seslerinin bilgisayar yapay zekası tarafından üretimidir. Genellikle Metin okuma sistemlerinde kullanılan Konuşma sentezleyicisi bu sistemlerde bir dilin tüm ses bilgisi ve benzeri kurallarına göre çevri yapacak şekilde programlanırlar. Bu sentezleyicinin metni doğru telaffuz etmesini sağlar.
Ayrıca Konuşma Sentezleyici Ses konuşma tanımlayıcı yazılımlarda ve Fonetik transkripsiyon'larda da kullanılamaktadır. Konuşma Sentezleri yapılma sırasında veritabanında saklanan kayıtlı konuşma parçalarının birleştirilmesiyle oluşturulabilir. Ses sentezleyicinin daha doğal veya daha iyi performans vermesi için tüm kelimelerin veri tabanında kayıtlı olması gerekmektedir.
Konuşma Sentezleyicilerin özellikle görme ve okuma güçlüğü çeken insanların metinlerini sesli olarak söyleyerek yazması ve yazılı sözcükleri dinlemesine olarak tanımaktadır
Bir Metini konuşma yazılımı yani ses parçasına dönüştürmek için genel bakış açısı ile giriş ve çıkış bölümleri gerekmektedir. Giriş metindir çıkış ise sestir. Metin öncellikle içindeki sayı, sembol ve noktalama işaretlerini Sözcüksel analiz işlemi olarak algılamakta ve daha sonra metin normalleştirme denilen işleme geçirmektedir. Daha sonra metin Fonetik transkripsiyon işlemi ile parçalara ayrılmaktadır. En sonunda ise ses doğru ses parçaları seçilerek konuşma yani ses olarak çıkmaktadır.
Tarihçe
Rus Bilimler Akademisinin 1779 yılında düzenlediği bir yarışma sırasında Alman ve Danimarka asıllı bilim adamı Christian Gottlieb Kratzenstein tarafından [aː], [eː], [iː], [oː] ve [uː] harflerini üretebilen modeller ile birincilik ödülünü kazanmıştır. Daha sonrasında Macar bilim adamı Wolfgang von Kempelen tarafından 1791 makalesinde bahsedilen körükle çalışan ve ünlü harflerin yanı sıra ünsüz harfleride içeren Wolfgang von Kempelen'in konuşan makinesi'ni icat etti.
1837'de Charles Wheatstone, von Kempelen'in tasarımına dayanan bir "konuşan makine" üretti. 1846'da Joseph Faber, " Euphonia "yı sergiledi. 1923'te Paget, Wheatstone'un tasarımını yeniden canlandırdı.
1930'larda Bell Labs, konuşmayı temel tonlarına ve rezonanslarına göre otomatik olarak analiz eden ses kodlayıcıyı geliştirdi bu özellikle günümüz metin analizlerinin temelidir. Homer Dudley ise ses kodlayıcı üzerindeki çalışmasından sonra, 1939 New York Dünya Fuarı'nda sergilediği The Voder (Voice Demonstrator) adlı klavyeyle çalışan bir ses sentezleyici geliştirdi.
Bilgisayar Tabanlı
İlk bilgisayar tabanlı ses sentezleyiciler 1950'lerin sonlarında ortaya çıktı. Noriko Umeda ilk genel İngilizce metin okuma sistemini 1968'de Japonya'daki Elektroteknik Laboratuvarında geliştirdi. 1961'de fizikçi John Larry Kelly Jr ve meslektaşı Louis Gerstman konuşmayı sentezlemek için bir IBM 704 bilgisayarı kullandılar; bu, Bell Laboratuvarları tarihindeki en önemli olaylardan biridir.
1975'te Fumitada Itakura, NTT'deyken yüksek sıkıştırmalı konuşma kodlaması için hat spektral çiftleri (LSP) yöntemini geliştirdi. 1975'ten 1981'e kadar Itakura, LSP yöntemine dayalı konuşma analizi ve sentezindeki sorunları inceledi. 1980'de ekibi, LSP tabanlı bir konuşma sentezleyici çipi geliştirdi. LSP, konuşma sentezi ve kodlaması için önemli bir teknolojidir ve 1990'larda neredeyse tüm uluslararası konuşma kodlama standartları tarafından temel bir bileşen olarak benimsenerek, mobil kanallar ve internet üzerinden dijital konuşma iletişiminin geliştirilmesine katkıda bulunmuştur.
1975 yılında MUSA piyasaya sürüldü ve ilk Konuşma Sentez sistemlerinden biriydi. Bağımsız bir bilgisayar donanımından ve İtalyanca okumasını sağlayan özel bir yazılımdan oluşuyordu.
1980'ler ve 1990'lardaki baskın sistemler büyük ölçüde MIT'de Dennis Klatt'ın çalışmasına dayanan DECtalk sistemi ve Bell Labs sistemiydi; ikincisi, doğal dil işleme yöntemlerini kapsamlı bir şekilde kullanan, dilden bağımsız ilk çok dilli sistemlerden biriydi.
Konuşma sentezleyici küçük cihazlara ilk olarak 1970li yıllarda hizmet vermeye başladı. İlklerden sayılabilecek olan 1976 yılında Telesensory Systems tarafından geliştirilen ve görme engelliler için taşınabilir hesap makinesini geliştirdiler. Fidelity, 1979'da elektronik satranç bilgisayarının konuşan bir sürümünü piyasaya sürdü.
Sentezlenmiş sesler, AT&T Bell Laboratories'de Ann Syrdal'ın bir kadın sesi yarattığı 1990 yılına kadar tipik olarak erkekti.
Konuşma sentezi biçimlendirme dilleri
Gelişen teknoloji ile konuşma sentezlerinin XML dosyasına uygun şekilde olması için İşaretleme dili oluşturulmaktadır. En yeni hali olarak kabul edilen (SSML) XML tabanlı bir biçimlendirme dili hizmeti vermektedir. Standart olarak önerilmiş olsa da, yaygın olarak benimsenmemiştir.
Konuşma sentezi biçimlendirme dilleri, diyalog biçimlendirme dillerinden farklıdır. Örneğin VoiceXML, metinden konuşmaya işaretlemeye ek olarak konuşma tanıma, ve tuşlu arama ile ilgili etiketleri içerir.
Ayrıca bakınız
Kaynakça
- ^ Rubin, Philip; Baer, Thomas; Mermelstein, Paul (1 Ağustos 1981). "An articulatory synthesizer for perceptual research". The Journal of the Acoustical Society of America (İngilizce). 70 (2): 321-328. doi:10.1121/1.386780. ISSN 0001-4966.
- ^ Santen, Jan P. H. van, (Ed.) (1997). Progress in speech synthesis. New York Heidelberg: Springer. ISBN .
- ^ . research.spa.aalto.fi. 14 Mayıs 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Ağustos 2023.
- ^ (PDF). web.archive.org. 10 Mart 2021 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 16 Ağustos 2023.
- ^ Klatt, D (1987). "Review of text-to-speech conversion for English". Journal of the Acoustical Society of America. 82 (3): 737–93. Bibcode:1987ASAJ...82..737K. doi:10.1121/1.395275. PMID 2958525.
- ^ "Louis Gerstman, 61, a Specialist In Speech Disorders and Processes (Published 1992)" (İngilizce). 21 Mart 1992. 2 Nisan 2019 tarihinde kaynağından . Erişim tarihi: 16 Ağustos 2023.
- ^ . ghostarchive.org. 1 Kasım 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Ağustos 2023.
- ^ a b . ETHW. 9 Aralık 2020. 10 Şubat 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Ağustos 2023.
- ^ a b . ETHW. 26 Ocak 2021. 3 Nisan 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Ağustos 2023.
- ^ Mordas, G.; Manninen, H. E.; Petäjä, T.; Aalto, P. P.; Hämeri, K.; Kulmala, M. (Ocak 2008). "On Operation of the Ultra-Fine Water-Based CPC TSI 3786 and Comparison with Other TSI Models (TSI 3776, TSI 3772, TSI 3025, TSI 3010, TSI 3007)". Aerosol Science and Technology. 42 (2): 152-158. doi:10.1080/02786820701846252. ISSN 0278-6826.
- ^ Gevaryahu, Jonathan, [ "TSI S14001A Speech Synthesizer LSI Integrated Circuit Guide".
- ^ . www.ismenio.com. 21 Nisan 2005 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Ağustos 2023.
- ^ "Ann Syrdal, Who Helped Give Computers a Female Voice, Dies at 74 (Published 2020)" (İngilizce). 20 Ağustos 2020. 16 Temmuz 2023 tarihinde kaynağından . Erişim tarihi: 16 Ağustos 2023.
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Otomatik Duyuru source source track track Isvec te perona yaklasan bir trenin anonsuDinlerken sorun mu yasiyorsunuz Medya yardimi alin Konusma sentezleyici Ingilizce speech synthesizer Insan seslerinin bilgisayar yapay zekasi tarafindan uretimidir Genellikle Metin okuma sistemlerinde kullanilan Konusma sentezleyicisi bu sistemlerde bir dilin tum ses bilgisi ve benzeri kurallarina gore cevri yapacak sekilde programlanirlar Bu sentezleyicinin metni dogru telaffuz etmesini saglar Ayrica Konusma Sentezleyici Ses konusma tanimlayici yazilimlarda ve Fonetik transkripsiyon larda da kullanilamaktadir Konusma Sentezleri yapilma sirasinda veritabaninda saklanan kayitli konusma parcalarinin birlestirilmesiyle olusturulabilir Ses sentezleyicinin daha dogal veya daha iyi performans vermesi icin tum kelimelerin veri tabaninda kayitli olmasi gerekmektedir Konusma Sentezleyicilerin ozellikle gorme ve okuma guclugu ceken insanlarin metinlerini sesli olarak soyleyerek yazmasi ve yazili sozcukleri dinlemesine olarak tanimaktadir TTS System Bir Metini konusma yazilimi yani ses parcasina donusturmek icin genel bakis acisi ile giris ve cikis bolumleri gerekmektedir Giris metindir cikis ise sestir Metin oncellikle icindeki sayi sembol ve noktalama isaretlerini Sozcuksel analiz islemi olarak algilamakta ve daha sonra metin normallestirme denilen isleme gecirmektedir Daha sonra metin Fonetik transkripsiyon islemi ile parcalara ayrilmaktadir En sonunda ise ses dogru ses parcalari secilerek konusma yani ses olarak cikmaktadir TarihceRus Bilimler Akademisinin 1779 yilinda duzenledigi bir yarisma sirasinda Alman ve Danimarka asilli bilim adami Christian Gottlieb Kratzenstein tarafindan aː eː iː oː ve uː harflerini uretebilen modeller ile birincilik odulunu kazanmistir Daha sonrasinda Macar bilim adami Wolfgang von Kempelen tarafindan 1791 makalesinde bahsedilen korukle calisan ve unlu harflerin yani sira unsuz harfleride iceren Wolfgang von Kempelen in konusan makinesi ni icat etti 1837 de Charles Wheatstone von Kempelen in tasarimina dayanan bir konusan makine uretti 1846 da Joseph Faber Euphonia yi sergiledi 1923 te Paget Wheatstone un tasarimini yeniden canlandirdi 1930 larda Bell Labs konusmayi temel tonlarina ve rezonanslarina gore otomatik olarak analiz eden ses kodlayiciyi gelistirdi bu ozellikle gunumuz metin analizlerinin temelidir Homer Dudley ise ses kodlayici uzerindeki calismasindan sonra 1939 New York Dunya Fuari nda sergiledigi The Voder Voice Demonstrator adli klavyeyle calisan bir ses sentezleyici gelistirdi Bilgisayar Tabanli Ilk bilgisayar tabanli ses sentezleyiciler 1950 lerin sonlarinda ortaya cikti Noriko Umeda ilk genel Ingilizce metin okuma sistemini 1968 de Japonya daki Elektroteknik Laboratuvarinda gelistirdi 1961 de fizikci John Larry Kelly Jr ve meslektasi Louis Gerstman konusmayi sentezlemek icin bir IBM 704 bilgisayari kullandilar bu Bell Laboratuvarlari tarihindeki en onemli olaylardan biridir 1975 te Fumitada Itakura NTT deyken yuksek sikistirmali konusma kodlamasi icin hat spektral ciftleri LSP yontemini gelistirdi 1975 ten 1981 e kadar Itakura LSP yontemine dayali konusma analizi ve sentezindeki sorunlari inceledi 1980 de ekibi LSP tabanli bir konusma sentezleyici cipi gelistirdi LSP konusma sentezi ve kodlamasi icin onemli bir teknolojidir ve 1990 larda neredeyse tum uluslararasi konusma kodlama standartlari tarafindan temel bir bilesen olarak benimsenerek mobil kanallar ve internet uzerinden dijital konusma iletisiminin gelistirilmesine katkida bulunmustur 1975 yilinda MUSA piyasaya suruldu ve ilk Konusma Sentez sistemlerinden biriydi Bagimsiz bir bilgisayar donanimindan ve Italyanca okumasini saglayan ozel bir yazilimdan olusuyordu 1980 ler ve 1990 lardaki baskin sistemler buyuk olcude MIT de Dennis Klatt in calismasina dayanan DECtalk sistemi ve Bell Labs sistemiydi ikincisi dogal dil isleme yontemlerini kapsamli bir sekilde kullanan dilden bagimsiz ilk cok dilli sistemlerden biriydi source source source track DECtalk demo Fidelity Chess Challenger Voice source source source track Fidelity Chess Challenger Voice speech output Konusma sentezleyici kucuk cihazlara ilk olarak 1970li yillarda hizmet vermeye basladi Ilklerden sayilabilecek olan 1976 yilinda Telesensory Systems tarafindan gelistirilen ve gorme engelliler icin tasinabilir hesap makinesini gelistirdiler Fidelity 1979 da elektronik satranc bilgisayarinin konusan bir surumunu piyasaya surdu Sentezlenmis sesler AT amp T Bell Laboratories de Ann Syrdal in bir kadin sesi yarattigi 1990 yilina kadar tipik olarak erkekti Konusma sentezi bicimlendirme dilleriGelisen teknoloji ile konusma sentezlerinin XML dosyasina uygun sekilde olmasi icin Isaretleme dili olusturulmaktadir En yeni hali olarak kabul edilen SSML XML tabanli bir bicimlendirme dili hizmeti vermektedir Standart olarak onerilmis olsa da yaygin olarak benimsenmemistir Konusma sentezi bicimlendirme dilleri diyalog bicimlendirme dillerinden farklidir Ornegin VoiceXML metinden konusmaya isaretlemeye ek olarak konusma tanima ve tuslu arama ile ilgili etiketleri icerir Ayrica bakinizKonusma yazicilar Konusma metinlestirici yazilim Kaynakca Rubin Philip Baer Thomas Mermelstein Paul 1 Agustos 1981 An articulatory synthesizer for perceptual research The Journal of the Acoustical Society of America Ingilizce 70 2 321 328 doi 10 1121 1 386780 ISSN 0001 4966 Santen Jan P H van Ed 1997 Progress in speech synthesis New York Heidelberg Springer ISBN 978 0 387 94701 3 research spa aalto fi 14 Mayis 2015 tarihinde kaynagindan arsivlendi Erisim tarihi 16 Agustos 2023 PDF web archive org 10 Mart 2021 tarihinde kaynagindan PDF arsivlendi Erisim tarihi 16 Agustos 2023 Klatt D 1987 Review of text to speech conversion for English Journal of the Acoustical Society of America 82 3 737 93 Bibcode 1987ASAJ 82 737K doi 10 1121 1 395275 PMID 2958525 Louis Gerstman 61 a Specialist In Speech Disorders and Processes Published 1992 Ingilizce 21 Mart 1992 2 Nisan 2019 tarihinde kaynagindan Erisim tarihi 16 Agustos 2023 ghostarchive org 1 Kasim 2022 tarihinde kaynagindan arsivlendi Erisim tarihi 16 Agustos 2023 a b ETHW 9 Aralik 2020 10 Subat 2015 tarihinde kaynagindan arsivlendi Erisim tarihi 16 Agustos 2023 a b ETHW 26 Ocak 2021 3 Nisan 2015 tarihinde kaynagindan arsivlendi Erisim tarihi 16 Agustos 2023 Mordas G Manninen H E Petaja T Aalto P P Hameri K Kulmala M Ocak 2008 On Operation of the Ultra Fine Water Based CPC TSI 3786 and Comparison with Other TSI Models TSI 3776 TSI 3772 TSI 3025 TSI 3010 TSI 3007 Aerosol Science and Technology 42 2 152 158 doi 10 1080 02786820701846252 ISSN 0278 6826 Gevaryahu Jonathan TSI S14001A Speech Synthesizer LSI Integrated Circuit Guide www ismenio com 21 Nisan 2005 tarihinde kaynagindan arsivlendi Erisim tarihi 16 Agustos 2023 Ann Syrdal Who Helped Give Computers a Female Voice Dies at 74 Published 2020 Ingilizce 20 Agustos 2020 16 Temmuz 2023 tarihinde kaynagindan Erisim tarihi 16 Agustos 2023