Gen bulma, genomik DNA'da biyolojik olarak işlevsel olan dizileri algoritmik olarak tespit etmekle ilgili hesaplamalı biyolojinin bir sahasıdır. İşlevsel dizilerden kastedilen genelde protein kodlayıcı genler olmakla beraber, ve de dahil edilir. Bir organizmanın genomu dizilendikten sonra bu genomun anlaşılabilmesi için ilk ve en önemli adım gen bulmadır.
"Gen bulma", başlangıçta canlı hücre ve organizmalar üzerinde yapılan zor deneylere dayalıydı. Çeşitli farklı genler arasındaki homolog rekombinasyon oranlarının istatistik analizi ile onların belli bir kromozom üzerindeki sırasını belirlenebilirdi. Bu tür pek çok deneyin sonuçları birleştirilerek bilinen genlerin yaklaşık konumlarını birbirlerine bağıl olarak gösteren bir oluşturulabilirdi. Günümüzde genomların kapsamlı şekilde dizilenmesi ve güçlü bilgisayarların varlığı sayesinde gen bulma artık büyük oranda bir berimsel problem olarak tanımlanabilmektedir.
Bir dizinin işlevsel olduğunu belirlemek ile o genin (veya genin ürününün) işlevinin ne olduğunu belirlemek farklıdır. İkincisini yapabilmek için hâlâ ve diğer yöntemlerin kullanıldığı in vivo deneyler gerekmektedir, ama biyoenformatik bilimi geliştikçe bir genin sadece dizisine dayanarak onun işlevini tahmin etmek artan oranda mümkün olmaktadır.
Dışsal yaklaşımlar
Dışsal (haricî veya kanıta dayalı) gen bulma sistemlerinde, hedef genomda mesajcı RNA (mRNA) veya protein ürün dizileriyle uyumlu diziler aranır. Bir mRNA dizisine dayanarak onu transkripsiyon yoluyla üretecek bir genomik DNA dizisini bulmak basit bir işlemdir. Bir protein dizisinden başlayıp, genetik kodu kullanarak protein dizisini ters çevirisini yapmak ve onu kodlamış olabilecek DNA dizilerinin bir kümesini üretmek mümkündür. Aday DNA dizileri belirlendikten sonra hedef genomu arayıp onunla (kısmen veya tüm olarak, tam veya eksik olarak) eşleşen bölgeler bulmak nispeten basit bir algoritmik problemdir. BLAST bu amaç için yaygın kullanılan bir programdır.
Bilinen bir mRNA veya protein ile yüksek derecede benzerlik olması incelenen genomdaki bir bölgenin protein-kodlayıcı bir gen içerdiğinin kuvvetli bir kanıtıdır. Ancak, bu yaklaşımın sistematik olarak uygulanabilmesi için mRNA ve protein ürünlerinin önceden kapsamlı şekilde dizilenmiş olmasını gerektirir, ki bu masraflı bir girişimdir. Bu yaklaşımın bir diğer zorluğu daha vardır, kompleks organizmalardaki genlerin ufak bir altkümesi belli bir anda ve belli bir hücre tipinde ifade edildiği için, kültürlenmiş hücre tipleri durumunda, çoğu gen hakkındaki mRNA veya protein bilgisi mevcut değildir. Dolayısıyla bir kompleks organizmadaki çoğu gen hakkında bu tür bilgilerin elde edilmesi için yüzlerce, hatta binlerce hücre tipinin üzerinde çalışılması gerekebilir. Örneğin, bazı insan genleri gelişim sırasında sadece embriyo veya fetus sırasında ifade edilir, bunların araştırılması ayrıca etik nedenlerden de zordur.
Tüm bu zorluklara rağmen, gerek insan gerek fare ve maya gibi biyolojideki diğer önemli model organizmalar için kapsamlı transkript ve protein dizi veritabanları üretilmiştir. Örneğin veritabanı pek çok türe ait transkript ve protein dizisi içerir, sistemi tüm bu bulguları insan ve diğer canlıların genomları üzerinde haritalar. Ancak, bu veritanlarının hem eksik hem de önemli miktarda hatalı veri içeriyor olmaları muhtemeldir.
Ab initio yaklaşımlar
Genler hakkında dışsal kanıt elde etmenin masraf ve zorluğu nedeniyle, Ab initio (temel ilkelerden yola çıkan) gen bulma yöntemlerine de başvurmak gereklidir. Bu yaklaşım ile genomik DNA dizisinin kendisi, protein kodlayıcı genlere özgü belirtilerin varlığı için sistematik olarak taranır. Bu belirtiler kabaca sinyal ve içerik olarak sınıflandırılabilir: sinyal belirtiler yakında bir genin olduğuna işaret eden spesifik dizilerdir, içeriksel belirtiler ise protein kodlayıcı dizilerin istatistik özellikleridir. Daha doğru bir ifade ile, ab initio gen bulma yöntemlerinin gen öngörü () yöntemleri olduğunu söylenebilir, çünkü öne sürülen bir genin işlevsel olduğunun kesinleşebilmesi için dışsal kanıta gerek vardır.
Prokaryotların genomlarında genlerin spesifik ve nispeten iyi anlaşılmış promotör dizileri (sinyaller) vardır, Pribnow kutusu ve transkripsiyon faktörü bağlanma yeri gibi ve bunların sistematik olarak tespiti kolaydır. Ayrıca, protein kodlayıcı bir dizi tek parçalı bir oluşur, bunun uzunluğu da çoğu zaman yüzlerce veya binlerce nükleotit uzunluktadır. görülme sıklığı göz önüne alınırsa bu uzunlukta bir açık okuma çerçevesi, gen bulmak bakımından oldukça bilgi verici bir belirti sayılır (genetik koddaki 64 kodondan üçü dur kodonu olduğuna göre rastgele bir dizi için yaklaşık her 20-25 kodonda bir veya her 60-75 nükleotitte bir dur kodonu bulunması beklenebilir). Üstelik, protein kodlayıcı DNA dizilerinde bazı ve başka istatistik özellikler vardır ve bu uzunlukta dizilerde bunların görülmesi kolaydır. Bu özellikler prokaryot genlerinin bulunmasını nispeten kolay kılar, iyi tasarlanmış berimsel sistemler yüksek doğruluk oranlarına ulaşabilir.
Ökaryotlarda Ab initio gen bulma, özellikle insan gibi karmaşık organizmalarda, çeşitli nedenlerden dolayı çok daha zordur. Birincisi, bu canlıların genomlarındaki promotör ve diğer düzenleyici sinyaller prokaryotlardakine kıyasla daha karmaşıktır ve daha az anlaşılabilmiştir, bu yüzden bunların güvenilir şekilde tanınması daha zordur. Ökaryotik gen bulucularının tespit ettiği iki klasik sinyal ve için bağlanma yeridir.
İkincisi, ökaryotik hücrelerin kullandığı uçbirleştirme mekanizmaları nedeniyle, genomdaki tipik bir protein kodlayıcı dizi birkaç parçaya (eksonlara) ayrılmış durumdadır, bunlarına arasında ise protein kodlamayan diziler (intronlar) yer alır. (Uçbirleştirme yerlerinin tespiti, ökaryotik gen bulucularının tespit ettikleri sinyallerden biridir.) İnsan genomundaki tipik bir protein kodlayıcı gende belki bir düzine eksona bölünmüş olabilir, bunların her birinin uzunluğu iki yüz nükleotitin altındadır ve bazılarının uzunluğu 20-30 nükleotit kadar dahi olabilir. Dolayısıyla, periyodiklik ve protein kodlayıcı DNA'nın diğer içeriksel özelliklerinin tespiti ökaryotlarda çok daha zordur.
Hem prokaryotik hem ökaryotik genomlar için olan gelişmiş gen bulucuları, çeşitli farklı sinyal ve içerik ölçümlerinden elde edilen bilgileri birleştirmek için karmaşık kullanır, gizli Markov modelleri (GMM) gibi. sistemi prokaryotlar için yaygın kullanılır ve yüksek derecede doğruluk gösterir. bir diğer popüler programdır. Ökaryotik ab initio gen bulma sistemleri, bunlara karşın, sadece sınırlı derecede başarı göstermiştir: ve programları bunlara örnek verilebilir. SNAP gen bulucusu, Genscan gibi GMM-tabanlıdır, üzerinde eğitilmemiş olduğu bir genom dizisi üzerinde çalışmanın doğuracağı sorunların üstesinden gelerek için farklı organizmalara daha uyumlu olmaya çalışır. mSplicer, CONTRAST, veya gibi bazı programlar gibi makine öğrenimi tekn'kler' de kullanırlar, daha başarılı bir gen öngörüsü için. veya (conditional random field) kullanan (discriminative model) kurarak doğru bir gen öngörü skor fonksiyonu öğrenmeye çalışırlar.
Diğer sinyaller
Gen öngörüsü için kullanılan, dizi analizi ile türetilmiş sinyallere örnek olarak, istatistikler, psödo-sayı olarak kodlanmış DNA dizilerinin Fourier dönüşümü ve parametreleri sayılabilir.
Dizi içinde doğrudan yer almayan sinyallerin gen öngörüsüne daha iyileştirebileceği öne sürülmüştür. Örneğin, düzenleyici motiflerin tespitinde ikincil yapının kullanımı rapor edilmiştir. Ayrıca, RNA ikincil yapısının uçbirleçtirme yeri tespitine yardım ettiği öne sürülmüştür.
Karşılaştırmalı genomik yaklaşımlar
Pek çok canlı türünün genomlarının tamamı dizilenmiş olduğu için, gen bulma araştırmalarında gelecek vadeden bir saha, . Bu yaklaşımın varsayımı, gen ve diğer işlevsel bölgelerdeki mutasyon hızının, doğal seleksiyon güçleri nedeniyle genomun geri kalanına kıyasla daha yavaş olduğudur, çünkü işlevsel bölgelerdeki mutasyonların organizmaya zarar verici olma olasılıkları daha yüksektir, diğer yerlerdeki mutasyonlara oranla. Evrimsel olarak birbiriyle ilişkili türlerin genomları karılaştırılarak dizilerin korunumu yönündeki bu evrimsel eğilim görülebilir. Bu yaklaşım ilk olarak fare ve insan genomlarında kullanılmıştır, SLAM, SGP ve Twinscan/N-SCAN gibi programlarla.
Karşılaştırmalı gen bulma yönteminin bir diğer uygulaması, bir genoma ait yüksek kaliteli bilgi notları (annotation) bir diğer genoma aksettirilmesidir. Bunu yapan başlıca programlar arasında Projector, GeneWise ve GeneMapper sayılabilir. Bu tür teknikler artık tüm genomların bilgi notlandırlması merkezî bir rol oynamaktadır.
Kaynakça
- ^ Korf I. (14 Mayıs 2004). "Gene finding in novel genomes". BMC Bioinformatics. Cilt 5. ss. 59-67. doi:10.1186/1471-2105-5-59. (PMID) 15144565.
- ^ Rätsch; ve diğerleri. (23 Şubat 2007). "Improving the C. elegans genome annotation using machine learning". PLoS Computational Biology. 3 (2). ss. e20. doi:10.1371/journal.pcbi.0030020. (PMID) 17319737.
- ^ Gross; ve diğerleri. (20 Aralık 2007). "CONTRAST: A Discriminative, Phylogeny-free Approach to Multiple Informant De Novo Gene Prediction". Genome Biology. 8 (12). ss. R269. doi:10.1186/gb-2007-8-12-r269. (PMID) 18096039.
- ^ Schweikert; ve diğerleri. (19 Mayıs 2009). "mGene.web: A Web Service for Accurate Computational Gene Finding". Nucleic Acids Research.
- ^ Saeys Y, Rouzé P, Van de Peer Y (2007). "In search of the small ones: improved prediction of short exons in vertebrates, plants, fungi and protists". Bioinformatics. 23 (4). ss. 414-420. doi:10.1093/bioinformatics/btl639. (PMID) 17204465. 24 Mayıs 2009 tarihinde kaynağından . Erişim tarihi: 14 Eylül 2010.
- ^ Hiller M, Pudimat R, Busch A, Backofen R (2006). "Using RNA secondary structures to guide sequence motif finding towards single-stranded regions". Nucleic Acids Res. 34 (17). ss. e117. doi:10.1093/nar/gkl544. (PMID) 16987907. .
- ^ Patterson DJ, Yasuhara K, Ruzzo WL (2002). "Pre-mRNA secondary structure prediction aids splice site prediction". Pac Symp Biocomput. ss. 223-234. .
- ^ Marashi SA, Goodarzi H, Sadeghi M, Eslahchi C, Pezeshk H (2006). "Importance of RNA secondary structure information for yeast donor and acceptor splice site predictions by neural networks". Comput Biol Chem. 30 (1). ss. 50-57. doi:10.1016/j.compbiolchem.2005.10.009. .
- ^ Marashi SA, Eslahchi C, Pezeshk H, Sadeghi M (2006). "Impact of RNA structure on the prediction of donor and acceptor splice sites". BMC Bioinformatics. Cilt 7. s. 297. doi:10.1186/1471-2105-7-297. .
- ^ Rogic, S (2006). "The role of pre-mRNA secondary structure in gene splicing in Saccharomyces cerevisiae 30 Mayıs 2009 tarihinde Wayback Machine sitesinde .". PhD Dissertation, University of British Columbia.
Dış bağlantılar
- http://www.geneprediction.org 15 Ocak 2020 tarihinde Wayback Machine sitesinde .
- http://www.genefinding.org 30 Aralık 2019 tarihinde Wayback Machine sitesinde .
- Hesaplamalı gen tanıma hakkında bibliyografya14 Mayıs 2008 tarihinde Wayback Machine sitesinde .
- geneid 13 Aralık 2009 tarihinde Wayback Machine sitesinde .
- SGP2 19 Mart 2021 tarihinde Wayback Machine sitesinde .
- http://cbcb.umd.edu/software/glimmer26 Ağustos 2011 tarihinde Wayback Machine sitesinde .
- http://cbcb.umd.edu/software/GlimmerHMM18 Ağustos 2011 tarihinde Wayback Machine sitesinde .
- CHEMGENOME 14 Mart 2010 tarihinde Wayback Machine sitesinde .
- GeneMark 26 Eylül 2010 tarihinde Wayback Machine sitesinde .
- mGene 25 Ağustos 2010 tarihinde Wayback Machine sitesinde .
- StarORF 21 Şubat 2011 tarihinde Wayback Machine sitesinde .
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Gen bulma genomik DNA da biyolojik olarak islevsel olan dizileri algoritmik olarak tespit etmekle ilgili hesaplamali biyolojinin bir sahasidir Islevsel dizilerden kastedilen genelde protein kodlayici genler olmakla beraber ve de dahil edilir Bir organizmanin genomu dizilendikten sonra bu genomun anlasilabilmesi icin ilk ve en onemli adim gen bulmadir Gen bulma baslangicta canli hucre ve organizmalar uzerinde yapilan zor deneylere dayaliydi Cesitli farkli genler arasindaki homolog rekombinasyon oranlarinin istatistik analizi ile onlarin belli bir kromozom uzerindeki sirasini belirlenebilirdi Bu tur pek cok deneyin sonuclari birlestirilerek bilinen genlerin yaklasik konumlarini birbirlerine bagil olarak gosteren bir olusturulabilirdi Gunumuzde genomlarin kapsamli sekilde dizilenmesi ve guclu bilgisayarlarin varligi sayesinde gen bulma artik buyuk oranda bir berimsel problem olarak tanimlanabilmektedir Bir dizinin islevsel oldugunu belirlemek ile o genin veya genin urununun islevinin ne oldugunu belirlemek farklidir Ikincisini yapabilmek icin hala ve diger yontemlerin kullanildigi in vivo deneyler gerekmektedir ama biyoenformatik bilimi gelistikce bir genin sadece dizisine dayanarak onun islevini tahmin etmek artan oranda mumkun olmaktadir Dissal yaklasimlarDissal harici veya kanita dayali gen bulma sistemlerinde hedef genomda mesajci RNA mRNA veya protein urun dizileriyle uyumlu diziler aranir Bir mRNA dizisine dayanarak onu transkripsiyon yoluyla uretecek bir genomik DNA dizisini bulmak basit bir islemdir Bir protein dizisinden baslayip genetik kodu kullanarak protein dizisini ters cevirisini yapmak ve onu kodlamis olabilecek DNA dizilerinin bir kumesini uretmek mumkundur Aday DNA dizileri belirlendikten sonra hedef genomu arayip onunla kismen veya tum olarak tam veya eksik olarak eslesen bolgeler bulmak nispeten basit bir algoritmik problemdir BLAST bu amac icin yaygin kullanilan bir programdir Bilinen bir mRNA veya protein ile yuksek derecede benzerlik olmasi incelenen genomdaki bir bolgenin protein kodlayici bir gen icerdiginin kuvvetli bir kanitidir Ancak bu yaklasimin sistematik olarak uygulanabilmesi icin mRNA ve protein urunlerinin onceden kapsamli sekilde dizilenmis olmasini gerektirir ki bu masrafli bir girisimdir Bu yaklasimin bir diger zorlugu daha vardir kompleks organizmalardaki genlerin ufak bir altkumesi belli bir anda ve belli bir hucre tipinde ifade edildigi icin kulturlenmis hucre tipleri durumunda cogu gen hakkindaki mRNA veya protein bilgisi mevcut degildir Dolayisiyla bir kompleks organizmadaki cogu gen hakkinda bu tur bilgilerin elde edilmesi icin yuzlerce hatta binlerce hucre tipinin uzerinde calisilmasi gerekebilir Ornegin bazi insan genleri gelisim sirasinda sadece embriyo veya fetus sirasinda ifade edilir bunlarin arastirilmasi ayrica etik nedenlerden de zordur Tum bu zorluklara ragmen gerek insan gerek fare ve maya gibi biyolojideki diger onemli model organizmalar icin kapsamli transkript ve protein dizi veritabanlari uretilmistir Ornegin veritabani pek cok ture ait transkript ve protein dizisi icerir sistemi tum bu bulgulari insan ve diger canlilarin genomlari uzerinde haritalar Ancak bu veritanlarinin hem eksik hem de onemli miktarda hatali veri iceriyor olmalari muhtemeldir Ab initio yaklasimlarGenler hakkinda dissal kanit elde etmenin masraf ve zorlugu nedeniyle Ab initio temel ilkelerden yola cikan gen bulma yontemlerine de basvurmak gereklidir Bu yaklasim ile genomik DNA dizisinin kendisi protein kodlayici genlere ozgu belirtilerin varligi icin sistematik olarak taranir Bu belirtiler kabaca sinyal ve icerik olarak siniflandirilabilir sinyal belirtiler yakinda bir genin olduguna isaret eden spesifik dizilerdir iceriksel belirtiler ise protein kodlayici dizilerin istatistik ozellikleridir Daha dogru bir ifade ile ab initio gen bulma yontemlerinin gen ongoru yontemleri oldugunu soylenebilir cunku one surulen bir genin islevsel oldugunun kesinlesebilmesi icin dissal kanita gerek vardir Prokaryotlarin genomlarinda genlerin spesifik ve nispeten iyi anlasilmis promotor dizileri sinyaller vardir Pribnow kutusu ve transkripsiyon faktoru baglanma yeri gibi ve bunlarin sistematik olarak tespiti kolaydir Ayrica protein kodlayici bir dizi tek parcali bir olusur bunun uzunlugu da cogu zaman yuzlerce veya binlerce nukleotit uzunluktadir gorulme sikligi goz onune alinirsa bu uzunlukta bir acik okuma cercevesi gen bulmak bakimindan oldukca bilgi verici bir belirti sayilir genetik koddaki 64 kodondan ucu dur kodonu olduguna gore rastgele bir dizi icin yaklasik her 20 25 kodonda bir veya her 60 75 nukleotitte bir dur kodonu bulunmasi beklenebilir Ustelik protein kodlayici DNA dizilerinde bazi ve baska istatistik ozellikler vardir ve bu uzunlukta dizilerde bunlarin gorulmesi kolaydir Bu ozellikler prokaryot genlerinin bulunmasini nispeten kolay kilar iyi tasarlanmis berimsel sistemler yuksek dogruluk oranlarina ulasabilir Okaryotlarda Ab initio gen bulma ozellikle insan gibi karmasik organizmalarda cesitli nedenlerden dolayi cok daha zordur Birincisi bu canlilarin genomlarindaki promotor ve diger duzenleyici sinyaller prokaryotlardakine kiyasla daha karmasiktir ve daha az anlasilabilmistir bu yuzden bunlarin guvenilir sekilde taninmasi daha zordur Okaryotik gen bulucularinin tespit ettigi iki klasik sinyal ve icin baglanma yeridir Ikincisi okaryotik hucrelerin kullandigi ucbirlestirme mekanizmalari nedeniyle genomdaki tipik bir protein kodlayici dizi birkac parcaya eksonlara ayrilmis durumdadir bunlarina arasinda ise protein kodlamayan diziler intronlar yer alir Ucbirlestirme yerlerinin tespiti okaryotik gen bulucularinin tespit ettikleri sinyallerden biridir Insan genomundaki tipik bir protein kodlayici gende belki bir duzine eksona bolunmus olabilir bunlarin her birinin uzunlugu iki yuz nukleotitin altindadir ve bazilarinin uzunlugu 20 30 nukleotit kadar dahi olabilir Dolayisiyla periyodiklik ve protein kodlayici DNA nin diger iceriksel ozelliklerinin tespiti okaryotlarda cok daha zordur Hem prokaryotik hem okaryotik genomlar icin olan gelismis gen buluculari cesitli farkli sinyal ve icerik olcumlerinden elde edilen bilgileri birlestirmek icin karmasik kullanir gizli Markov modelleri GMM gibi sistemi prokaryotlar icin yaygin kullanilir ve yuksek derecede dogruluk gosterir bir diger populer programdir Okaryotik ab initio gen bulma sistemleri bunlara karsin sadece sinirli derecede basari gostermistir ve programlari bunlara ornek verilebilir SNAP gen bulucusu Genscan gibi GMM tabanlidir uzerinde egitilmemis oldugu bir genom dizisi uzerinde calismanin doguracagi sorunlarin ustesinden gelerek icin farkli organizmalara daha uyumlu olmaya calisir mSplicer CONTRAST veya gibi bazi programlar gibi makine ogrenimi tekn kler de kullanirlar daha basarili bir gen ongorusu icin veya conditional random field kullanan discriminative model kurarak dogru bir gen ongoru skor fonksiyonu ogrenmeye calisirlar Diger sinyaller Gen ongorusu icin kullanilan dizi analizi ile turetilmis sinyallere ornek olarak istatistikler psodo sayi olarak kodlanmis DNA dizilerinin Fourier donusumu ve parametreleri sayilabilir Dizi icinde dogrudan yer almayan sinyallerin gen ongorusune daha iyilestirebilecegi one surulmustur Ornegin duzenleyici motiflerin tespitinde ikincil yapinin kullanimi rapor edilmistir Ayrica RNA ikincil yapisinin ucbirlectirme yeri tespitine yardim ettigi one surulmustur Karsilastirmali genomik yaklasimlarPek cok canli turunun genomlarinin tamami dizilenmis oldugu icin gen bulma arastirmalarinda gelecek vadeden bir saha Bu yaklasimin varsayimi gen ve diger islevsel bolgelerdeki mutasyon hizinin dogal seleksiyon gucleri nedeniyle genomun geri kalanina kiyasla daha yavas oldugudur cunku islevsel bolgelerdeki mutasyonlarin organizmaya zarar verici olma olasiliklari daha yuksektir diger yerlerdeki mutasyonlara oranla Evrimsel olarak birbiriyle iliskili turlerin genomlari karilastirilarak dizilerin korunumu yonundeki bu evrimsel egilim gorulebilir Bu yaklasim ilk olarak fare ve insan genomlarinda kullanilmistir SLAM SGP ve Twinscan N SCAN gibi programlarla Karsilastirmali gen bulma yonteminin bir diger uygulamasi bir genoma ait yuksek kaliteli bilgi notlari annotation bir diger genoma aksettirilmesidir Bunu yapan baslica programlar arasinda Projector GeneWise ve GeneMapper sayilabilir Bu tur teknikler artik tum genomlarin bilgi notlandirlmasi merkezi bir rol oynamaktadir Kaynakca Korf I 14 Mayis 2004 Gene finding in novel genomes BMC Bioinformatics Cilt 5 ss 59 67 doi 10 1186 1471 2105 5 59 PMID 15144565 Ratsch ve digerleri 23 Subat 2007 Improving the C elegans genome annotation using machine learning PLoS Computational Biology 3 2 ss e20 doi 10 1371 journal pcbi 0030020 PMID 17319737 KB1 bakim Digerlerinin yanlis kullanimi link Gross ve digerleri 20 Aralik 2007 CONTRAST A Discriminative Phylogeny free Approach to Multiple Informant De Novo Gene Prediction Genome Biology 8 12 ss R269 doi 10 1186 gb 2007 8 12 r269 PMID 18096039 KB1 bakim Digerlerinin yanlis kullanimi link Schweikert ve digerleri 19 Mayis 2009 mGene web A Web Service for Accurate Computational Gene Finding Nucleic Acids Research KB1 bakim Digerlerinin yanlis kullanimi link Saeys Y Rouze P Van de Peer Y 2007 In search of the small ones improved prediction of short exons in vertebrates plants fungi and protists Bioinformatics 23 4 ss 414 420 doi 10 1093 bioinformatics btl639 PMID 17204465 24 Mayis 2009 tarihinde kaynagindan Erisim tarihi 14 Eylul 2010 KB1 bakim Birden fazla ad yazar listesi link Hiller M Pudimat R Busch A Backofen R 2006 Using RNA secondary structures to guide sequence motif finding towards single stranded regions Nucleic Acids Res 34 17 ss e117 doi 10 1093 nar gkl544 PMID 16987907 KB1 bakim Birden fazla ad yazar listesi link Patterson DJ Yasuhara K Ruzzo WL 2002 Pre mRNA secondary structure prediction aids splice site prediction Pac Symp Biocomput ss 223 234 KB1 bakim Birden fazla ad yazar listesi link Marashi SA Goodarzi H Sadeghi M Eslahchi C Pezeshk H 2006 Importance of RNA secondary structure information for yeast donor and acceptor splice site predictions by neural networks Comput Biol Chem 30 1 ss 50 57 doi 10 1016 j compbiolchem 2005 10 009 KB1 bakim Birden fazla ad yazar listesi link Marashi SA Eslahchi C Pezeshk H Sadeghi M 2006 Impact of RNA structure on the prediction of donor and acceptor splice sites BMC Bioinformatics Cilt 7 s 297 doi 10 1186 1471 2105 7 297 KB1 bakim Birden fazla ad yazar listesi link Rogic S 2006 The role of pre mRNA secondary structure in gene splicing in Saccharomyces cerevisiae 30 Mayis 2009 tarihinde Wayback Machine sitesinde PhD Dissertation University of British Columbia Dis baglantilarhttp www geneprediction org 15 Ocak 2020 tarihinde Wayback Machine sitesinde http www genefinding org 30 Aralik 2019 tarihinde Wayback Machine sitesinde Hesaplamali gen tanima hakkinda bibliyografya14 Mayis 2008 tarihinde Wayback Machine sitesinde geneid 13 Aralik 2009 tarihinde Wayback Machine sitesinde SGP2 19 Mart 2021 tarihinde Wayback Machine sitesinde http cbcb umd edu software glimmer26 Agustos 2011 tarihinde Wayback Machine sitesinde http cbcb umd edu software GlimmerHMM18 Agustos 2011 tarihinde Wayback Machine sitesinde CHEMGENOME 14 Mart 2010 tarihinde Wayback Machine sitesinde GeneMark 26 Eylul 2010 tarihinde Wayback Machine sitesinde mGene 25 Agustos 2010 tarihinde Wayback Machine sitesinde StarORF 21 Subat 2011 tarihinde Wayback Machine sitesinde