UniProt, elde edilen birçok girdiden oluşan, serbestçe erişilebilen bir protein dizisi ve fonksiyonel bilgi veritabanıdır. Araştırma literatüründen elde edilen proteinlerin biyolojik işlevi hakkında büyük miktarda bilgi içerir. Çeşitli Avrupa biyoenformatik kuruluşlarından ve Washington, DC, ABD'den bir vakıftan oluşan UniProt konsorsiyumu tarafından sürdürülmektedir.
İçerik | |
---|---|
Açıklama | UniProt, Swiss-Prot, TrEMBL ve PIR-PSD veritabanının birleştirilmesiyle oluşturulan protein verilerinin merkezi bir deposu olan Universal Protein kaynağıdır. |
Yakalanan veri türleri | Protein açıklaması |
Organizmalar | Tümü |
İletişim | |
Araştırma merkezi | , Birleşik Krallık; , İsviçre; , ABD. |
Birincil alıntı | UniProt Konsorsiyumu |
Erişim | |
Veri formatı | Özel düz dosya, , , KTÇ, XML. |
İnternet sitesi | uniprot.org uniprot.org/news/ |
İndirme bağlantısı | uniprot.org/downloads & tüm veri setlerini indirmek için ftp.uniprot.org |
Web hizmeti bağlantısı | Evet - Java API bilgi için bakınız here & REST bilgi için bakınız here |
Araçlar | |
Web | Gelişmiş arama, BLAST, O, toplu alma/indirme, kimlik eşleme |
Diğer | |
Lisans | Creative Commons Attribution-NoDerivs |
Sürümleme | Evet |
Veri yayınlama sıklığı | 8 hafta |
Kürasyon politikası | Evet - manuel ve otomatik. Veritabanı küratörleri ve hesaplama algoritmaları tarafından oluşturulan otomatik açıklama kuralları. |
Yer imi konulabilir varlıklar | Evet - hem bireysel protein girişleri hem de aramalar |
UniProt konsorsiyumu
UniProt konsorsiyumu (EBI), (SIB) ve 'ndan (PIR) oluşmaktadır. Birleşik Krallık, Hinxton'daki 'te bulunan EBI, geniş bir biyoenformatik veritabanı ve hizmet kaynağına ev sahipliği yapmaktadır. İsviçre'nin Cenevre kentinde bulunan SIB, proteomik araçlar ve veritabanları için merkezi bir kaynak olan (Uzman Protein Analiz Sistemi) sunucularını muhafaza etmektedir. Washington, DC, ABD'deki Georgetown Üniversitesi Tıp Merkezindeki Ulusal Biyomedikal Araştırma Vakfı (NBRF) tarafından barındırılan PIR, ilk olarak 1965 yılında yayınlanan Margaret Dayhoff'un Protein Dizisi ve Yapısı Atlası adlı en eski protein dizisi veritabanının varisidir. 2002 yılında EBI, SIB ve PIR, UniProt konsorsiyumu olarak güçlerini birleştirmiştir.
UniProt veritabanlarının kökleri
Her bir konsorsiyum üyesi, protein veritabanı bakımı ve açıklamasında yoğun bir şekilde yer almaktadır. Yakın zamana kadar, EBI ve SIB birlikte Swiss-Prot ve TrEMBL veritabanlarını üretirken, PIR Protein Sekans Veritabanını (PIR-PSD) üretti. Bu veritabanları, farklı protein dizisi kapsamı ve açıklama öncelikleri ile bir arada var olmuştur.
Swiss-Prot 1986 yılında tarafından doktorası sırasında oluşturulmuş ve İsviçre Biyoenformatik Enstitüsü tarafından geliştirilmiş ve daha sonra Avrupa Biyoenformatik Enstitüsünde tarafından geliştirilmiştir. Swiss-Prot, yüksek düzeyde açıklama (bir proteinin işlevinin tanımı, yapısı, translasyon sonrası modifikasyonlar, varyantlar vb. gibi), minimum düzeyde fazlalık ve diğer veritabanlarıyla yüksek düzeyde entegrasyon ile ilişkili güvenilir protein dizileri sağlamayı amaçlamıştır. Sekans verilerinin Swiss-Prot'un yetişme kabiliyetini aşan bir hızda üretildiğini kabul ederek, Swiss-Prot'ta bulunmayan proteinler için otomatik ek açıklamalar sağlamak üzere TrEMBL (Translated EMBL Nucleotide Sequence Data Library) oluşturulmuştur. Bu arada PIR, PIR-PSD'yi ve protein dizileri ve küratörlü ailelerden oluşan bir veritabanı olan iProClass da dahil olmak üzere ilgili veritabanlarını sürdürmüştür.
Konsorsiyum üyeleri örtüşen kaynaklarını ve uzmanlıklarını bir araya getirerek Aralık 2003'te UniProt'u başlattılar.
UniProt veritabanlarının organizasyonu
UniProt dört temel veritabanı sağlamaktadır: UniProtKB (alt parçaları Swiss-Prot ve TrEMBL ile birlikte), UniParc, UniRef ve Proteome.
UniProtKB
UniProt Knowledgebase (UniProtKB), iki bölümden oluşan, kısmen uzmanlar tarafından küratörlüğü yapılan bir protein veritabanıdır: UniProtKB/Swiss-Prot (gözden geçirilmiş, manuel olarak açıklanmış girişleri içerir) ve UniProtKB/TrEMBL (gözden geçirilmemiş, otomatik olarak açıklanmış girişleri içerir). 22 Şubat 2023 itibarıyla, UniProtKB/Swiss-Prot'un "2023_01" sürümü 569.213 dizi girişi (291.046 referanstan özetlenen 205.728.242 amino asitten oluşur) ve UniProtKB/TrEMBL'in "2023_01" sürümü 245.871.724 dizi girişi (85.739.380.194 amino asitten oluşur) içerir.
UniProtKB/Swiss-Prot
UniProtKB/Swiss-Prot, manuel olarak açıklanmış, yedekli olmayan bir protein dizisi veritabanıdır. Bilimsel literatürden elde edilen bilgileri ve tarafından değerlendirilen hesaplama analizlerini birleştirir. UniProtKB/Swiss-Prot'un amacı, belirli bir protein hakkında bilinen tüm ilgili bilgileri sağlamaktır. Ek açıklama, güncel bilimsel bulgulara ayak uydurmak için düzenli olarak gözden geçirilir. Bir girişin manuel ek açıklaması, protein dizisinin ve bilimsel literatürün ayrıntılı analizini içerir.
Aynı genden ve aynı türden diziler aynı veritabanı girişinde birleştirilir. Diziler arasındaki farklılıklar tanımlanır ve nedenleri belgelenir (örneğin , doğal varyasyon, yanlış bölgeleri, yanlış ekson sınırları, çerçeve kaymaları, tanımlanamayan çatışmalar). UniProtKB/Swiss-Prot girişlerinin ek açıklamasında bir dizi dizi analiz aracı kullanılır. Bilgisayar tahminleri manuel olarak değerlendirilir ve ilgili sonuçlar girişe dahil edilmek üzere seçilir. Bu tahminler, translasyon sonrası modifikasyonları, ve , , alan tanımlamasını ve sınıflandırmasını içerir.
PubMed gibi veri tabanları taranarak ilgili yayınlar tespit edilir. Her makalenin tam metni okunur ve bilgiler çıkarılıp girişe eklenir. Bilimsel literatürden kaynaklanan açıklama, bunlarla sınırlı olmamak üzere şunları içerir:
- Protein ve gen isimleri
- Fonksiyon
- Katalitik aktivite, kofaktörler ve katalitik kalıntılar gibi enzime özgü bilgiler
- Protein-protein etkileşimleri
- İfade biçimi
- Önemli alanların ve sitelerin konumları ve rolleri
- İyon-, substrat- ve kofaktör-bağlanma bölgeleri
- Doğal genetik varyasyon, RNA düzeltme, alternatif splicing, işleme ve post-translasyonel modifikasyon ile üretilen protein varyant formları
Açıklamalı girişler UniProtKB/Swiss-Prot'a dahil edilmeden önce kalite güvencesinden geçer. Yeni veriler elde edildiğinde, girişler güncellenir.
UniProtKB/TrEMBL
UniProtKB/TrEMBL, otomatik ek açıklama ile zenginleştirilmiş, hesaplamalı olarak analiz edilmiş yüksek kaliteli kayıtlar içerir. UniProtKB/Swiss-Prot'un zaman ve emek tüketen manuel açıklama süreci, mevcut tüm protein dizilerini kapsayacak şekilde genişletilemediğinden, genom projelerinden kaynaklanan artan veri akışına yanıt olarak tanıtılmıştır. açıklamalı kodlama dizilerinin çevirileri otomatik olarak işlenir ve UniProtKB/TrEMBL'e girilir. UniProtKB/TrEMBL ayrıca PDB'den ve , ve dahil olmak üzere gen tahmininden diziler içerir. 22 Temmuz 2021'den bu yana AlphaFold2 ile tahmin edilen yapıları da içerir.
UniParc
UniProt Arşivi (UniParc), ana, halka açık protein dizisi veritabanlarından tüm protein dizilerini içeren kapsamlı ve yedekli olmayan bir veritabanıdır. Proteinler birkaç farklı kaynak veritabanında ve aynı veritabanında birden fazla kopya halinde bulunabilir. Artıklığı önlemek için, UniParc her benzersiz diziyi yalnızca bir kez saklar. Özdeş diziler, aynı veya farklı türlerden olup olmadıklarına bakılmaksızın birleştirilir. Her diziye sabit ve benzersiz bir tanımlayıcı (UPI) verilir, bu da aynı proteinin farklı kaynak veritabanlarından tanımlanmasını mümkün kılar. UniParc, açıklama içermeyen sadece protein dizileri içerir. UniParc girişlerindeki veritabanı çapraz referansları, protein hakkında daha fazla bilginin kaynak veritabanlarından alınmasını sağlar. Kaynak veritabanlarındaki diziler değiştiğinde, bu değişiklikler UniParc tarafından izlenir ve tüm değişikliklerin geçmişi arşivlenir.
Kaynak veritabanları
Şu anda UniParc aşağıdaki kamuya açık veri tabanlarından protein dizileri içermektedir:
- -Bank/DDBJ/ nükleotit dizisi veritabanları
- Avrupa Patent Ofisi (EPO)
- : Drosophilidae böcek familyası için genetik ve moleküler verilerin birincil deposu (FlyBase)
- Veritabanı (H-Inv)
- (IPI)
- (JPO)
- (PIR-PSD)
- Protein Data Bank (PDB)
- Protein Araştırma Vakfı (PRF)
- (SGD)
- (TAIR)
- TROME
- (USPTO)
- UniProtKB/Swiss-Prot, UniProtKB/Swiss-Prot protein izoformları, UniProtKB/TrEMBL
- (VEGA)
UniRef
UniProt Referans Kümeleri (UniRef), UniProtKB'den ve seçilen UniParc kayıtlarından kümelenmiş protein dizileri kümelerinin üç veritabanından oluşur. UniRef100 veritabanı, aynı dizileri ve dizi parçalarını (herhangi bir organizmadan) tek bir UniRef girişinde birleştirir. Temsili bir proteinin dizisi, birleştirilmiş tüm girişlerin ve karşılık gelen UniProtKB ve UniParc kayıtlarına bağlantılar görüntülenir. UniRef100 dizileri, UniRef90 ve UniRef50'yi oluşturmak için CD-HIT algoritması kullanılarak kümelenir. Her küme, en uzun sekansa sırasıyla en az% 90 veya% 50 sekans kimliğine sahip sekanslardan oluşur. Kümeleme dizileri, veritabanı boyutunu önemli ölçüde azaltır ve daha hızlı dizi aramaları sağlar.
UniRef, UniProt FTP sitesinden temin edilebilir.
Finansman
UniProt, , Ulusal Sağlık Enstitüleri (NIH), Avrupa Komisyonu, Federal Eğitim ve Bilim Ofisi aracılığıyla İsviçre Federal Hükümeti, ve ABD Savunma Bakanlığı tarafından sağlanan hibelerle finanse edilmektedir.
Kaynakça
- ^ UniProt, Consortium. (January 2015). "UniProt: a hub for protein information". Nucleic Acids Research. 43 (Database issue). ss. D204-12. doi:10.1093/nar/gku989. (PMC) 4384041 $2. (PMID) 25348405.
- ^ Dayhoff, Margaret O. (1965). Atlas of protein sequence and structure. Silver Spring, Md: National Biomedical Research Foundation.
- ^ "2002 Release: NHGRI Funds Global Protein Database". National Human Genome Research Institute (NHGRI). 24 Eylül 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Nisan 2018.
- ^ O'Donovan, C.; Martin, M. J.; Gattiker, A.; Gasteiger, E.; Bairoch, A.; Apweiler, R. (2002). "High-quality protein knowledge resource: SWISS-PROT and TrEMBL". Briefings in Bioinformatics. 3 (3). ss. 275-284. doi:10.1093/bib/3.3.275. (PMID) 12230036. 24 Ocak 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 24 Ocak 2024.
- ^ Wu, C. H.; Yeh, L. S.; Huang, H.; Arminski, L.; Castro-Alvear, J.; Chen, Y.; Hu, Z.; Kourtesis, P.; Ledley, R. S.; Suzek, B. E.; Vinayaka, C. R.; Zhang, J.; Barker, W. C. (2003). "The Protein Information Resource". Nucleic Acids Research. 31 (1). ss. 345-347. doi:10.1093/nar/gkg040. (PMC) 165487 $2. (PMID) 12520019.
- ^ Boeckmann, B.; Bairoch, A.; Apweiler, R.; Blatter, M. C.; Estreicher, A.; Gasteiger, E.; Martin, M. J.; Michoud, K.; O'Donovan, C.; Phan, I.; Pilbout, S.; Schneider, M. (2003). "The SWISS-PROT protein knowledgebase and its supplement TrEMBL in 2003". Nucleic Acids Research. 31 (1). ss. 365-370. doi:10.1093/nar/gkg095. (PMC) 165542 $2. (PMID) 12520024.
- ^ Bairoch, A.; Apweiler, R. (1996). "The SWISS-PROT protein sequence data bank and its new supplement TREMBL". Nucleic Acids Research. 24 (1). ss. 21-25. doi:10.1093/nar/24.1.21. (PMC) 145613 $2. (PMID) 8594581.
- ^ Bairoch, A. (2000). "Serendipity in bioinformatics, the tribulations of a Swiss bioinformatician through exciting times!". Bioinformatics. 16 (1). ss. 48-64. doi:10.1093/bioinformatics/16.1.48. (PMID) 10812477. 5 Şubat 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 5 Şubat 2024.
- ^ Séverine Altairac, "Naissance d’une banque de données: Interview du prof. Amos Bairoch 12 Temmuz 2010 tarihinde Wayback Machine sitesinde arşivlendi.".
- ^ a b c Apweiler, R.; Bairoch, A.; Wu, C. H. (2004). "Protein sequence databases". Current Opinion in Chemical Biology. 8 (1). ss. 76-80. doi:10.1016/j.cbpa.2003.12.004. (PMID) 15036160.
- ^ a b Uniprot, C. (2009). "The Universal Protein Resource (UniProt) in 2010". Nucleic Acids Research. 38 (Database issue). ss. D142-D148. doi:10.1093/nar/gkp846. (PMC) 2808944 $2. (PMID) 19843607.
- ^ "UniProtKB/Swiss-Prot Release 2023_01 statistics". web.expasy.org. 4 Nisan 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 31 Mart 2023.
- ^ a b c "How do we manually annotate a UniProtKB entry?". UniProt. 21 Eylül 2011. 13 Aralık 2013 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Nisan 2018.
- ^ a b Apweiler, R.; Bairoch, A.; Wu, C. H.; Barker, W. C.; Boeckmann, B.; Ferro, S.; Gasteiger, E.; Huang, H.; Lopez, R.; Magrane, M.; Martin, M. J.; Natale, D. A.; o’Donovan, C.; Redaschi, N.; Yeh, L. S. (2004). "UniProt: The Universal Protein knowledgebase". Nucleic Acids Research. 32 (90001). ss. 115D-1119. doi:10.1093/nar/gkh131. (PMC) 308865 $2. (PMID) 14681372.
- ^ "Where do the UniProtKB protein sequences come from?". UniProt. 21 Eylül 2011. 15 Aralık 2013 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Nisan 2018.
- ^ Hassabis, Demis (22 Temmuz 2022). "Putting the power of AlphaFold into the world's hands". Deepmind. 24 Temmuz 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 24 Temmuz 2021.
- ^ Leinonen, R.; Diez, F. G.; Binns, D.; Fleischmann, W.; Lopez, R.; Apweiler, R. (2004). "UniProt archive". Bioinformatics. 20 (17). ss. 3236-3237. doi:10.1093/bioinformatics/bth191. (PMID) 15044231. Mar 30, 2024 tarihinde kaynağından arşivlendi (PDF).
- ^ "Protein Research Foundation". 30 Ağustos 2010 tarihinde kaynağından arşivlendi. Erişim tarihi: 25 Ağustos 2010.
- ^ "TROME".
- ^ a b Suzek, B. E.; Huang, H.; McGarvey, P.; Mazumder, R.; Wu, C. H. (2007). "UniRef: Comprehensive and non-redundant UniProt reference clusters". Bioinformatics. 23 (10). ss. 1282-1288. doi:10.1093/bioinformatics/btm098. (PMID) 17379688.
- ^ Li, W.; Jaroszewski, L.; Godzik, A. (2001). "Clustering of highly homologous sequences to reduce the size of large protein databases". Bioinformatics. 17 (3). ss. 282-283. doi:10.1093/bioinformatics/17.3.282. (PMID) 11294794.
Dış bağlantılar
- Resmî site
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
UniProt elde edilen bircok girdiden olusan serbestce erisilebilen bir protein dizisi ve fonksiyonel bilgi veritabanidir Arastirma literaturunden elde edilen proteinlerin biyolojik islevi hakkinda buyuk miktarda bilgi icerir Cesitli Avrupa biyoenformatik kuruluslarindan ve Washington DC ABD den bir vakiftan olusan UniProt konsorsiyumu tarafindan surdurulmektedir UniProtIcerikAciklamaUniProt Swiss Prot TrEMBL ve PIR PSD veritabaninin birlestirilmesiyle olusturulan protein verilerinin merkezi bir deposu olan Universal Protein kaynagidir Yakalanan veri turleriProtein aciklamasiOrganizmalarTumuIletisimArastirma merkezi Birlesik Krallik Isvicre ABD Birincil alintiUniProt KonsorsiyumuErisimVeri formatiOzel duz dosya KTC XML Internet sitesiuniprot org uniprot org news Indirme baglantisiuniprot org downloads amp tum veri setlerini indirmek icin ftp uniprot orgWeb hizmeti baglantisiEvet Java API bilgi icin bakiniz here amp REST bilgi icin bakiniz hereAraclarWebGelismis arama BLAST O toplu alma indirme kimlik eslemeDigerLisansCreative Commons Attribution NoDerivsSurumlemeEvetVeri yayinlama sikligi8 haftaKurasyon politikasiEvet manuel ve otomatik Veritabani kuratorleri ve hesaplama algoritmalari tarafindan olusturulan otomatik aciklama kurallari Yer imi konulabilir varliklarEvet hem bireysel protein girisleri hem de aramalarUniProt konsorsiyumuUniProt konsorsiyumu EBI SIB ve ndan PIR olusmaktadir Birlesik Krallik Hinxton daki te bulunan EBI genis bir biyoenformatik veritabani ve hizmet kaynagina ev sahipligi yapmaktadir Isvicre nin Cenevre kentinde bulunan SIB proteomik araclar ve veritabanlari icin merkezi bir kaynak olan Uzman Protein Analiz Sistemi sunucularini muhafaza etmektedir Washington DC ABD deki Georgetown Universitesi Tip Merkezindeki Ulusal Biyomedikal Arastirma Vakfi NBRF tarafindan barindirilan PIR ilk olarak 1965 yilinda yayinlanan Margaret Dayhoff un Protein Dizisi ve Yapisi Atlasi adli en eski protein dizisi veritabaninin varisidir 2002 yilinda EBI SIB ve PIR UniProt konsorsiyumu olarak guclerini birlestirmistir UniProt veritabanlarinin kokleriHer bir konsorsiyum uyesi protein veritabani bakimi ve aciklamasinda yogun bir sekilde yer almaktadir Yakin zamana kadar EBI ve SIB birlikte Swiss Prot ve TrEMBL veritabanlarini uretirken PIR Protein Sekans Veritabanini PIR PSD uretti Bu veritabanlari farkli protein dizisi kapsami ve aciklama oncelikleri ile bir arada var olmustur Swiss Prot 1986 yilinda tarafindan doktorasi sirasinda olusturulmus ve Isvicre Biyoenformatik Enstitusu tarafindan gelistirilmis ve daha sonra Avrupa Biyoenformatik Enstitusunde tarafindan gelistirilmistir Swiss Prot yuksek duzeyde aciklama bir proteinin islevinin tanimi yapisi translasyon sonrasi modifikasyonlar varyantlar vb gibi minimum duzeyde fazlalik ve diger veritabanlariyla yuksek duzeyde entegrasyon ile iliskili guvenilir protein dizileri saglamayi amaclamistir Sekans verilerinin Swiss Prot un yetisme kabiliyetini asan bir hizda uretildigini kabul ederek Swiss Prot ta bulunmayan proteinler icin otomatik ek aciklamalar saglamak uzere TrEMBL Translated EMBL Nucleotide Sequence Data Library olusturulmustur Bu arada PIR PIR PSD yi ve protein dizileri ve kuratorlu ailelerden olusan bir veritabani olan iProClass da dahil olmak uzere ilgili veritabanlarini surdurmustur Konsorsiyum uyeleri ortusen kaynaklarini ve uzmanliklarini bir araya getirerek Aralik 2003 te UniProt u baslattilar UniProt veritabanlarinin organizasyonuUniProt dort temel veritabani saglamaktadir UniProtKB alt parcalari Swiss Prot ve TrEMBL ile birlikte UniParc UniRef ve Proteome UniProtKB UniProt Knowledgebase UniProtKB iki bolumden olusan kismen uzmanlar tarafindan kuratorlugu yapilan bir protein veritabanidir UniProtKB Swiss Prot gozden gecirilmis manuel olarak aciklanmis girisleri icerir ve UniProtKB TrEMBL gozden gecirilmemis otomatik olarak aciklanmis girisleri icerir 22 Subat 2023 itibariyla UniProtKB Swiss Prot un 2023 01 surumu 569 213 dizi girisi 291 046 referanstan ozetlenen 205 728 242 amino asitten olusur ve UniProtKB TrEMBL in 2023 01 surumu 245 871 724 dizi girisi 85 739 380 194 amino asitten olusur icerir UniProtKB Swiss Prot UniProtKB Swiss Prot manuel olarak aciklanmis yedekli olmayan bir protein dizisi veritabanidir Bilimsel literaturden elde edilen bilgileri ve tarafindan degerlendirilen hesaplama analizlerini birlestirir UniProtKB Swiss Prot un amaci belirli bir protein hakkinda bilinen tum ilgili bilgileri saglamaktir Ek aciklama guncel bilimsel bulgulara ayak uydurmak icin duzenli olarak gozden gecirilir Bir girisin manuel ek aciklamasi protein dizisinin ve bilimsel literaturun ayrintili analizini icerir Ayni genden ve ayni turden diziler ayni veritabani girisinde birlestirilir Diziler arasindaki farkliliklar tanimlanir ve nedenleri belgelenir ornegin dogal varyasyon yanlis bolgeleri yanlis ekson sinirlari cerceve kaymalari tanimlanamayan catismalar UniProtKB Swiss Prot girislerinin ek aciklamasinda bir dizi dizi analiz araci kullanilir Bilgisayar tahminleri manuel olarak degerlendirilir ve ilgili sonuclar girise dahil edilmek uzere secilir Bu tahminler translasyon sonrasi modifikasyonlari ve alan tanimlamasini ve siniflandirmasini icerir PubMed gibi veri tabanlari taranarak ilgili yayinlar tespit edilir Her makalenin tam metni okunur ve bilgiler cikarilip girise eklenir Bilimsel literaturden kaynaklanan aciklama bunlarla sinirli olmamak uzere sunlari icerir Protein ve gen isimleri Fonksiyon Katalitik aktivite kofaktorler ve katalitik kalintilar gibi enzime ozgu bilgiler Protein protein etkilesimleri Ifade bicimi Onemli alanlarin ve sitelerin konumlari ve rolleri Iyon substrat ve kofaktor baglanma bolgeleri Dogal genetik varyasyon RNA duzeltme alternatif splicing isleme ve post translasyonel modifikasyon ile uretilen protein varyant formlari Aciklamali girisler UniProtKB Swiss Prot a dahil edilmeden once kalite guvencesinden gecer Yeni veriler elde edildiginde girisler guncellenir UniProtKB TrEMBL UniProtKB TrEMBL otomatik ek aciklama ile zenginlestirilmis hesaplamali olarak analiz edilmis yuksek kaliteli kayitlar icerir UniProtKB Swiss Prot un zaman ve emek tuketen manuel aciklama sureci mevcut tum protein dizilerini kapsayacak sekilde genisletilemediginden genom projelerinden kaynaklanan artan veri akisina yanit olarak tanitilmistir aciklamali kodlama dizilerinin cevirileri otomatik olarak islenir ve UniProtKB TrEMBL e girilir UniProtKB TrEMBL ayrica PDB den ve ve dahil olmak uzere gen tahmininden diziler icerir 22 Temmuz 2021 den bu yana AlphaFold2 ile tahmin edilen yapilari da icerir UniParc UniProt Arsivi UniParc ana halka acik protein dizisi veritabanlarindan tum protein dizilerini iceren kapsamli ve yedekli olmayan bir veritabanidir Proteinler birkac farkli kaynak veritabaninda ve ayni veritabaninda birden fazla kopya halinde bulunabilir Artikligi onlemek icin UniParc her benzersiz diziyi yalnizca bir kez saklar Ozdes diziler ayni veya farkli turlerden olup olmadiklarina bakilmaksizin birlestirilir Her diziye sabit ve benzersiz bir tanimlayici UPI verilir bu da ayni proteinin farkli kaynak veritabanlarindan tanimlanmasini mumkun kilar UniParc aciklama icermeyen sadece protein dizileri icerir UniParc girislerindeki veritabani capraz referanslari protein hakkinda daha fazla bilginin kaynak veritabanlarindan alinmasini saglar Kaynak veritabanlarindaki diziler degistiginde bu degisiklikler UniParc tarafindan izlenir ve tum degisikliklerin gecmisi arsivlenir Kaynak veritabanlari Su anda UniParc asagidaki kamuya acik veri tabanlarindan protein dizileri icermektedir Bank DDBJ nukleotit dizisi veritabanlari Avrupa Patent Ofisi EPO Drosophilidae bocek familyasi icin genetik ve molekuler verilerin birincil deposu FlyBase Veritabani H Inv IPI JPO PIR PSD Protein Data Bank PDB Protein Arastirma Vakfi PRF SGD TAIR TROME USPTO UniProtKB Swiss Prot UniProtKB Swiss Prot protein izoformlari UniProtKB TrEMBL VEGA UniRef UniProt Referans Kumeleri UniRef UniProtKB den ve secilen UniParc kayitlarindan kumelenmis protein dizileri kumelerinin uc veritabanindan olusur UniRef100 veritabani ayni dizileri ve dizi parcalarini herhangi bir organizmadan tek bir UniRef girisinde birlestirir Temsili bir proteinin dizisi birlestirilmis tum girislerin ve karsilik gelen UniProtKB ve UniParc kayitlarina baglantilar goruntulenir UniRef100 dizileri UniRef90 ve UniRef50 yi olusturmak icin CD HIT algoritmasi kullanilarak kumelenir Her kume en uzun sekansa sirasiyla en az 90 veya 50 sekans kimligine sahip sekanslardan olusur Kumeleme dizileri veritabani boyutunu onemli olcude azaltir ve daha hizli dizi aramalari saglar UniRef UniProt FTP sitesinden temin edilebilir FinansmanUniProt Ulusal Saglik Enstituleri NIH Avrupa Komisyonu Federal Egitim ve Bilim Ofisi araciligiyla Isvicre Federal Hukumeti ve ABD Savunma Bakanligi tarafindan saglanan hibelerle finanse edilmektedir Kaynakca UniProt Consortium January 2015 UniProt a hub for protein information Nucleic Acids Research 43 Database issue ss D204 12 doi 10 1093 nar gku989 PMC 4384041 2 PMID 25348405 Dayhoff Margaret O 1965 Atlas of protein sequence and structure Silver Spring Md National Biomedical Research Foundation 2002 Release NHGRI Funds Global Protein Database National Human Genome Research Institute NHGRI 24 Eylul 2015 tarihinde kaynagindan arsivlendi Erisim tarihi 14 Nisan 2018 O Donovan C Martin M J Gattiker A Gasteiger E Bairoch A Apweiler R 2002 High quality protein knowledge resource SWISS PROT and TrEMBL Briefings in Bioinformatics 3 3 ss 275 284 doi 10 1093 bib 3 3 275 PMID 12230036 24 Ocak 2024 tarihinde kaynagindan arsivlendi Erisim tarihi 24 Ocak 2024 Wu C H Yeh L S Huang H Arminski L Castro Alvear J Chen Y Hu Z Kourtesis P Ledley R S Suzek B E Vinayaka C R Zhang J Barker W C 2003 The Protein Information Resource Nucleic Acids Research 31 1 ss 345 347 doi 10 1093 nar gkg040 PMC 165487 2 PMID 12520019 Boeckmann B Bairoch A Apweiler R Blatter M C Estreicher A Gasteiger E Martin M J Michoud K O Donovan C Phan I Pilbout S Schneider M 2003 The SWISS PROT protein knowledgebase and its supplement TrEMBL in 2003 Nucleic Acids Research 31 1 ss 365 370 doi 10 1093 nar gkg095 PMC 165542 2 PMID 12520024 Bairoch A Apweiler R 1996 The SWISS PROT protein sequence data bank and its new supplement TREMBL Nucleic Acids Research 24 1 ss 21 25 doi 10 1093 nar 24 1 21 PMC 145613 2 PMID 8594581 Bairoch A 2000 Serendipity in bioinformatics the tribulations of a Swiss bioinformatician through exciting times Bioinformatics 16 1 ss 48 64 doi 10 1093 bioinformatics 16 1 48 PMID 10812477 5 Subat 2024 tarihinde kaynagindan arsivlendi Erisim tarihi 5 Subat 2024 Severine Altairac Naissance d une banque de donnees Interview du prof Amos Bairoch 12 Temmuz 2010 tarihinde Wayback Machine sitesinde arsivlendi a b c Apweiler R Bairoch A Wu C H 2004 Protein sequence databases Current Opinion in Chemical Biology 8 1 ss 76 80 doi 10 1016 j cbpa 2003 12 004 PMID 15036160 a b Uniprot C 2009 The Universal Protein Resource UniProt in 2010 Nucleic Acids Research 38 Database issue ss D142 D148 doi 10 1093 nar gkp846 PMC 2808944 2 PMID 19843607 UniProtKB Swiss Prot Release 2023 01 statistics web expasy org 4 Nisan 2023 tarihinde kaynagindan arsivlendi Erisim tarihi 31 Mart 2023 a b c How do we manually annotate a UniProtKB entry UniProt 21 Eylul 2011 13 Aralik 2013 tarihinde kaynagindan arsivlendi Erisim tarihi 14 Nisan 2018 a b Apweiler R Bairoch A Wu C H Barker W C Boeckmann B Ferro S Gasteiger E Huang H Lopez R Magrane M Martin M J Natale D A o Donovan C Redaschi N Yeh L S 2004 UniProt The Universal Protein knowledgebase Nucleic Acids Research 32 90001 ss 115D 1119 doi 10 1093 nar gkh131 PMC 308865 2 PMID 14681372 Where do the UniProtKB protein sequences come from UniProt 21 Eylul 2011 15 Aralik 2013 tarihinde kaynagindan arsivlendi Erisim tarihi 14 Nisan 2018 Hassabis Demis 22 Temmuz 2022 Putting the power of AlphaFold into the world s hands Deepmind 24 Temmuz 2021 tarihinde kaynagindan arsivlendi Erisim tarihi 24 Temmuz 2021 Leinonen R Diez F G Binns D Fleischmann W Lopez R Apweiler R 2004 UniProt archive Bioinformatics 20 17 ss 3236 3237 doi 10 1093 bioinformatics bth191 PMID 15044231 Mar 30 2024 tarihinde kaynagindan arsivlendi PDF Protein Research Foundation 30 Agustos 2010 tarihinde kaynagindan arsivlendi Erisim tarihi 25 Agustos 2010 TROME Arsivlenmesi gereken baglantiya sahip kaynak sablonu iceren maddeler link a b Suzek B E Huang H McGarvey P Mazumder R Wu C H 2007 UniRef Comprehensive and non redundant UniProt reference clusters Bioinformatics 23 10 ss 1282 1288 doi 10 1093 bioinformatics btm098 PMID 17379688 Li W Jaroszewski L Godzik A 2001 Clustering of highly homologous sequences to reduce the size of large protein databases Bioinformatics 17 3 ss 282 283 doi 10 1093 bioinformatics 17 3 282 PMID 11294794 Dis baglantilarResmi site