Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.

Gen ontolojisi

Подписчиков: 0, рейтинг: 0

Gen ontolojisi, ya da GO, gen ve gen ürünü vasıflarının bütün türler kapsamında temsilini birleştirmek için büyük bir biyoenformatik girişimidir. Proje özellikle şunları hedeflemektedir:

  1. Gen ve gen ürünü vasıflarına dair sahip olduğu denetli söz dağarcığının sürdürülmesi ve geliştirilmesi;
  2. Gen ve gen ürünlerinin notlaması, not verilerinin özümsenmesi ve dağıtılması;
  3. Projenin sağladığı verinin bütün boyutlarına kolayca erişilmesi için ve deneysel verilerin GO kullanarak (zenginleşim analizi gibi yollarla) işlevsel yorumlanabilmesi için araçlar sağlanması.

GO daha geniş bir sınıflandırma çabası olan Açık Biyomedikal Ontolojiler'in (Open Biomedical Ontologies - OBO) bir parçasıdır.

GO terimleri ve ontolojisi

Pratik bir bakışla ontoloji, bilgi sahibi olduğumuz bir şeyin temsilidir. "Ontolojiler" tespit edilebilir ya da doğrudan gözlemlenebilir şeylerin ve bu şeyler arasındaki ilişkilerin temsilinden oluşur. Biyoloji ve ilişkili sahalarda evrensel bir standart terminoloji bulunmamaktadır, belirli bir türe özgü, araştırma alanına özgü, hatta belirli bir araştırma grubuna özgü terim kullanımları olabilmektedir. Bu da verilere dair iletişim ve paylaşımı daha zor kılmaktadır. Gen Ontolojisi projesi gen ürünü özelliklerini temsil eden tanımlı terimlerin bir ontolojisini sağlar. Ontoloji üç sahayı kapsar:

  • hücresel bileşen, bir hücrenin ya da hücredışı ortamının parçaları;
  • moleküler işlev, bir gen ürününün moleküler düzeydeki bağlanma ya da enzim katalizi gibi öğesel faaliyetleri;
  • biyolojik süreç, entegre yaşam birimlerinin (hücrelerin, dokuların, organların ve organizmaların) işleyişiyle ilgili, tanımlı bir başlangıcı ve sonu olan işlemler veya moleküler olay kümeleri.

Ontoloji dahilindeki her bir GO teriminin bir terim adı vardır, bu ad şunlardan birisi olabilir: bir sözcük ya da sözcük dizisi; eşsiz bir alfanumerik belirteç; atıflar yapan bir tanımlama; ait olduğu sahayı belirten bir ad-uzamı. Terimlere ait eş-anlamlılar olabilir: bunlar terime tam eşdeğer olarak, daha geniş ya da dar kapsamlı olarak, veya terimle ilişkili olarak sınıflanırlar. Yine terimlere ait, başka veritabanlarındaki eşdeğer kavramlara atıflar; terim anlamı ya da kullanımı üzerine yorumlar olabilir. GO ontolojisi bir yönlü-çevrimsiz-çizge olarak yapılanmıştır, ve her bir terim, aynı sahaya ait (bazen başka sahalara da ait) bir ya da daha fazla başka terim ile tanımlı ilişkilere sahiptir. GO söz dağarcığı tür-tarafsız olarak tasarlanmıştır, ve prokaryotlara, ökaryotlara, tek ya da çok hücreli organizmalara uygulanabilir terimler içermektedir.

GO sabit değildir, ve ekleme, düzeltme ve değiştirme önerileri hem araştırma ve notlama topluluğu üyelerinden hem de doğrudan GO projesine dahil olan kişilerden gelir ve yine bu kişilerden istenir. Örneğin, bir notlayıcı bir metabolik patikayı temsil edecek özgül bir terim talep edebilir, ya da ontolojinin bir kısmı topluluk uzmanlarının yardımıyla gözden geçirilebilir (örn.). Önerilen düzenlemeler ontoloji editörleri tarafından değerlendirilir ve uygun olduklarında yürürlüğe geçirilir.

GO ontoloji dosyası GO websitesinden farklı dosya biçimleriyle ücretsiz olarak edinilebilir, ya da GO tarayıcısını kullanarak çevrimiçi erişilebilir AmiGO9 Ocak 2014 tarihinde Wayback Machine sitesinde arşivlendi.. Gen Ontolojisi projesi ayrıca terimlerinin başka sınıflandırma sistemleriyle eşleştirme dosyalarını da sağlamaktadır.

Örnek GO terimi

id:         GO:0000016
name:       lactase activity
namespace:  molecular_function
def:        "Catalysis of the reaction: lactose + H2O = D-glucose + D-galactose." [EC:3.2.1.108]
synonym:    "lactase-phlorizin hydrolase activity" BROAD [EC:3.2.1.108]
synonym:    "lactose galactohydrolase activity" EXACT [EC:3.2.1.108]
xref:       EC:3.2.1.108
xref:       MetaCyc:LACTASE-RXN
xref:       Reactome:20536
is_a:       GO:0004553 ! hydrolase activity, hydrolyzing O-glycosyl compounds

Veri kaynağı:

Notlama

Genom notlaması bir gen ürününe dair veri yakalama pratiğidir ve GO notlamaları bunun için GO ontolojisindeki terimleri kullanır. GO Konsorsiyumunun üyeleri kendi notlamalarını entegrasyon ve dağıtım için GO websitesine gönderirler, notlamalar bu sitede doğrudan indirilebilirler ya da AmiGO9 Ocak 2014 tarihinde Wayback Machine sitesinde arşivlendi. kullanarak çevrimiçi görüntülenebilirler. Gen ürünü belirteci ve ilgili GO terimine ek olarak, GO notlamalarında şu veriler bulunur:

  • Notlamayı yapmakta kullanılan atıf (örn. bir dergi makalesi)
  • Notlamanın dayandırıldığı kanıt tipini belirten bir kanıt kodu
  • Notlamanın tarihi ve yaratıcısı

Kanıt kodu, hem manüel hem otomatik notlama yöntemlerini kapsayan bir denetli söz dağarcığı olan Kanıt Kodu Ontolojisinden gelir. Örneğin, İzlenebilen Yazar Beyanı (Traceable Author Statement - TAS) bir küratörün yayınlanmış bir bilimsel makaleyi okumuş olduğu ve bu notlamadaki üstverinin bu makaleden bir alıntı taşıdığı anlamına gelir; Dizi Benzerliğinden Çıkarım (Inferred from Sequence Similarity - ISS) bir küratörün bir dizi benzerliği aramasına ait çıktıyı değerlendirmiş ve biyolojik anlam taşıdığını geçerlemiş olduğu anlamına gelir. Otomatik süreçlerden (örn. başka bir notlama söz dağarcığı kullanarak yaratılmış notlamaların yeniden eşleştirilmesi) gelen notlamalara Elektronik Notlamadan Çıkarım (Inferred from Electronic Annotation - IEA) kodu verilir. 1 Nisan 2010 itibarıyla bütün GO notlamalarının %98'den fazlası hesaplamalı olarak çıkarsanmıştı, küratörler tarafından değil. Bu notlamalar bir insanın muayenesinden geçmemiş olduğundan, GO Konsorsiyumu bunları daha az güvenilir görmektedir ve AmiGO'da çevrimiçi olarak sunulan verilere bunların yalnızca bir altkümesini dahil etmektedir. Tam notlama veri kümeleri GO websitesinden 26 Kasım 2014 tarihinde Wayback Machine sitesinde arşivlendi. indirilebilir. Notlamanın gelişimini desteklemek için, GO Konsorsiyumu yeni geliştirici gruplara çalışma kampları ve mentorlar sağlamaktadır.

Örnek notlama

Gen ürünü:  Actin, alpha cardiac muscle 1, UniProtKB:P68032
GO terimi:  heart contraction ; GO:0060047 (biyolojik süreç)
Kanıt kodu: Mutant Fenotipinden Çıkarım (Inferred from Mutant Phenotype - IMP)
Atıf:       PMID 17611253 2 Haziran 2015 tarihinde Wayback Machine sitesinde arşivlendi.
Atayan:     UniProtKB, 6 Haziran 2008

Veri kaynağı:

Araçlar

GO projesinin sağladığı verileri kullanan, hem çevrimiçi hem de indirerek kullanılabilecek çok sayıda araç bulunmaktadır. Bunların muazzam çoğunluğu üçüncü taraflardan gelir; GO Konsorsiyumu araçlardan iki tanesini geliştirip desteklemektedir, AmiGO ve OBO-Edit.

AmiGO, kullanıcıların ontolojileri ve gen ürünü notlama verilerini sorgulamasına, taramasına ve görselleştirmesine olanak veren web-tabanlı bir uygulamadır. Ayrıca, bir BLAST aracı, daha büyük veri kümelerinin analizine olanak veren araçları, ve GO veritabanını doğrudan sorgulamak için bir arayüzü de bulunur.

AmiGO GO Konsorsiyumunun sağladığı verilere erişmek için GO websitesinde çevrimiçi olarak kullanılabilir, ya da GO veritabanı şemasına uygun herhangi bir veritabanı üzerinde yerel kullanım için indirilerek kurulum yapılabilir (örn.). Özgür bir açık kaynaklı yazılımdır ve go-dev yazılım dağıtımının bir parçası olarak sunulmaktadır.

OBO-Edit, Gen Ontolojisi Konsorsiyumu tarafından geliştirilip sürdürülen, açık kaynaklı, platformdan-bağımsız ontoloji düzenleyicisidir. Java'da yazılmıştır ve ontolojilerin görüntülenmesi ve düzenlenmesinde çizge-yönelimli bir yaklaşım kullanır. OBO-Edit kapsamlı bir arama ve süzme arayüzü, ve terimlerin görsel olarak ayırt edilmesi için altkümeleri çizdirme seçeneği içermektedir; kullanıcı arayüzünü kullanıcı tercihlerine göre özelleştirilmesi de mümkündür. OBO-Edit'te ayrıca açıkça beyan edilmemiş bağlantıları mevcut ilişkilerine ve özelliklerine dayalı olarak çıkarsayabilen bir semantik akıl yürütücü de bulunmaktadır. Biyomedikal ontolojiler için geliştirilmiş olsa da, OBO-Edit herhangi bir ontolojiyi görüntülemek, aramak ve düzenlemek için kullanılabilir. Ücretsiz olarak indirilebilmektedir.

GO Konsorsiyumu

GO Konsorsiyumu GO projesine etkin olarak dahil olan biyolojik veritabanlarının ve araştırma gruplarının kümesidir. Bunlar, çeşitli model organizma veritabanlarını, çok-türlü protein veritabanlarını, yazılım geliştirme gruplarını, ve tahsis edilmiş editoryal bir büroyu içerir.

Tarih

Gen ontolojisi başlangıçta üç model organizmanın (Drosophila melanogaster (meyve sineği), Mus musculus (fare), ve Saccharomyces cerevisiae (bira ya da ekmek mayası)) genomunu çalışan araştırmacıların bir konsorsiyumu tarafından 1998'de inşa edildi. Birçok diğer model organizma veritabanları Gen Ontolojisi konsorsiyumuna katılarak, hem notlama verisine katkı yaptılar, hem de verilerin görüntülenmesi ve uygulanması için ontoloji ve araçların geliştirilmesine katkı yaptılar. Şimdiye dek, bitki, hayvan ve mikroorganizmalara ait başlıca veritabanlarının çoğu projeye yönelik katkıda bulundular. Ocak 2008 itibarıyla GO, geniş bir çeşitlilikteki biyolojik organizmalara uygulanabilen 24,500'den fazla terim içermektedir. GO'nun gelişimi ve kullanımı üzerine belirgin bir literatür vücut bulmuştur, ve biyoenformatik cephaneliğinde standart bir araç olmuştur. Hedeflerinin üç boyutu vardır: gen ontolojisi oluşturulması, genlere/gen ürünlerine ontoloji ataması yapılması ve bu iki hedefe dönük yazılım ve veritabanları geliştirilmesi.

Ayrıca bakınız

Dış bağlantılar

  • Gen Ontolojisi Konsorsiyumu 26 Kasım 2014 tarihinde Wayback Machine sitesinde arşivlendi. — Ontolojilere erişim sağlar, yazılım araçları, notlanmış gen ürünü listeleri, GO'yu ve kullanımlarını tarif eden kaynak belgeler bulunur.
  • GO Terimi Zenginleşimi proteinler ve GO notlamaları arasında paylaşılan çağrışımların teşhis edilmesinde kullanılan yaygın bir istatistiksel yöntemdir.
  • GONUTS Wiki — üçüncü taraf GO terimi belgelendirmesi, birçok başlıca model organizma veritabanındaki GO notlamalarına bağlantılar içerir.
  • GOCat — Biyomedikal Metinlerin İşlevsel Notlamasına yardımcı Otomatik GO Kategorileyici/Tarayıcı; yüksek-hacimli deneylerce üretilen protein ve gen isim listelerini işlevsel olarak karakterize etmekte kullanışlıdır
  • Protein Ontolojisi Projesi — Protein Ontolojisi (PO), PO ve kullanımlarını tarif eden kaynak belgeler.
  • EAGLi 16 Şubat 2015 tarihinde Wayback Machine sitesinde arşivlendi. — MEDLINE için terminolojiye-dayalı (Gen Ontolojisi, Swiss-Prot anahtar sözcükleri, vb.) bir biyomedikal soru yanıtlama motoru
  • PubOnto — Gen Ontolojisi ve diğer ontolojilere dayanan Medline Dolaşılması.
  • WikiProfessional18 Ocak 2019 tarihinde Wayback Machine sitesinde arşivlendi. — muğlaksızlama, bilgi üretimi ve işbirlikçi zeka.
  • SimCT — bir ontolojiye notlanmış biyolojik nesneler arasındaki ilişkilerin bir öbekleme ağacı biçiminde görüntülenmesi için web-tabanlı araç.
  • SerbGO — farklı programların yeteneklerini karşılaştıran, ortak özelliklerini ve farklarını gösteren, kullanıcının özgül olarak gereksindiği yeteneklere hangi araçların (eğer varsa) sahip olduğunu gösteren bir GO aracı
  • Saha-merkezli Gen Ontolojisi 2 Ocak 2015 tarihinde Wayback Machine sitesinde arşivlendi. — işlevler, fenotipler, hastalıklar ve dahası üzerine saha-merkezli ontolojilerin veritabanı
  • GO2PUB 29 Eylül 2013 tarihinde Wayback Machine sitesinde arşivlendi. — gen ontolojisi terimlerinin semantik genişletilmesi ile PubMed'in sorgulanması

Новое сообщение