Genontologie – Wikipedia

Wissensdatenbank für Funktionen von Genen und Genprodukten

Das Gen-Ontologie ((GEHEN) ist eine wichtige Bioinformatik-Initiative zur Vereinheitlichung der Darstellung von Genen und Genproduktattributen über alle Arten hinweg.[1] Das Projekt zielt insbesondere darauf ab: 1) sein kontrolliertes Vokabular von Genen und Genproduktattributen beizubehalten und weiterzuentwickeln; 2) Annotieren von Genen und Genprodukten sowie Assimilieren und Verbreiten von Annotationsdaten; und 3) Bereitstellung von Werkzeugen für den einfachen Zugriff auf alle Aspekte der vom Projekt bereitgestellten Daten und für die funktionale Interpretation experimenteller Daten unter Verwendung des GO, beispielsweise über eine Anreicherungsanalyse.[2][3] GO ist Teil eines größeren Klassifizierungsaufwands, der Open Biomedical Ontologies, und gehört zu den ersten Kandidaten der OBO-Gießerei.[4]

Während sich die Gen-Nomenklatur auf Gene und Genprodukte konzentriert, konzentriert sich die Gen-Ontologie auf die Funktion der Gene und Genprodukte. Das GO erweitert auch den Aufwand, indem es die Markup-Sprache verwendet, um die Daten (nicht nur der Gene und ihrer Produkte, sondern auch der kuratierten Attribute) maschinenlesbar zu machen und dies auf eine Weise, die über alle Arten hinweg einheitlich ist (während Konventionen der Gen-Nomenklatur) variieren je nach biologischem Taxon).

Begriffe und Ontologie[edit]

Aus praktischer Sicht ist eine Ontologie eine Darstellung von etwas, über das wir Bescheid wissen. “Ontologien” bestehen aus Darstellungen von Dingen, die nachweisbar oder direkt beobachtbar sind, und den Beziehungen zwischen diesen Dingen. In der Biologie und verwandten Bereichen gibt es keine universelle Standardterminologie, und die Verwendung von Begriffen kann für eine Art, ein Forschungsgebiet oder sogar eine bestimmte Forschungsgruppe spezifisch sein. Dies erschwert die Kommunikation und den Datenaustausch. Das Gen-Ontologie-Projekt bietet eine Ontologie definierter Begriffe, die die Eigenschaften von Genprodukten darstellen. Die Ontologie umfasst drei Bereiche:

Jeder GO-Begriff innerhalb der Ontologie hat einen Begriffsnamen, der ein Wort oder eine Wortfolge sein kann. eine eindeutige alphanumerische Kennung; eine Definition mit zitierten Quellen; und eine Ontologie, die die Domäne angibt, zu der sie gehört. Begriffe können auch Synonyme haben, die als genau gleichbedeutend mit dem Begriff Name, breiter, enger oder verwandt eingestuft werden. Verweise auf gleichwertige Konzepte in anderen Datenbanken; und Kommentare zur Bedeutung oder Verwendung des Begriffs. Die GO-Ontologie ist als gerichteter azyklischer Graph strukturiert, und jeder Begriff hat definierte Beziehungen zu einem oder mehreren anderen Begriffen in derselben Domäne und manchmal zu anderen Domänen. Das GO-Vokabular ist speziesneutral und enthält Begriffe für Prokaryoten und Eukaryoten, einzelne und mehrzellige Organismen.

GO ist nicht statisch, und Ergänzungen, Korrekturen und Änderungen werden von Mitgliedern der Forschungs- und Anmerkungsgemeinschaft sowie von denjenigen, die direkt am GO-Projekt beteiligt sind, vorgeschlagen und angefordert.[5] Beispielsweise kann ein Annotator einen bestimmten Begriff anfordern, um einen Stoffwechselweg darzustellen, oder ein Abschnitt der Ontologie kann mit Hilfe von Community-Experten (z[6]). Vorgeschlagene Änderungen werden von den Ontologie-Redakteuren überprüft und gegebenenfalls implementiert.

Die GO-Ontologie- und Anmerkungsdateien sind auf der GO-Website frei verfügbar[7] in verschiedenen Formaten oder online über den GO-Browser AmiGO zugänglich. Das Gene Ontology-Projekt bietet auch herunterladbare Zuordnungen seiner Begriffe zu anderen Klassifizierungssystemen.

Beispielbegriff[edit]

id: GO: 0000016
Name: Laktaseaktivität
Ontologie: molekulare Funktion
def: “Katalyse der Reaktion: Lactose + H2O = D-Glucose + D-Galactose.” [EC:3.2.1.108]
Synonym: “Lactase-Phlorizin-Hydrolase-Aktivität” BROAD [EC:3.2.1.108]
Synonym: “Lactose-Galactohydrolase-Aktivität” GENAU [EC:3.2.1.108]
xref: EC: 3.2.1.108
xref: MetaCyc: LACTASE-RXN
xref: Reaktom: 20536
is_a: GO: 0004553! Hydrolaseaktivität, Hydrolyse von O-Glycosylverbindungen

Datenquelle:[8]

Anmerkung[edit]

Die Annotation von Genomen umfasst die Praxis der Erfassung von Daten über ein Genprodukt, und GO-Annotationen verwenden dazu Begriffe aus dem GO. Anmerkungen von GO-Kuratoren werden auf der GO-Website integriert und verbreitet, wo sie direkt heruntergeladen oder mit AmiGO online angezeigt werden können.[9] Neben der Genproduktkennung und dem relevanten GO-Begriff enthalten GO-Annotationen mindestens die folgenden Daten :. Referenz wird verwendet, um die Anmerkung zu machen (z. B. ein Zeitschriftenartikel); Ein Beweiscode Angabe der Art der Beweise, auf denen die Anmerkung basiert; Das Datum und der Ersteller der Anmerkung

Unterstützende Informationen können je nach GO-Begriff und verwendeten Nachweisen sowie ergänzende Informationen, wie z. B. die Bedingungen, unter denen die Funktion eingehalten wird, ebenfalls in eine GO-Anmerkung aufgenommen werden.

Der Evidence Code stammt aus einem kontrollierten Vokabular von Codes, der Evidence Code Ontology, die sowohl manuelle als auch automatisierte Annotationsmethoden abdeckt.[10] Zum Beispiel, Rückverfolgbare Autorenerklärung (TAS) bedeutet, dass ein Kurator eine veröffentlichte wissenschaftliche Arbeit gelesen hat und die Metadaten für diese Anmerkung ein Zitat zu dieser Arbeit enthalten. Aus der Sequenzähnlichkeit abgeleitet (ISS) bedeutet, dass ein menschlicher Kurator die Ergebnisse einer Sequenzähnlichkeitssuche überprüft und überprüft hat, ob sie biologisch bedeutsam sind. Anmerkungen aus automatisierten Prozessen (z. B. Neuzuordnung von Anmerkungen, die mit einem anderen Anmerkungsvokabular erstellt wurden) erhalten den Code Aus der elektronischen Anmerkung abgeleitet (IEA). Im Jahr 2010 wurden über 98% aller GO-Annotationen nicht von Kuratoren rechnerisch abgeleitet, aber ab dem 2. Juli 2019 wurden nur etwa 30% aller GO-Annotationen rechnerisch abgeleitet.[11][12]

Da diese Anmerkungen nicht von einem Menschen überprüft werden, betrachtet das GO-Konsortium sie als geringfügig weniger zuverlässig und sie sind üblicherweise auf höherer Ebene und weniger detailliert. Vollständige Anmerkungsdatensätze können von der GO-Website heruntergeladen werden. Um die Entwicklung von Anmerkungen zu unterstützen, bietet das GO-Konsortium Workshops an und betreut neue Gruppen von Kuratoren und Entwicklern.

Viele Algorithmen für maschinelles Lernen wurden entwickelt und implementiert, um Annotationen zur Gen-Ontologie vorherzusagen.[13][14]

Beispielanmerkung[edit]

Genprodukt: Actin, Alpha-Herzmuskel 1, UniProtKB: P68032
GO Begriff: Herzkontraktion; GO: 0060047 (biologischer Prozess)
Evidenzcode: Abgeleitet vom Mutant Phenotype (IMP)
Referenz: PMID 17611253
Zugewiesen von: UniProtKB, 6. Juni 2008

Datenquelle:[15]

Es steht eine Vielzahl von Tools zur Verfügung[16] sowohl online als auch zum Herunterladen unter Verwendung der vom GO-Projekt bereitgestellten Daten. Die überwiegende Mehrheit davon stammt von Dritten; Das GO-Konsortium entwickelt und unterstützt zwei Tools: AmiGO und OBO-Edit.

AmiGO[17][9] ist eine webbasierte Anwendung, mit der Benutzer Ontologien und Annotationsdaten für Genprodukte abfragen, durchsuchen und visualisieren können. Es hat auch ein BLAST-Tool,[18] Tools zur Analyse größerer Datenmengen,[19][20] und eine Schnittstelle zum direkten Abfragen der GO-Datenbank.[21]

AmiGO kann online auf der GO-Website verwendet werden, um auf die vom GO-Konsortium bereitgestellten Daten zuzugreifen, oder es kann heruntergeladen und für die lokale Verwendung in jeder Datenbank installiert werden, die das GO-Datenbankschema verwendet (z[22]). Es ist kostenlose Open-Source-Software und als Teil der Go-Dev-Software-Distribution verfügbar.[23]

OBO-Edit[24] ist ein plattformunabhängiger Open-Source-Ontologie-Editor, der vom Gene Ontology Consortium entwickelt und gepflegt wird. Es ist in Java implementiert und verwendet einen graphorientierten Ansatz zum Anzeigen und Bearbeiten von Ontologien. OBO-Edit enthält eine umfassende Such- und Filteroberfläche mit der Option, Teilmengen von Begriffen zu rendern, um sie visuell zu unterscheiden. Die Benutzeroberfläche kann auch gemäß den Benutzereinstellungen angepasst werden. OBO-Edit verfügt auch über einen Reasoner, der auf Links, die nicht explizit angegeben wurden, basierend auf vorhandenen Beziehungen und deren Eigenschaften schließen kann. Obwohl OBO-Edit für biomedizinische Ontologien entwickelt wurde, kann es zum Anzeigen, Suchen und Bearbeiten beliebiger Ontologien verwendet werden. Es steht frei zum Download zur Verfügung.[23]

Konsortium[edit]

Das Gene Ontology Consortium besteht aus einer Reihe von biologischen Datenbanken und Forschungsgruppen, die aktiv am Projekt zur Genontologie beteiligt sind.[12] Dies umfasst eine Reihe von Modellorganismusdatenbanken und Proteindatenbanken für mehrere Arten, Softwareentwicklungsgruppen und eine eigene Redaktion.

Geschichte[edit]

Die Gen-Ontologie wurde ursprünglich 1998 von einem Forscherkonsortium konstruiert, das die Genome von drei Modellorganismen untersuchte: Drosophila melanogaster (Fruchtfliege), Mus musculus (Maus) und Saccharomyces cerevisiae (Bier- oder Bäckerhefe).[25] Viele andere Modellorganismus-Datenbanken haben sich dem Gene Ontology Consortium angeschlossen und nicht nur Annotationsdaten, sondern auch die Entwicklung der Ontologien und Tools zum Anzeigen und Anwenden der Daten beigetragen. Viele wichtige Datenbanken für Pflanzen, Tiere und Mikroorganismen leisten einen Beitrag zu diesem Projekt.[7] Ab Juli 2019 enthält der GO 44.945 Begriffe; Es gibt 6.408.283 Anmerkungen zu 4.467 verschiedenen biologischen Organismen.[7] Es gibt eine umfangreiche Literatur zur Entwicklung und Verwendung des GO, und es ist zu einem Standardwerkzeug im Bioinformatik-Arsenal geworden. Ihre Ziele haben drei Aspekte: Aufbau der Genontologie, Zuordnung der Ontologie zu Gen / Genprodukten und Entwicklung von Software und Datenbanken für die ersten beiden Objekte.

Es erscheinen auch mehrere Analysen der Gen-Ontologie unter Verwendung formaler, domänenunabhängiger Eigenschaften von Klassen (der Metaproperties). Zum Beispiel eine ontologische Analyse biologischer Ontologien siehe.[26]

Siehe auch[edit]

Verweise[edit]

  1. ^ Das Gene Ontology Consortium (Januar 2008). “Das Gen-Ontologie-Projekt 2008”. Nukleinsäureforschung. 36 (Datenbankproblem): D440–4. doi:10.1093 / nar / gkm883. PMC 2238979. PMID 17984083.
  2. ^ Dessimoz, Christophe; Škunca, Nives, Hrsg. (2017). Das Handbuch zur Gen-Ontologie. Methoden der Molekularbiologie. 1446. doi:10.1007 / 978-1-4939-3743-1. ISBN 9781493937431. ISSN 1064-3745. S2CID 3708801.
  3. ^ Gaudet, Pascale; Škunca, Nives; Hu, James C.; Dessimoz, Christophe (2017). “Primer auf der Gen-Ontologie”. Das Handbuch zur Gen-Ontologie. Methoden der Molekularbiologie. 1446. S. 25–37. doi:10.1007 / 978-1-4939-3743-1_3. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMC 6377150. PMID 27812933.
  4. ^ Smith B., Ashburner M., Rosse C., Bard J., Bug W., Ceusters W., Goldberg L. J., Eilbeck K., Irland A., Mungall C. J., Leontis N., Rocca-Serra P., Ruttenberg A., Sansone SA, Scheuermann RH, Shah N. Whetzel PL, Lewis S. (November 2007). “Die OBO-Gießerei: koordinierte Entwicklung von Ontologien zur Unterstützung der Integration biomedizinischer Daten”. Naturbiotechnologie. 25 (11): 1251–5. doi:10.1038 / nbt1346. PMC 2814061. PMID 17989687.
  5. ^ Liebend, Ruth C. (2017). “Wie trägt die wissenschaftliche Gemeinschaft zur Genontologie bei?” In Dessimoz, C; Skunca, N (Hrsg.). Das Handbuch zur Gen-Ontologie. Methoden der Molekularbiologie. 1446. Springer (New York). S. 85–93. doi:10.1007 / 978-1-4939-3743-1_7. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMID 27812937.
  6. ^ Diehl AD, Lee JA, Scheuermann RH, Blake JA (April 2007). “Ontologieentwicklung für biologische Systeme: Immunologie”. Bioinformatik. 23 (7): 913–5. doi:10.1093 / bioinformatics / btm029. PMID 17267433.
  7. ^ ein b c “Die Gen-Ontologie-Ressource”. Gen-Ontologie-Konsortium.
  8. ^ Sjcarbon, Gen Ontology Consortium Wiki (10.07.2013). “AmiGO_2_Manual: term_Page” (html).
  9. ^ ein b AmiGO– die aktuellen offiziellen webbasierten Tools zum Durchsuchen und Durchsuchen der Gene Ontology-Datenbank
  10. ^ “Evidence Code Ontology”. Evidence Code Ontology.
  11. ^ du Plessis L., Skunca N., Dessimoz C. (November 2011). “Was, wo, wie und warum der Genontologie – eine Grundierung für Bioinformatiker”. Briefings in Bioinformatik. 12 (6): 723–35. doi:10.1093 / bib / bbr002. PMC 3220872. PMID 21330331.
  12. ^ ein b “Das GO-Konsortium”. Abgerufen 2009-03-16.
  13. ^ Pinoli P, Chicco D, Masseroli M (Juni 2013). “Computeralgorithmen zur Vorhersage der Annotation von Gen-Ontologien”. BMC Bioinformatik. 16 (6): S4. doi:10.1186 / 1471-2105-16-S6-S4. PMC 4416163. PMID 25916950.
  14. ^ Cozzetto, Domenico; Jones, David T. (2017). “Berechnungsmethoden für Annotationstransfers aus der Sequenz”. In Dessimoz, C; Skunca, N (Hrsg.). Das Handbuch zur Gen-Ontologie. Methoden der Molekularbiologie. 1446. Springer (New York). S. 55–67. doi:10.1007 / 978-1-4939-3743-1_5. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMID 27812935.
  15. ^ Das GO-Konsortium (16.03.2009). “AmiGO: P68032-Verbände”.
  16. ^ Mosquera JL, Sánchez-Pla A (Juli 2008). “SerbGO: Suche nach dem besten GO-Tool”. Nukleinsäureforschung. 36 (Webserver-Problem): W368–71. doi:10.1093 / nar / gkn256. PMC 2447766. PMID 18480123.
  17. ^ Carbon S, Irland A, Mungall CJ, Shu S, Marshall B, Lewis S (Januar 2009). AmiGO Hub; Arbeitsgruppe Webpräsenz. “AmiGO: Online-Zugriff auf Ontologie- und Anmerkungsdaten”. Bioinformatik. 25 (2): 288–9. doi:10.1093 / bioinformatics / btn615. PMC 2639003. PMID 19033274.
  18. ^ “AmiGO BLAST Werkzeug”. Archiviert von das Original am 20.08.2011. Abgerufen 2009-03-13.
  19. ^ AmiGO Term Enrichment Tool Archiviert 07.04.2008 an der Wayback-Maschine; findet wichtige gemeinsame GO-Begriffe in einem Anmerkungssatz
  20. ^ AmiGO Slimmer Archiviert 29.09.2011 an der Wayback-Maschine; Ordnet granulare Anmerkungen allgemeinen Begriffen zu
  21. ^ GANS, GO Online SQL-Umgebung; ermöglicht die direkte SQL-Abfrage der GO-Datenbank
  22. ^ Das Plant Ontology Consortium (2009-03-16). “Plant Ontology Consortium”. Abgerufen 2009-03-16.
  23. ^ ein b “Gen-Ontologie-Downloads bei SourceForge”. Abgerufen 2009-03-16.
  24. ^ Day-Richter J., Harris MA, Haendel M., Lewis S. (August 2007). “OBO-Edit – ein Ontologie-Editor für Biologen”. Bioinformatik. 23 (16): 2198–200. doi:10.1093 / bioinformatics / btm112. PMID 17545183.
  25. ^ Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L, Kasarskis A, Lewis S, Matese JC, Richardson JE, Ringwald M., Rubin GM, Sherlock G. (Mai 2000). “Genontologie: Werkzeug zur Vereinheitlichung der Biologie. The Gene Ontology Consortium”. Naturgenetik. 25 (1): 25–9. doi:10.1038 / 75556. PMC 3037419. PMID 10802651.
  26. ^ Deb, B. (2012). “Eine ontologische Analyse einiger biologischer Ontologien”. Grenzen in der Genetik. 3: 269. doi:10.3389 / fgene.2012.00269. PMC 3509948. PMID 23226158.
  27. ^ Götz S., García-Gómez J. M., Terol J., Williams TD, Nagaraj SH, Nueda M. J., Robles M., Talón M., Dopazo J., Conesa A. (Juni 2008). “Funktionale Annotation mit hohem Durchsatz und Data Mining mit der Blast2GO-Suite”. Nukleinsäureforschung. 36 (10): 3420–35. doi:10.1093 / nar / gkn176. PMC 2425479. PMID 18445632.

Externe Links[edit]