[{"@context":"http:\/\/schema.org\/","@type":"BlogPosting","@id":"https:\/\/wiki.edu.vn\/wiki13\/2020\/12\/24\/bioinformatik-wikipedia\/#BlogPosting","mainEntityOfPage":"https:\/\/wiki.edu.vn\/wiki13\/2020\/12\/24\/bioinformatik-wikipedia\/","headline":"Bioinformatik – Wikipedia","name":"Bioinformatik – Wikipedia","description":"Computergest\u00fctzte Analyse gro\u00dfer, komplexer biologischer Datenmengen Fr\u00fche Bioinformatik – rechnerische Ausrichtung experimentell bestimmter Sequenzen einer Klasse verwandter Proteine; Weitere Informationen","datePublished":"2020-12-24","dateModified":"2020-12-24","author":{"@type":"Person","@id":"https:\/\/wiki.edu.vn\/wiki13\/author\/lordneo\/#Person","name":"lordneo","url":"https:\/\/wiki.edu.vn\/wiki13\/author\/lordneo\/","image":{"@type":"ImageObject","@id":"https:\/\/secure.gravatar.com\/avatar\/44a4cee54c4c053e967fe3e7d054edd4?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/44a4cee54c4c053e967fe3e7d054edd4?s=96&d=mm&r=g","height":96,"width":96}},"publisher":{"@type":"Organization","name":"Enzyklop\u00e4die","logo":{"@type":"ImageObject","@id":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","url":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","width":600,"height":60}},"image":{"@type":"ImageObject","@id":"https:\/\/upload.wikimedia.org\/wikipedia\/commons\/thumb\/a\/a7\/WPP_domain_alignment.PNG\/500px-WPP_domain_alignment.PNG","url":"https:\/\/upload.wikimedia.org\/wikipedia\/commons\/thumb\/a\/a7\/WPP_domain_alignment.PNG\/500px-WPP_domain_alignment.PNG","height":"116","width":"500"},"url":"https:\/\/wiki.edu.vn\/wiki13\/2020\/12\/24\/bioinformatik-wikipedia\/","wordCount":19453,"articleBody":"Computergest\u00fctzte Analyse gro\u00dfer, komplexer biologischer Datenmengen Fr\u00fche Bioinformatik – rechnerische Ausrichtung experimentell bestimmter Sequenzen einer Klasse verwandter Proteine; Weitere Informationen finden Sie in \u00a7 Sequenzanalyse. Bioinformatik ist ein interdisziplin\u00e4res Feld, das Methoden und Softwaretools zum Verst\u00e4ndnis biologischer Daten entwickelt, insbesondere wenn die Datens\u00e4tze gro\u00df und komplex sind. Als interdisziplin\u00e4res Wissenschaftsgebiet kombiniert die Bioinformatik Biologie, Informatik, Informationstechnik, Mathematik und Statistik, um die biologischen Daten zu analysieren und zu interpretieren. Bioinformatik wurde f\u00fcr verwendet in silico Analyse biologischer Abfragen mit mathematischen und statistischen Techniken.[clarification needed]Die Bioinformatik umfasst biologische Studien, die Computerprogrammierung als Teil ihrer Methodik verwenden, sowie eine spezifische Analyse “Pipelines”, die insbesondere im Bereich der Genomik wiederholt verwendet werden. \u00dcbliche Anwendungen der Bioinformatik umfassen die Identifizierung von Kandidatengenen und Einzelnukleotidpolymorphismen (SNPs). Oft erfolgt eine solche Identifizierung mit dem Ziel, die genetischen Grundlagen von Krankheiten, einzigartige Anpassungen, w\u00fcnschenswerte Eigenschaften (insbesondere bei landwirtschaftlichen Arten) oder Unterschiede zwischen Populationen besser zu verstehen. Auf weniger formale Weise versucht die Bioinformatik auch, die Organisationsprinzipien innerhalb von Nukleins\u00e4ure- und Proteinsequenzen zu verstehen, die als Proteomik bezeichnet werden.[1] Table of ContentsEinf\u00fchrung[edit]Geschichte[edit]Sequenzen[edit]Tore[edit]Beziehung zu anderen Feldern[edit]Sequenzanalyse[edit]DNA-Sequenzierung[edit]Sequenzassemblierung[edit]Annotation des Genoms[edit]Computergest\u00fctzte Evolutionsbiologie[edit]Vergleichende Genomik[edit]Pan-Genomik[edit]Genetik der Krankheit[edit]Analyse von Mutationen bei Krebs[edit]Gen- und Proteinexpression[edit]Analyse der Genexpression[edit]Analyse der Proteinexpression[edit]Analyse der Regulierung[edit]Analyse der zellul\u00e4ren Organisation[edit]Mikroskopie und Bildanalyse[edit]Proteinlokalisierung[edit]Kernorganisation von Chromatin[edit]Strukturelle Bioinformatik[edit]Netzwerk- und Systembiologie[edit]Molekulare Interaktionsnetzwerke[edit]Literaturanalyse[edit]Bildanalyse mit hohem Durchsatz[edit]Einzelzelldatenanalyse mit hohem Durchsatz[edit]Biodiversit\u00e4tsinformatik[edit]Ontologien und Datenintegration[edit]Datenbanken[edit]Software und Tools[edit]Open-Source-Bioinformatik-Software[edit]Webdienste in der Bioinformatik[edit]Bioinformatik-Workflow-Management-Systeme[edit]BioCompute- und BioCompute-Objekte[edit]Bildungsplattformen[edit]Konferenzen[edit]Siehe auch[edit]Verweise[edit]Weiterf\u00fchrende Literatur[edit]Externe Links[edit]Einf\u00fchrung[edit]Die Bioinformatik ist zu einem wichtigen Bestandteil vieler Bereiche der Biologie geworden. In der experimentellen Molekularbiologie erm\u00f6glichen Bioinformatik-Techniken wie Bild- und Signalverarbeitung die Extraktion n\u00fctzlicher Ergebnisse aus gro\u00dfen Mengen von Rohdaten. Auf dem Gebiet der Genetik hilft es bei der Sequenzierung und Annotation von Genomen und ihren beobachteten Mutationen. Es spielt eine Rolle beim Text Mining biologischer Literatur und bei der Entwicklung biologischer und genetischer Ontologien zur Organisation und Abfrage biologischer Daten. Es spielt auch eine Rolle bei der Analyse der Expression und Regulation von Genen und Proteinen. Bioinformatik-Tools helfen beim Vergleichen, Analysieren und Interpretieren genetischer und genomischer Daten und allgemeiner beim Verst\u00e4ndnis evolution\u00e4rer Aspekte der Molekularbiologie. Auf einer integrativeren Ebene hilft es, die biologischen Pfade und Netzwerke zu analysieren und zu katalogisieren, die ein wichtiger Bestandteil der Systembiologie sind. In der Strukturbiologie hilft es bei der Simulation und Modellierung von DNA,[2] RNA,[2][3] Proteine[4] sowie biomolekulare Wechselwirkungen.[5][6][7][8]Geschichte[edit]Historisch gesehen der Begriff Bioinformatik meinte nicht, was es heute bedeutet. Paulien Hogeweg und Ben Hesper pr\u00e4gten es 1970, um sich auf die Untersuchung von Informationsprozessen in biotischen Systemen zu beziehen.[9][10][11] Diese Definition stellte die Bioinformatik als ein Feld parallel zur Biochemie (Untersuchung chemischer Prozesse in biologischen Systemen).[9]Sequenzen[edit] Sequenzen von genetischem Material werden h\u00e4ufig in der Bioinformatik verwendet und sind mit Computern einfacher zu verwalten als manuell.Computer wurden in der Molekularbiologie unverzichtbar, als Proteinsequenzen verf\u00fcgbar wurden, nachdem Frederick Sanger Anfang der 1950er Jahre die Insulinsequenz bestimmt hatte. Der manuelle Vergleich mehrerer Sequenzen erwies sich als unpraktisch. Eine Pionierin auf diesem Gebiet war Margaret Oakley Dayhoff.[12] Sie stellte eine der ersten Proteinsequenzdatenbanken zusammen, die urspr\u00fcnglich als B\u00fccher ver\u00f6ffentlicht wurden[13] und wegweisende Methoden zur Sequenzausrichtung und molekularen Evolution.[14] Ein weiterer fr\u00fcher Beitrag zur Bioinformatik war Elvin A. Kabat, der 1970 mit seinen umfassenden Mengen an Antik\u00f6rpersequenzen, die zwischen 1980 und 1991 mit Tai Te Wu ver\u00f6ffentlicht wurden, Pionierarbeit in der biologischen Sequenzanalyse leistete.[15]In den 1970er Jahren wurden neue Techniken zur Sequenzierung von DNA auf die Bakteriophagen MS2 und \u00f8X174 angewendet, und die erweiterten Nukleotidsequenzen wurden dann mit informativen und statistischen Algorithmen analysiert. Diese Studien haben gezeigt, dass bekannte Merkmale wie die Codierungssegmente und der Triplett-Code in einfachen statistischen Analysen aufgedeckt werden und somit das Konzept beweisen, dass Bioinformatik aufschlussreich w\u00e4re.[16][17]Tore[edit]Um zu untersuchen, wie sich normale zellul\u00e4re Aktivit\u00e4ten bei verschiedenen Krankheitszust\u00e4nden ver\u00e4ndern, m\u00fcssen die biologischen Daten kombiniert werden, um ein umfassendes Bild dieser Aktivit\u00e4ten zu erhalten. Daher hat sich das Gebiet der Bioinformatik so weiterentwickelt, dass die dringendste Aufgabe nun die Analyse und Interpretation verschiedener Datentypen ist. Dies umfasst Nukleotid- und Aminos\u00e4uresequenzen, Proteindom\u00e4nen und Proteinstrukturen.[18] Der eigentliche Prozess der Analyse und Interpretation von Daten wird als Computational Biology bezeichnet. Wichtige Unterdisziplinen in der Bioinformatik und Computerbiologie sind:Entwicklung und Implementierung von Computerprogrammen, die einen effizienten Zugriff auf, die Verwaltung und die Verwendung verschiedener Arten von Informationen erm\u00f6glichen.Entwicklung neuer Algorithmen (mathematische Formeln) und statistischer Ma\u00dfnahmen zur Bewertung der Beziehungen zwischen Mitgliedern gro\u00dfer Datenmengen. Beispielsweise gibt es Verfahren, um ein Gen innerhalb einer Sequenz zu lokalisieren, die Proteinstruktur und \/ oder -funktion vorherzusagen und Proteinsequenzen in Familien verwandter Sequenzen zu gruppieren.Das Hauptziel der Bioinformatik ist es, das Verst\u00e4ndnis f\u00fcr biologische Prozesse zu verbessern. Was es jedoch von anderen Ans\u00e4tzen unterscheidet, ist sein Fokus auf die Entwicklung und Anwendung rechenintensiver Techniken, um dieses Ziel zu erreichen. Beispiele hierf\u00fcr sind: Mustererkennung, Data Mining, Algorithmen f\u00fcr maschinelles Lernen und Visualisierung. Zu den wichtigsten Forschungsanstrengungen auf diesem Gebiet geh\u00f6ren Sequenzausrichtung, Genfindung, Genomassemblierung, Wirkstoffdesign, Wirkstoffentdeckung, Proteinstrukturausrichtung, Proteinstrukturvorhersage, Vorhersage der Genexpression und Protein-Protein-Wechselwirkungen, genomweite Assoziationsstudien und die Modellierung der Evolution und Zellteilung \/ Mitose.Die Bioinformatik umfasst nun die Erstellung und Weiterentwicklung von Datenbanken, Algorithmen, rechnerischen und statistischen Techniken sowie der Theorie zur L\u00f6sung formaler und praktischer Probleme, die sich aus der Verwaltung und Analyse biologischer Daten ergeben.In den letzten Jahrzehnten haben rasante Entwicklungen in der Genom- und anderen molekularen Forschungstechnologien sowie Entwicklungen in den Informationstechnologien zusammen eine enorme Menge an Informationen in Bezug auf die Molekularbiologie hervorgebracht. Bioinformatik ist der Name f\u00fcr diese mathematischen und rechnerischen Ans\u00e4tze, die zum Verst\u00e4ndnis biologischer Prozesse verwendet werden.H\u00e4ufige Aktivit\u00e4ten in der Bioinformatik umfassen das Kartieren und Analysieren von DNA- und Proteinsequenzen, das Ausrichten von DNA- und Proteinsequenzen, um diese zu vergleichen, sowie das Erstellen und Anzeigen von 3D-Modellen von Proteinstrukturen.Beziehung zu anderen Feldern[edit]Die Bioinformatik ist ein Wissenschaftsgebiet, das dem biologischen Rechnen \u00e4hnlich ist, sich jedoch von diesem unterscheidet, w\u00e4hrend es h\u00e4ufig als Synonym f\u00fcr Computational Biology angesehen wird. Biologische Berechnungen verwenden Bioengineering und Biologie, um biologische Computer zu bauen, w\u00e4hrend Bioinformatik Berechnungen verwendet, um die Biologie besser zu verstehen. Bioinformatik und Computerbiologie umfassen die Analyse biologischer Daten, insbesondere von DNA-, RNA- und Proteinsequenzen. Das Gebiet der Bioinformatik verzeichnete ab Mitte der neunziger Jahre ein explosives Wachstum, das vor allem auf das Humangenomprojekt und die raschen Fortschritte in der DNA-Sequenzierungstechnologie zur\u00fcckzuf\u00fchren war.Die Analyse biologischer Daten zur Erzeugung aussagekr\u00e4ftiger Informationen umfasst das Schreiben und Ausf\u00fchren von Softwareprogrammen, die Algorithmen aus Graphentheorie, k\u00fcnstlicher Intelligenz, Soft Computing, Data Mining, Bildverarbeitung und Computersimulation verwenden. Die Algorithmen h\u00e4ngen wiederum von theoretischen Grundlagen wie diskreter Mathematik, Steuerungstheorie, Systemtheorie, Informationstheorie und Statistik ab.Sequenzanalyse[edit]Da der Phage \u03a6-X174 1977 sequenziert wurde,[19] Die DNA-Sequenzen von Tausenden von Organismen wurden dekodiert und in Datenbanken gespeichert. Diese Sequenzinformationen werden analysiert, um Gene zu bestimmen, die f\u00fcr Proteine, RNA-Gene, regulatorische Sequenzen, Strukturmotive und repetitive Sequenzen kodieren. Ein Vergleich von Genen innerhalb einer Art oder zwischen verschiedenen Arten kann \u00c4hnlichkeiten zwischen Proteinfunktionen oder Beziehungen zwischen Arten zeigen (Verwendung molekularer Systematik zur Konstruktion phylogenetischer B\u00e4ume). Mit der wachsenden Datenmenge wurde es l\u00e4ngst unpraktisch, DNA-Sequenzen manuell zu analysieren. Computerprogramme wie BLAST werden routinem\u00e4\u00dfig zum Suchen von Sequenzen verwendet – ab 2008 von mehr als 260.000 Organismen, die \u00fcber 190 Milliarden Nukleotide enthalten.[20]DNA-Sequenzierung[edit]Bevor Sequenzen analysiert werden k\u00f6nnen, m\u00fcssen sie aus dem Beispiel der Datenbank der Genbank bezogen werden. Die DNA-Sequenzierung ist immer noch ein nicht triviales Problem, da die Rohdaten verrauscht sein oder von schwachen Signalen beeintr\u00e4chtigt werden k\u00f6nnen. Es wurden Algorithmen f\u00fcr die Basis entwickelt, die die verschiedenen experimentellen Ans\u00e4tze zur DNA-Sequenzierung erfordern.Sequenzassemblierung[edit]Die meisten DNA-Sequenzierungstechniken produzieren kurze Sequenzfragmente, die zusammengesetzt werden m\u00fcssen, um vollst\u00e4ndige Gen- oder Genomsequenzen zu erhalten. Die sogenannte Shotgun-Sequenzierungstechnik (die beispielsweise vom Institut f\u00fcr Genomforschung (TIGR) zur Sequenzierung des ersten Bakteriengenoms verwendet wurde, Haemophilus influenzae)[21] erzeugt die Sequenzen von vielen tausend kleinen DNA-Fragmenten (von 35 bis 900 Nukleotiden lang, abh\u00e4ngig von der Sequenzierungstechnologie). Die Enden dieser Fragmente \u00fcberlappen sich und k\u00f6nnen, wenn sie durch ein Genomassemblierungsprogramm richtig ausgerichtet werden, verwendet werden, um das gesamte Genom zu rekonstruieren. Die Shotgun-Sequenzierung liefert schnell Sequenzdaten, aber die Aufgabe, die Fragmente zusammenzusetzen, kann f\u00fcr gr\u00f6\u00dfere Genome ziemlich kompliziert sein. Bei einem Genom, das so gro\u00df ist wie das menschliche Genom, kann es auf Multiprozessor-Computern mit gro\u00dfem Speicher viele Tage dauern, bis die Fragmente zusammengesetzt sind. Die resultierende Baugruppe enth\u00e4lt normalerweise zahlreiche L\u00fccken, die sp\u00e4ter ausgef\u00fcllt werden m\u00fcssen. Die Shotgun-Sequenzierung ist die Methode der Wahl f\u00fcr praktisch alle heute sequenzierten Genome[when?]und Genomassemblierungsalgorithmen sind ein kritischer Bereich der Bioinformatikforschung.Annotation des Genoms[edit]Annotation ist im Kontext der Genomik der Prozess der Markierung der Gene und anderer biologischer Merkmale in einer DNA-Sequenz. Dieser Prozess muss automatisiert werden, da die meisten Genome zu gro\u00df sind, um von Hand annotiert zu werden, ganz zu schweigen von dem Wunsch, so viele Genome wie m\u00f6glich zu annotieren, da die Sequenzierungsrate keinen Engpass mehr darstellt. Die Annotation wird durch die Tatsache erm\u00f6glicht, dass Gene erkennbare Start- und Stoppregionen aufweisen, obwohl die genaue Sequenz, die in diesen Regionen gefunden wird, zwischen den Genen variieren kann.Die erste Beschreibung eines umfassenden Genom-Annotationssystems wurde 1995 ver\u00f6ffentlicht[21] vom Team des Instituts f\u00fcr Genomforschung, das die erste vollst\u00e4ndige Sequenzierung und Analyse des Genoms eines frei lebenden Organismus, des Bakteriums, durchf\u00fchrte Haemophilus influenzae.[21]Owen White entwarf und baute ein Softwaresystem, um die Gene zu identifizieren, die f\u00fcr alle Proteine \u200b\u200bkodieren, RNAs, ribosomale RNAs (und andere Stellen) zu \u00fcbertragen und erste funktionelle Zuordnungen vorzunehmen. Die meisten aktuellen Genom-Annotationssysteme funktionieren \u00e4hnlich, aber die f\u00fcr die Analyse genomischer DNA verf\u00fcgbaren Programme, wie das GeneMark-Programm, wurden trainiert und verwendet, um proteinkodierende Gene in zu finden Haemophilus influenzae, \u00e4ndern und verbessern sich st\u00e4ndig.Nach den Zielen, die das Humangenomprojekt nach seiner Schlie\u00dfung im Jahr 2003 erreichen wollte, erschien ein neues Projekt, das vom National Human Genome Research Institute in den USA entwickelt wurde. Das sogenannte ENCODE-Projekt ist eine kollaborative Datenerfassung der Funktionselemente des menschlichen Genoms, die DNA-Sequenzierungstechnologien der n\u00e4chsten Generation und Genom-Tiling-Arrays verwendet. Diese Technologien k\u00f6nnen automatisch gro\u00dfe Datenmengen zu drastisch reduzierten Kosten pro Basis generieren aber mit der gleichen Genauigkeit (Basisaufruffehler) und Wiedergabetreue (Montagefehler).Computergest\u00fctzte Evolutionsbiologie[edit]Die Evolutionsbiologie ist die Untersuchung der Herkunft und Abstammung von Arten sowie ihrer Ver\u00e4nderung im Laufe der Zeit. Die Informatik hat Evolutionsbiologen dabei unterst\u00fctzt, Forschern Folgendes zu erm\u00f6glichen:Verfolgen Sie die Entwicklung einer gro\u00dfen Anzahl von Organismen, indem Sie \u00c4nderungen in ihrer DNA messen und nicht nur durch physikalische Taxonomie oder physiologische Beobachtungen.Vergleichen Sie ganze Genome, um komplexere evolution\u00e4re Ereignisse wie Genduplikation, horizontalen Gentransfer und die Vorhersage von Faktoren zu untersuchen, die f\u00fcr die Bakterienspeziation wichtig sind.Erstellen Sie komplexe Modelle zur rechnergest\u00fctzten Populationsgenetik, um das Ergebnis des Systems im Zeitverlauf vorherzusagen[22]Informationen \u00fcber eine immer gr\u00f6\u00dfere Anzahl von Arten und Organismen verfolgen und austauschenZuk\u00fcnftige Arbeiten zielen darauf ab, den jetzt komplexeren Baum des Lebens zu rekonstruieren.[according to whom?]Der Forschungsbereich der Informatik, der genetische Algorithmen verwendet, wird manchmal mit der rechnergest\u00fctzten Evolutionsbiologie verwechselt, aber die beiden Bereiche sind nicht unbedingt miteinander verbunden.Vergleichende Genomik[edit]Der Kern der vergleichenden Genomanalyse ist die Herstellung der Korrespondenz zwischen Genen (Orthologieanalyse) oder anderen genomischen Merkmalen in verschiedenen Organismen. Es sind diese intergenomischen Karten, die es erm\u00f6glichen, die Evolutionsprozesse zu verfolgen, die f\u00fcr die Divergenz zweier Genome verantwortlich sind. Eine Vielzahl von Evolutionsereignissen, die auf verschiedenen Organisationsebenen wirken, pr\u00e4gen die Genomentwicklung. Auf der niedrigsten Ebene wirken sich Punktmutationen auf einzelne Nukleotide aus. Auf einer h\u00f6heren Ebene werden gro\u00dfe chromosomale Segmente dupliziert, lateral \u00fcbertragen, inversiert, transpositioniert, gel\u00f6scht und inseriert.[23] Letztendlich sind ganze Genome an Prozessen der Hybridisierung, Polyploidisierung und Endosymbiose beteiligt, was h\u00e4ufig zu einer schnellen Speziation f\u00fchrt. Die Komplexit\u00e4t der Genomentwicklung stellt Entwickler mathematischer Modelle und Algorithmen vor viele spannende Herausforderungen, die auf ein Spektrum algorithmischer, statistischer und mathematischer Techniken zur\u00fcckgreifen k\u00f6nnen, das von exakten, heuristischen, festen Parameter- und Approximationsalgorithmen f\u00fcr Probleme, die auf Sparsamkeitsmodellen basieren, bis hin zu Markov reicht Ketten-Monte-Carlo-Algorithmen zur Bayes’schen Analyse von Problemen basierend auf probabilistischen Modellen.Viele dieser Studien basieren auf dem Nachweis von Sequenzhomologie, um Sequenzen Proteinfamilien zuzuordnen.[24]Pan-Genomik[edit]Pan Genomics ist ein 2005 von Tettelin und Medini eingef\u00fchrtes Konzept, das schlie\u00dflich in der Bioinformatik Fu\u00df fasst. Das Pan-Genom ist das vollst\u00e4ndige Genrepertoire einer bestimmten taxonomischen Gruppe: Obwohl es urspr\u00fcnglich auf eng verwandte St\u00e4mme einer Art angewendet wurde, kann es auf einen gr\u00f6\u00dferen Kontext wie Gattung, Stamm usw. angewendet werden. Es ist in zwei Teile unterteilt: Das Kerngenom: Set von Genen, die allen untersuchten Genomen gemeinsam sind (dies sind h\u00e4ufig \u00fcberlebenswichtige Housekeeping-Gene) und The Dispensable \/ Flexible Genome: Satz von Genen, die nur in einem oder einigen untersuchten Genomen vorhanden sind. Ein Bioinformatik-Tool BPGA kann verwendet werden, um das Pan-Genom von Bakterienspezies zu charakterisieren.[25]Genetik der Krankheit[edit]Mit dem Aufkommen der Sequenzierung der n\u00e4chsten Generation erhalten wir gen\u00fcgend Sequenzdaten, um die Gene der Unfruchtbarkeit komplexer Krankheiten abzubilden.[26]Brustkrebs[27] oder Alzheimer-Krankheit.[28] Genomweite Assoziationsstudien sind ein n\u00fctzlicher Ansatz, um die f\u00fcr solche komplexen Krankheiten verantwortlichen Mutationen zu lokalisieren.[29] Durch diese Studien wurden Tausende von DNA-Varianten identifiziert, die mit \u00e4hnlichen Krankheiten und Merkmalen assoziiert sind.[30] Dar\u00fcber hinaus ist die M\u00f6glichkeit, Gene bei Prognose, Diagnose oder Behandlung zu verwenden, eine der wichtigsten Anwendungen. In vielen Studien werden sowohl die vielversprechenden M\u00f6glichkeiten zur Auswahl der zu verwendenden Gene als auch die Probleme und Fallstricke bei der Verwendung von Genen zur Vorhersage des Vorhandenseins oder der Prognose von Krankheiten er\u00f6rtert.[31]Analyse von Mutationen bei Krebs[edit]Bei Krebs werden die Genome betroffener Zellen auf komplexe oder sogar unvorhersehbare Weise neu angeordnet. Massive Sequenzierungsbem\u00fchungen werden verwendet, um bisher unbekannte Punktmutationen in einer Vielzahl von Genen bei Krebs zu identifizieren. Bioinformatiker stellen weiterhin spezialisierte automatisierte Systeme her, um das schiere Volumen der erzeugten Sequenzdaten zu verwalten, und sie entwickeln neue Algorithmen und Software, um die Sequenzierungsergebnisse mit der wachsenden Sammlung menschlicher Genomsequenzen und Keimbahnpolymorphismen zu vergleichen. Neue physikalische Detektionstechnologien werden eingesetzt, wie Oligonukleotid-Mikroarrays zur Identifizierung chromosomaler Gewinne und Verluste (als vergleichende genomische Hybridisierung bezeichnet) und Einzelnukleotid-Polymorphismus-Arrays zum Nachweis bekannter Punktmutationen. Diese Nachweismethoden messen gleichzeitig mehrere hunderttausend Stellen im gesamten Genom und erzeugen bei hohem Durchsatz zur Messung von Tausenden von Proben Terabyte an Daten pro Experiment. Wiederum er\u00f6ffnen die enormen Mengen und neuen Datentypen neue M\u00f6glichkeiten f\u00fcr Bioinformatiker. Es wird h\u00e4ufig festgestellt, dass die Daten erhebliche Variabilit\u00e4t oder Rauschen enthalten. Daher werden Hidden-Markov-Modell- und \u00c4nderungspunkt-Analysemethoden entwickelt, um auf \u00c4nderungen der tats\u00e4chlichen Kopienzahl zu schlie\u00dfen.Bei der bioinformatischen Analyse von Krebsgenomen im Zusammenhang mit der Identifizierung von Mutationen im Exom k\u00f6nnen zwei wichtige Prinzipien verwendet werden. Erstens ist Krebs eine Krankheit mit akkumulierten somatischen Mutationen in Genen. Zweiter Krebs enth\u00e4lt Fahrermutationen, die von Passagieren unterschieden werden m\u00fcssen.[32]Mit den Durchbr\u00fcchen, die diese Sequenzierungstechnologie der n\u00e4chsten Generation auf dem Gebiet der Bioinformatik bietet, k\u00f6nnte sich die Krebsgenomik drastisch ver\u00e4ndern. Mit diesen neuen Methoden und Software k\u00f6nnen Bioinformatiker viele Krebsgenome schnell und kosteng\u00fcnstig sequenzieren. Dies k\u00f6nnte einen flexibleren Prozess zur Klassifizierung von Krebsarten durch Analyse krebsbedingter Mutationen im Genom schaffen. Dar\u00fcber hinaus kann die Verfolgung von Patienten w\u00e4hrend des Fortschreitens der Krankheit in Zukunft mit der Sequenz von Krebsproben m\u00f6glich sein.[33]Eine andere Art von Daten, die eine neuartige Entwicklung der Informatik erfordern, ist die Analyse von L\u00e4sionen, die bei vielen Tumoren als wiederkehrend befunden werden.Gen- und Proteinexpression[edit]Analyse der Genexpression[edit]Die Expression vieler Gene kann durch Messen der mRNA-Spiegel mit mehreren Techniken bestimmt werden, einschlie\u00dflich Microarrays, Expressed cDNA Sequence Tag (EST) -Sequenzierung, serielle Analyse der Genexpressions (SAGE) -Tag-Sequenzierung, Massively Parallel Signature Sequencing (MPSS), RNA-Seq, auch bekannt als “Whole Transcriptome Shotgun Sequencing” (WTSS) oder verschiedene Anwendungen der multiplexierten In-situ-Hybridisierung. Alle diese Techniken sind extrem rauschanf\u00e4llig und \/ oder unterliegen Verzerrungen bei der biologischen Messung, und ein Hauptforschungsgebiet in der Computerbiologie umfasst die Entwicklung statistischer Werkzeuge zur Trennung von Signal und Rauschen in Hochdurchsatz-Genexpressionsstudien.[34] Solche Studien werden h\u00e4ufig verwendet, um die Gene zu bestimmen, die an einer St\u00f6rung beteiligt sind: Man k\u00f6nnte Microarray-Daten von krebsartigen Epithelzellen mit Daten von nicht krebsartigen Zellen vergleichen, um die Transkripte zu bestimmen, die in einer bestimmten Population von Krebszellen hoch- und herunterreguliert sind .Analyse der Proteinexpression[edit]Protein-Microarrays und Massenspektrometrie (MS) mit hohem Durchsatz (HT) k\u00f6nnen eine Momentaufnahme der in einer biologischen Probe vorhandenen Proteine \u200b\u200bliefern. Die Bioinformatik ist sehr wichtig, um Protein-Microarray- und HT-MS-Daten zu verstehen. Der erstere Ansatz steht vor \u00e4hnlichen Problemen wie bei auf mRNA gerichteten Microarrays, der letztere beinhaltet das Problem des Abgleichs gro\u00dfer Mengen von Massendaten mit vorhergesagten Massen aus Proteinsequenzdatenbanken und die komplizierte statistische Analyse von Proben, bei denen mehrere, aber unvollst\u00e4ndige Peptide von jedem Protein vorhanden sind erkannt. Die Lokalisierung zellul\u00e4rer Proteine \u200b\u200bin einem Gewebekontext kann durch Affinit\u00e4tsproteomik erreicht werden, die als r\u00e4umliche Daten basierend auf Immunhistochemie und Gewebemikroarrays angezeigt wird.[35]Analyse der Regulierung[edit]Die Genregulation ist die komplexe Orchestrierung von Ereignissen, durch die ein Signal, m\u00f6glicherweise ein extrazellul\u00e4res Signal wie ein Hormon, schlie\u00dflich zu einer Zunahme oder Abnahme der Aktivit\u00e4t eines oder mehrerer Proteine \u200b\u200bf\u00fchrt. Bioinformatik-Techniken wurden angewendet, um verschiedene Schritte in diesem Prozess zu untersuchen.Beispielsweise kann die Genexpression durch nahegelegene Elemente im Genom reguliert werden. Die Promotoranalyse beinhaltet die Identifizierung und Untersuchung von Sequenzmotiven in der DNA, die die kodierende Region eines Gens umgibt. Diese Motive beeinflussen das Ausma\u00df, in dem diese Region in mRNA transkribiert wird. Enhancer-Elemente, die weit vom Promotor entfernt sind, k\u00f6nnen auch die Genexpression durch dreidimensionale Schleifenwechselwirkungen regulieren. Diese Wechselwirkungen k\u00f6nnen durch bioinformatische Analyse von Experimenten zur Erfassung der Chromosomenkonformation bestimmt werden.Expressionsdaten k\u00f6nnen verwendet werden, um auf die Genregulation zu schlie\u00dfen: Man k\u00f6nnte Microarray-Daten aus einer Vielzahl von Zust\u00e4nden eines Organismus vergleichen, um Hypothesen \u00fcber die an jedem Zustand beteiligten Gene zu bilden. In einem einzelligen Organismus kann man Stadien des Zellzyklus zusammen mit verschiedenen Stressbedingungen (Hitzeschock, Hunger usw.) vergleichen. Man kann dann Clustering-Algorithmen auf diese Expressionsdaten anwenden, um zu bestimmen, welche Gene coexprimiert werden. Beispielsweise k\u00f6nnen die stromaufw\u00e4rts gelegenen Regionen (Promotoren) von coexprimierten Genen nach \u00fcberrepr\u00e4sentierten regulatorischen Elementen durchsucht werden. Beispiele f\u00fcr Clustering-Algorithmen, die beim Gen-Clustering angewendet werden, sind k-Means-Clustering, selbstorganisierende Karten (SOMs), hierarchisches Clustering und Consensus-Clustering-Methoden.Analyse der zellul\u00e4ren Organisation[edit]Es wurden verschiedene Ans\u00e4tze entwickelt, um die Position von Organellen, Genen, Proteinen und anderen Komponenten in Zellen zu analysieren. Dies ist relevant, da der Ort dieser Komponenten die Ereignisse innerhalb einer Zelle beeinflusst und uns somit hilft, das Verhalten biologischer Systeme vorherzusagen. Eine Kategorie der Genontologie, zellul\u00e4re Komponentewurde entwickelt, um die subzellul\u00e4re Lokalisation in vielen biologischen Datenbanken zu erfassen.Mikroskopie und Bildanalyse[edit]Mikroskopische Bilder erm\u00f6glichen es uns, sowohl Organellen als auch Molek\u00fcle zu lokalisieren. Es kann uns auch helfen, zwischen normalen und abnormalen Zellen zu unterscheiden, z. B. bei Krebs.Proteinlokalisierung[edit]Die Lokalisierung von Proteinen hilft uns, die Rolle eines Proteins zu bewerten. Wenn zum Beispiel ein Protein im Kern gefunden wird, kann es an der Genregulation oder dem Splei\u00dfen beteiligt sein. Wenn ein Protein in Mitochondrien gefunden wird, kann es dagegen an der Atmung oder anderen Stoffwechselprozessen beteiligt sein. Die Proteinlokalisierung ist daher ein wichtiger Bestandteil der Vorhersage der Proteinfunktion. Es sind gut entwickelte Ressourcen zur Vorhersage der subzellul\u00e4ren Lokalisierung von Proteinen verf\u00fcgbar, einschlie\u00dflich Datenbanken zur subzellul\u00e4ren Lokalisierung von Proteinen und Vorhersagewerkzeugen.[36][37]Kernorganisation von Chromatin[edit]Daten aus Hochdurchsatz-Chromosomenkonformationserfassungsexperimenten wie Hi-C (Experiment) und ChIA-PET k\u00f6nnen Informationen \u00fcber die r\u00e4umliche N\u00e4he von DNA-Loci liefern. Die Analyse dieser Experimente kann die dreidimensionale Struktur und Kernorganisation von Chromatin bestimmen. Zu den bioinformatischen Herausforderungen in diesem Bereich geh\u00f6rt die Aufteilung des Genoms in Dom\u00e4nen wie Topologisch assoziierende Dom\u00e4nen (TADs), die zusammen im dreidimensionalen Raum organisiert sind.[38]Strukturelle Bioinformatik[edit] Dreidimensionale Proteinstrukturen wie diese sind h\u00e4ufige Themen in bioinformatischen Analysen.Die Vorhersage der Proteinstruktur ist eine weitere wichtige Anwendung der Bioinformatik. Die Aminos\u00e4uresequenz eines Proteins, die sogenannte Prim\u00e4rstruktur, kann leicht aus der Sequenz auf dem Gen bestimmt werden, das daf\u00fcr kodiert. In den allermeisten F\u00e4llen bestimmt diese Prim\u00e4rstruktur eine Struktur in ihrer urspr\u00fcnglichen Umgebung eindeutig. (Nat\u00fcrlich gibt es Ausnahmen wie das Prion der spongiformen Rinderenzephalopathie (Rinderwahnsinn).) Die Kenntnis dieser Struktur ist f\u00fcr das Verst\u00e4ndnis der Funktion des Proteins von entscheidender Bedeutung. Strukturinformationen werden normalerweise als eine von klassifiziert sekund\u00e4r, Terti\u00e4r- und Quart\u00e4r Struktur. Eine praktikable allgemeine L\u00f6sung f\u00fcr solche Vorhersagen bleibt ein offenes Problem. Die meisten Bem\u00fchungen waren bisher auf Heuristiken gerichtet, die die meiste Zeit funktionieren.[citation needed]Eine der Schl\u00fcsselideen in der Bioinformatik ist der Begriff der Homologie. Im genomischen Zweig der Bioinformatik wird Homologie verwendet, um die Funktion eines Gens vorherzusagen: wenn die Sequenz des Gens EIN, dessen Funktion bekannt ist, ist homolog zur Gensequenz B, deren Funktion unbekannt ist, k\u00f6nnte man schlie\u00dfen, dass B die Funktion von A teilen kann. Im strukturellen Zweig der Bioinformatik wird anhand der Homologie bestimmt, welche Teile eines Proteins f\u00fcr die Strukturbildung und Interaktion mit anderen Proteinen wichtig sind. In einer als Homologiemodellierung bezeichneten Technik wird diese Information verwendet, um die Struktur eines Proteins vorherzusagen, sobald die Struktur eines homologen Proteins bekannt ist. Dies ist derzeit die einzige M\u00f6glichkeit, Proteinstrukturen zuverl\u00e4ssig vorherzusagen.Ein Beispiel hierf\u00fcr ist H\u00e4moglobin beim Menschen und H\u00e4moglobin bei H\u00fclsenfr\u00fcchten (Leghemoglobin), die entfernte Verwandte derselben Protein-Superfamilie sind. Beide dienen dem gleichen Zweck, Sauerstoff im Organismus zu transportieren. Obwohl diese beiden Proteine \u200b\u200bv\u00f6llig unterschiedliche Aminos\u00e4uresequenzen aufweisen, sind ihre Proteinstrukturen praktisch identisch, was ihre nahezu identischen Zwecke und gemeinsamen Vorfahren widerspiegelt.[39]Andere Techniken zur Vorhersage der Proteinstruktur umfassen Protein-Threading und de novo (von Grund auf neu) Physikbasierte Modellierung.Ein weiterer Aspekt der strukturellen Bioinformatik umfasst die Verwendung von Proteinstrukturen f\u00fcr virtuelle Screening-Modelle wie quantitative Struktur-Aktivit\u00e4ts-Beziehungsmodelle und proteochemometrische Modelle (PCM). Dar\u00fcber hinaus kann die Kristallstruktur eines Proteins zur Simulation von beispielsweise Ligandenbindungsstudien und verwendet werden in silico Mutagenesestudien.Netzwerk- und Systembiologie[edit]Netzwerkanalyse versucht, die Beziehungen innerhalb biologischer Netzwerke wie metabolischer oder Protein-Protein-Interaktionsnetzwerke zu verstehen. Obwohl biologische Netzwerke aus einem einzigen Molek\u00fcl- oder Entit\u00e4tstyp (z. B. Genen) aufgebaut werden k\u00f6nnen, versucht die Netzwerkbiologie h\u00e4ufig, viele verschiedene Datentypen wie Proteine, kleine Molek\u00fcle, Genexpressionsdaten und andere zu integrieren, die alle physikalisch miteinander verbunden sind funktional oder beides.Systembiologie beinhaltet die Verwendung von Computersimulationen von zellul\u00e4ren Subsystemen (wie den Netzwerken von Metaboliten und Enzymen, die Metabolismus, Signaltransduktionswege und Genregulationsnetzwerke umfassen), um die komplexen Zusammenh\u00e4nge dieser zellul\u00e4ren Prozesse zu analysieren und zu visualisieren. K\u00fcnstliches Leben oder virtuelle Evolution versucht, evolution\u00e4re Prozesse durch die Computersimulation einfacher (k\u00fcnstlicher) Lebensformen zu verstehen.Molekulare Interaktionsnetzwerke[edit] Wechselwirkungen zwischen Proteinen werden h\u00e4ufig mithilfe von Netzwerken visualisiert und analysiert. Dieses Netzwerk besteht aus Protein-Protein-Wechselwirkungen aus Treponema pallidum, der Erreger von Syphilis und anderen Krankheiten.Zehntausende dreidimensionaler Proteinstrukturen wurden durch R\u00f6ntgenkristallographie und Protein-Kernspinresonanzspektroskopie (Protein-NMR) bestimmt. Eine zentrale Frage in der strukturellen Bioinformatik ist, ob es praktisch ist, m\u00f6gliche Protein-Protein-Wechselwirkungen nur auf dieser Grundlage vorherzusagen 3D-Formen ohne Durchf\u00fchrung von Protein-Protein-Interaktionsexperimenten. Es wurde eine Vielzahl von Methoden entwickelt, um das Protein-Protein-Docking-Problem anzugehen, obwohl es auf diesem Gebiet anscheinend noch viel zu tun gibt.Andere auf diesem Gebiet auftretende Wechselwirkungen umfassen Protein-Ligand (einschlie\u00dflich Arzneimittel) und Protein-Peptid. Die molekulardynamische Simulation der Bewegung von Atomen um drehbare Bindungen ist das Grundprinzip von Berechnungsalgorithmen, sogenannten Docking-Algorithmen, zur Untersuchung molekularer Wechselwirkungen.Literaturanalyse[edit]Die zunehmende Anzahl ver\u00f6ffentlichter Literatur macht es praktisch unm\u00f6glich, jede Arbeit zu lesen, was zu unzusammenh\u00e4ngenden Teilbereichen der Forschung f\u00fchrt. Die Literaturanalyse zielt darauf ab, diese wachsende Bibliothek von Textressourcen mithilfe rechnerischer und statistischer Linguistik abzubauen. Zum Beispiel:Abk\u00fcrzungserkennung – Identifizieren Sie die Langform und Abk\u00fcrzung von biologischen BegriffenErkennung benannter Entit\u00e4ten – Erkennen biologischer Begriffe wie GennamenProtein-Protein-Interaktion – Identifizieren Sie aus Text, welche Proteine \u200b\u200bmit welchen Proteinen interagierenDer Forschungsbereich st\u00fctzt sich auf Statistik und Computerlinguistik.Bildanalyse mit hohem Durchsatz[edit]Computertechnologien werden verwendet, um die Verarbeitung, Quantifizierung und Analyse gro\u00dfer Mengen biomedizinischer Bilder mit hohem Informationsgehalt zu beschleunigen oder vollst\u00e4ndig zu automatisieren. Moderne Bildanalysesysteme erweitern die F\u00e4higkeit eines Beobachters, Messungen aus einem gro\u00dfen oder komplexen Satz von Bildern durchzuf\u00fchren, indem sie Genauigkeit, Objektivit\u00e4t oder Geschwindigkeit verbessern. Ein voll entwickeltes Analysesystem kann den Beobachter vollst\u00e4ndig ersetzen. Obwohl diese Systeme nicht nur f\u00fcr biomedizinische Bilder gelten, wird die biomedizinische Bildgebung sowohl f\u00fcr die Diagnostik als auch f\u00fcr die Forschung immer wichtiger. Einige Beispiele sind:Quantifizierung mit hohem Durchsatz und hoher Wiedergabetreue sowie subzellul\u00e4re Lokalisierung (High-Content-Screening, Zytohistopathologie, Bioimage-Informatik)Morphometrieklinische Bildanalyse und VisualisierungBestimmen der Echtzeit-Luftstr\u00f6mungsmuster in der Atemlunge lebender TiereQuantifizierung der Okklusionsgr\u00f6\u00dfe in Echtzeitbildern anhand der Entwicklung und Wiederherstellung w\u00e4hrend einer arteriellen VerletzungVerhaltensbeobachtungen anhand erweiterter Videoaufnahmen von LabortierenInfrarotmessungen zur Bestimmung der Stoffwechselaktivit\u00e4tAbleiten von Klon\u00fcberlappungen bei der DNA-Kartierung, z. B. der Sulston-ScoreEinzelzelldatenanalyse mit hohem Durchsatz[edit]Computertechniken werden verwendet, um Einzelzelldaten mit hohem Durchsatz und geringer Messung zu analysieren, wie sie beispielsweise durch Durchflusszytometrie erhalten werden. Diese Verfahren umfassen typischerweise das Auffinden von Populationen von Zellen, die f\u00fcr einen bestimmten Krankheitszustand oder experimentellen Zustand relevant sind.Biodiversit\u00e4tsinformatik[edit]Die Biodiversit\u00e4tsinformatik befasst sich mit der Erfassung und Analyse von Biodiversit\u00e4tsdaten wie taxonomischen Datenbanken oder Mikrobiomdaten. Beispiele f\u00fcr solche Analysen umfassen Phylogenetik, Nischenmodellierung, Kartierung des Artenreichtums, DNA-Barcodierung oder Tools zur Identifizierung von Arten.Ontologien und Datenintegration[edit]Biologische Ontologien sind gerichtete azyklische Graphen kontrollierter Vokabulare. Sie sollen biologische Konzepte und Beschreibungen auf eine Weise erfassen, die mit Computern leicht kategorisiert und analysiert werden kann. Auf diese Weise kategorisiert, kann durch ganzheitliche und integrierte Analyse ein Mehrwert erzielt werden.Die OBO-Gie\u00dferei war ein Versuch, bestimmte Ontologien zu standardisieren. Eine der am weitesten verbreiteten ist die Genontologie, die die Genfunktion beschreibt. Es gibt auch Ontologien, die Ph\u00e4notypen beschreiben.Datenbanken[edit]Datenbanken sind f\u00fcr die Forschung und Anwendung in der Bioinformatik von wesentlicher Bedeutung. Es gibt viele Datenbanken, die verschiedene Informationstypen abdecken: zum Beispiel DNA- und Proteinsequenzen, molekulare Strukturen, Ph\u00e4notypen und Biodiversit\u00e4t. Datenbanken k\u00f6nnen empirische Daten (direkt aus Experimenten erhalten), vorhergesagte Daten (aus Analysen erhalten) oder am h\u00e4ufigsten beides enthalten. Sie k\u00f6nnen spezifisch f\u00fcr einen bestimmten Organismus, Weg oder Molek\u00fcl von Interesse sein. Alternativ k\u00f6nnen sie Daten enthalten, die aus mehreren anderen Datenbanken zusammengestellt wurden. Diese Datenbanken unterscheiden sich in Format, Zugriffsmechanismus und ob sie \u00f6ffentlich sind oder nicht.Einige der am h\u00e4ufigsten verwendeten Datenbanken sind unten aufgef\u00fchrt. Eine umfassendere Liste finden Sie unter dem Link am Anfang des Unterabschnitts.Software und Tools[edit]Die Softwaretools f\u00fcr die Bioinformatik reichen von einfachen Befehlszeilentools bis hin zu komplexeren Grafikprogrammen und eigenst\u00e4ndigen Webdiensten, die von verschiedenen Bioinformatikunternehmen oder \u00f6ffentlichen Institutionen angeboten werden.Open-Source-Bioinformatik-Software[edit]Viele kostenlose und Open-Source-Softwaretools existieren seit den 1980er Jahren und sind weiter gewachsen.[40] Die Kombination des anhaltenden Bedarfs an neuen Algorithmen f\u00fcr die Analyse neu auftretender Arten von biologischen Auslesungen, das Potenzial f\u00fcr Innovationen in silico Experimente und frei verf\u00fcgbare Open-Code-Basen haben dazu beigetragen, dass alle Forschungsgruppen unabh\u00e4ngig von ihrer Finanzierungsvereinbarung einen Beitrag zur Bioinformatik und zum Angebot an Open-Source-Software leisten k\u00f6nnen. Die Open-Source-Tools fungieren h\u00e4ufig als Inkubatoren von Ideen oder als Community-unterst\u00fctzte Plug-Ins in kommerziellen Anwendungen. Sie k\u00f6nnen auch zur Verf\u00fcgung stellen de facto Standards und gemeinsame Objektmodelle zur Unterst\u00fctzung bei der Herausforderung der Integration von Bioinformationen.Das Angebot an Open-Source-Softwarepaketen umfasst Titel wie Bioconductor, BioPerl, Biopython, BioJava, BioJS, BioRuby, Bioclipse, EMBOSS, .NET Bio, Orange mit seinem Bioinformatik-Add-On, Apache Taverna, UGENE und GenoCAD. Um diese Tradition aufrechtzuerhalten und weitere M\u00f6glichkeiten zu schaffen, hat die gemeinn\u00fctzige Open Bioinformatics Foundation[40] unterst\u00fctzen seit 2000 die j\u00e4hrliche Bioinformatics Open Source Conference (BOSC).[41]Eine alternative Methode zum Erstellen \u00f6ffentlicher Bioinformatik-Datenbanken ist die Verwendung der MediaWiki-Engine mit dem WikiOpener Erweiterung. Mit diesem System k\u00f6nnen alle Experten auf dem Gebiet auf die Datenbank zugreifen und diese aktualisieren.[42]Webdienste in der Bioinformatik[edit]SOAP- und REST-basierte Schnittstellen wurden f\u00fcr eine Vielzahl von Bioinformatik-Anwendungen entwickelt, mit denen eine Anwendung, die auf einem Computer in einem Teil der Welt ausgef\u00fchrt wird, Algorithmen, Daten und Computerressourcen auf Servern in anderen Teilen der Welt verwenden kann. Die Hauptvorteile ergeben sich aus der Tatsache, dass Endbenutzer sich nicht mit dem Aufwand f\u00fcr die Software- und Datenbankwartung befassen m\u00fcssen.Grundlegende Bioinformatikdienste werden vom EBI in drei Kategorien eingeteilt: SSS (Sequence Search Services), MSA (Multiple Sequence Alignment) und BSA (Biological Sequence Analysis).[43] Die Verf\u00fcgbarkeit dieser serviceorientierten Bioinformatik-Ressourcen zeigt die Anwendbarkeit von webbasierten Bioinformatik-L\u00f6sungen und reicht von einer Sammlung eigenst\u00e4ndiger Tools mit einem gemeinsamen Datenformat unter einer einzigen, eigenst\u00e4ndigen oder webbasierten Schnittstelle bis hin zu integrativer, verteilter und erweiterbarer Bioinformatik Workflow-Management-Systeme.Bioinformatik-Workflow-Management-Systeme[edit]Ein Bioinformatik-Workflow-Management-System ist eine spezielle Form eines Workflow-Management-Systems, das speziell zum Erstellen und Ausf\u00fchren einer Reihe von Rechen- oder Datenmanipulationsschritten oder eines Workflows in einer Bioinformatik-Anwendung entwickelt wurde. Solche Systeme sind darauf ausgelegtBereitstellung einer benutzerfreundlichen Umgebung f\u00fcr einzelne Anwendungswissenschaftler, um ihre eigenen Workflows zu erstellen.Bereitstellung interaktiver Tools f\u00fcr die Wissenschaftler, mit denen sie ihre Workflows ausf\u00fchren und ihre Ergebnisse in Echtzeit anzeigen k\u00f6nnen.Vereinfachen Sie den Prozess des Teilens und Wiederverwendens von Workflows zwischen den Wissenschaftlern undErm\u00f6glichen Sie Wissenschaftlern, die Herkunft der Workflow-Ausf\u00fchrungsergebnisse und die Schritte zur Workflow-Erstellung zu verfolgen.Einige der Plattformen, die diesen Service anbieten: Galaxy, Kepler, Taverna, UGENE, Anduril, HIVE.BioCompute- und BioCompute-Objekte[edit]2014 sponserte die US-amerikanische Food and Drug Administration eine Konferenz am Bethesda Campus der National Institutes of Health, um die Reproduzierbarkeit in der Bioinformatik zu er\u00f6rtern.[44] In den n\u00e4chsten drei Jahren traf sich regelm\u00e4\u00dfig ein Konsortium von Interessengruppen, um zu er\u00f6rtern, was zum BioCompute-Paradigma werden w\u00fcrde.[45] Zu diesen Stakeholdern geh\u00f6rten Vertreter von Regierung, Industrie und akademischen Einrichtungen. Die Sitzungsleiter vertraten zahlreiche Zweigstellen der Institute und Zentren der FDA und des NIH, gemeinn\u00fctzige Organisationen wie das Human Variome Project und die Europ\u00e4ische F\u00f6deration f\u00fcr medizinische Informatik sowie Forschungseinrichtungen wie Stanford, das New York Genome Center und die George Washington University.Es wurde beschlossen, dass das BioCompute-Paradigma in Form von digitalen \u201eLaborb\u00fcchern\u201c vorliegt, die die Reproduzierbarkeit, Replikation, \u00dcberpr\u00fcfung und Wiederverwendung von Bioinformatikprotokollen erm\u00f6glichen. Dies wurde vorgeschlagen, um eine gr\u00f6\u00dfere Kontinuit\u00e4t innerhalb einer Forschungsgruppe im Verlauf des normalen Personalflusses zu erm\u00f6glichen und gleichzeitig den Gedankenaustausch zwischen Gruppen zu f\u00f6rdern. Die US-amerikanische FDA hat diese Arbeit finanziert, damit Informationen \u00fcber Pipelines transparenter und f\u00fcr ihre Aufsichtsbeh\u00f6rden zug\u00e4nglicher werden.[46]2016 trat die Gruppe am NIH in Bethesda zusammen und diskutierte das Potenzial f\u00fcr ein BioCompute-Objekt, eine Instanz des BioCompute-Paradigmas. Diese Arbeit wurde sowohl als “Standard-Testversion” -Dokument als auch als auf bioRxiv hochgeladenes Preprint-Papier kopiert. Mit dem BioCompute-Objekt kann der JSON-basierte Datensatz von Mitarbeitern, Mitarbeitern und Aufsichtsbeh\u00f6rden gemeinsam genutzt werden.[47][48]Bildungsplattformen[edit]Zu den Softwareplattformen f\u00fcr die Vermittlung von Konzepten und Methoden der Bioinformatik geh\u00f6ren Rosalind und Online-Kurse, die \u00fcber das Schulungsportal des Schweizerischen Instituts f\u00fcr Bioinformatik angeboten werden. Die kanadischen Bioinformatik-Workshops bieten Videos und Folien von Schulungsworkshops auf ihrer Website unter einer Creative Commons-Lizenz an. Das 4273\u03c0-Projekt oder das 4273pi-Projekt[49] bietet auch kostenlose Open-Source-Lehrmaterialien an. Der Kurs l\u00e4uft auf kosteng\u00fcnstigen Raspberry Pi-Computern und wurde verwendet, um Erwachsene und Sch\u00fcler zu unterrichten.[50][51] 4273\u03c0 wird aktiv von einem Konsortium aus Wissenschaftlern und Forschungsmitarbeitern entwickelt, die Bioinformatik auf Forschungsebene mit Raspberry Pi-Computern und dem Betriebssystem 4273\u03c0 betrieben haben.[52][53]MOOC-Plattformen bieten auch Online-Zertifizierungen in Bioinformatik und verwandten Disziplinen, einschlie\u00dflich Courseras Bioinformatik-Spezialisierung (UC San Diego) und Genomic Data Science-Spezialisierung (Johns Hopkins) sowie EdXs Datenanalyse f\u00fcr Life Sciences XSeries (Harvard). University of Southern California bietet eine Master in translationaler Bioinformatik Schwerpunkt auf biomedizinischen Anwendungen.Konferenzen[edit]Es gibt mehrere gro\u00dfe Konferenzen, die sich mit Bioinformatik befassen. Einige der bemerkenswertesten Beispiele sind Intelligente Systeme f\u00fcr die Molekularbiologie (ISMB), die Europ\u00e4ische Konferenz f\u00fcr Computational Biology (ECCB) und Research in Computational Molecular Biology (RECOMB).Siehe auch[edit]Verweise[edit]^ Lesk, AM (26. Juli 2013). “Bioinformatik”. Encyclopaedia Britannica.^ ein b Sim, AYL; Minary, P.; Levitt, M. (2012). “Modellierung von Nukleins\u00e4uren”. Aktuelle Meinung in der Strukturbiologie. 22 (3): 273\u201378. doi:10.1016 \/ j.sbi.2012.03.012. PMC 4028509. PMID 22538125.^ Dawson, WK; Maciejczyk, M.; Jankowska, EJ; Bujnicki, JM (2016). “Grobk\u00f6rnige Modellierung der RNA-3D-Struktur”. Methoden. 103: 138\u201356. doi:10.1016 \/ j.ymeth.2016.04.026. PMID 27125734.^ Kmiecik, S.; Gront, D.; Kolinski, M.; Wieteska, L.; Dawid, AE; Kolinski, A. (2016). “Grobk\u00f6rnige Proteinmodelle und ihre Anwendungen”. Chemische Bewertungen. 116 (14): 7898\u2013936. doi:10.1021 \/ acs.chemrev.6b00163. PMID 27333362.^ Wong, KC (2016). Computational Biology and Bioinformatics: Genregulation. CRC Press \/ Taylor & Francis Group. ISBN 9781498724975.^ Joyce, AP; Zhang, C.; Bradley, P.; Havranek, JJ (2015). “Strukturbasierte Modellierung von Protein: DNA-Spezifit\u00e4t”. Briefings in Functional Genomics. 14 (1): 39\u201349. doi:10.1093 \/ bfgp \/ elu044. PMC 4366589. PMID 25414269.^ Spiga, E.; Degiacomi, MT; Dal Peraro, M. (2014). “Neue Strategien zur integrativen dynamischen Modellierung makromolekularer Assemblierung”. In Karabencheva-Christova, T. (Hrsg.). Biomolekulare Modellierung und Simulationen. Fortschritte in der Proteinchemie und Strukturbiologie. 96. Akademische Presse. S. 77\u2013111. doi:10.1016 \/ bs.apcsb.2014.06.008. ISBN 9780128000137. PMID 25443955.^ Ciemny, Maciej; Kurcinski, Mateusz; Kamel, Karol; Kolinski, Andrzej; Alam, Nawsad; Schueler-Furman, Ora; Kmiecik, Sebastian (4. Mai 2018). “Protein-Peptid-Docking: Chancen und Herausforderungen”. Drug Discovery Today. 23 (8): 1530\u201337. doi:10.1016 \/ j.drudis.2018.05.006. ISSN 1359-6446. PMID 29733895.^ ein b Hogeweg P (2011). Searls, David B. (Hrsg.). “Die Wurzeln der Bioinformatik in der theoretischen Biologie”. PLOS Computational Biology. 7 (3): e1002021. Bibcode:2011PLSCB … 7E2021H. doi:10.1371 \/ journal.pcbi.1002021. PMC 3068925. PMID 21483479.^ Hesper B, Hogeweg P (1970). “Bioinformatica: een werkconcept”. 1 (6). Kameleon: 28\u201329. ^ Hogeweg P (1978). “Simulation des Wachstums zellul\u00e4rer Formen”. Simulation. 31 (3): 90\u201396. doi:10.1177 \/ 003754977803100305. S2CID 61206099.^ Moody, Glyn (2004). Digitaler Lebenskodex: Wie die Bioinformatik Wissenschaft, Medizin und Wirtschaft revolutioniert. ISBN 978-0-471-32788-2.^ Dayhoff, MO (1966) Atlas der Proteinsequenz und -struktur. National Biomedical Research Foundation, 215 Seiten^ Eck RV, Dayhoff MO (1966). “Entwicklung der Struktur von Ferredoxin basierend auf lebenden Relikten primitiver Aminos\u00e4uresequenzen”. Wissenschaft. 152 (3720): 363\u201366. Bibcode:1966Sci … 152..363E. doi:10.1126 \/ science.152.3720.363. PMID 17775169. S2CID 23208558.^ Johnson G, Wu TT (Januar 2000). “Kabat-Datenbank und ihre Anwendungen: 30 Jahre nach dem ersten Variabilit\u00e4tsdiagramm”. Nucleic Acids Res. 28 (1): 214\u201318. doi:10.1093 \/ nar \/ 28.1.214. PMC 102431. PMID 10592229.^ Erickson, JW; Altman, GG (1979). “Eine Suche nach Mustern in der Nukleotidsequenz des MS2-Genoms”. Zeitschrift f\u00fcr Mathematische Biologie. 7 (3): 219\u2013230. doi:10.1007 \/ BF00275725. S2CID 85199492.^ Shulman, MJ; Steinberg, CM; Westmoreland, N. (1981). “Die Codierungsfunktion von Nukleotidsequenzen kann durch statistische Analyse erkannt werden”. Zeitschrift f\u00fcr Theoretische Biologie. 88 (3): 409\u2013420. doi:10.1016 \/ 0022-5193 (81) 90274-5. PMID 6456380.^ Xiong, Jin (2006). Grundlegende Bioinformatik. Cambridge, Gro\u00dfbritannien: Cambridge University Press. pp. 4. ISBN 978-0-511-16815-4 – \u00fcber das Internetarchiv.^ Sanger F, Luft-GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, Hutchison CA, Slocombe PM, Smith M (Februar 1977). “Nukleotidsequenz der Bakteriophagen-Phi-X174-DNA”. Natur. 265 (5596): 687\u201395. Bibcode:1977Natur.265..687S. doi:10.1038 \/ 265687a0. PMID 870828. S2CID 4206886.^ Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Wheeler DL (Januar 2008). “GenBank”. Nucleic Acids Res. 36 (Datenbankproblem): D25\u201330. doi:10.1093 \/ nar \/ gkm929. PMC 2238942. PMID 18073190.^ ein b c Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM (Juli 1995). “Zuf\u00e4llige Sequenzierung und Assemblierung des gesamten Genoms von Haemophilus influenzae Rd”. Wissenschaft. 269 (5223): 496\u2013512. Bibcode:1995Sci … 269..496F. doi:10.1126 \/ science.7542800. PMID 7542800.^ Carvajal-Rodr\u00edguez A (2012). “Simulation von Genen und Genomen in der Zeit vorw\u00e4rts”. Aktuelle Genomik. 11 (1): 58\u201361. doi:10.2174 \/ 138920210790218007. PMC 2851118. PMID 20808525.^ Brown, TA (2002). “Mutation, Reparatur und Rekombination”. Genome (2. Aufl.). Manchester (Gro\u00dfbritannien): Oxford.^ Carter, NP; Fiegler, H.; Piper, J. (2002). “Vergleichende Analyse vergleichender genomischer Hybridisierungs-Microarray-Technologien: Bericht \u00fcber einen vom Wellcome Trust gesponserten Workshop”. Zytometrie Teil A.. 49 (2): 43\u201348. doi:10.1002 \/ cyto.10153. PMID 12357458.^ Chaudhari Narendrakumar M., Kumar Gupta Vinod, Dutta Chitra (2016). “BPGA – eine ultraschnelle Pan-Genom-Analyse-Pipeline”. Wissenschaftliche Berichte. 6: 24373. Bibcode:2016NatSR … 624373C. doi:10.1038 \/ srep24373. PMC 4829868. PMID 27071527.CS1-Wartung: mehrere Namen: Autorenliste (Link)^ Aston KI (2014). “Genetische Anf\u00e4lligkeit f\u00fcr m\u00e4nnliche Unfruchtbarkeit: Nachrichten aus genomweiten Assoziationsstudien”. Andrologie. 2 (3): 315\u201321. doi:10.1111 \/ j.2047-2927.2014.00188.x. PMID 24574159. S2CID 206007180.^ V\u00e9ron A, Blein S., DG DG (2014). “Genomweite Assoziationsstudien und die Klinik: Ein Schwerpunkt auf Brustkrebs”. Biomarker in der Medizin. 8 (2): 287\u201396. doi:10.2217 \/ bmm.13.121. PMID 24521025.^ Tosto G, Reitz C (2013). “Genomweite Assoziationsstudien bei Alzheimer: Ein R\u00fcckblick”. Aktuelle neurologische und neurowissenschaftliche Berichte. 13 (10): 381. doi:10.1007 \/ s11910-013-0381-0. PMC 3809844. PMID 23954969.^ Londin E., Yadav P., Surrey S., Kricka LJ, Fortina P. (2013). “Verwendung von Verkn\u00fcpfungsanalysen, genomweiten Assoziationsstudien und Sequenzierung der n\u00e4chsten Generation bei der Identifizierung krankheitsverursachender Mutationen”. Pharmakogenomik. Methoden der Molekularbiologie. 1015. S. 127\u201346. doi:10.1007 \/ 978-1-62703-435-7_8. ISBN 978-1-62703-434-0. PMID 23824853. ^ Hindorff, LA; et al. (2009). “M\u00f6gliche \u00e4tiologische und funktionelle Auswirkungen genomweiter Assoziationsorte auf menschliche Krankheiten und Merkmale”. Proc. Natl. Acad. Sci. Vereinigte Staaten von Amerika. 106 (23): 9362\u201367. Bibcode:2009PNAS..106.9362H. doi:10.1073 \/ pnas.0903103106. PMC 2687147. PMID 19474294.^ Hall, LO (2010). “Die richtigen Gene f\u00fcr die Vorhersage von Krankheiten und Prognosen finden”. 2010 Internationale Konferenz f\u00fcr Systemwissenschaft und Systemtechnik. System Science and Engineering (ICSSE), Internationale Konferenz 2010. S. 1\u20132. doi:10.1109 \/ ICSSE.2010.5551766. ISBN 978-1-4244-6472-2. S2CID 21622726.^ Vazquez, Miguel; Torre, Victor de la; Valencia, Alfonso (27. Dezember 2012). “Kapitel 14: Krebsgenomanalyse”. PLOS Computational Biology. 8 (12): e1002824. Bibcode:2012PLSCB … 8E2824V. doi:10.1371 \/ journal.pcbi.1002824. ISSN 1553-7358. PMC 3531315. PMID 23300415.^ Hye-Jung, EC; Jaswinder, K.; Martin, K.; Samuel, AA; Marco, AM (2014). “Sequenzierung der zweiten Generation f\u00fcr die Krebsgenomanalyse”. In Dellaire, Graham; Berman, Jason N.; Arceci, Robert J. (Hrsg.). Krebsgenomik. Boston (USA): Akademische Presse. S. 13\u201330. doi:10.1016 \/ B978-0-12-396967-5.00002-5. ISBN 9780123969675.^ Grau, J.; Ben-Gal, I.; Posch, S.; Grosse, I. (1. Juli 2006). “VOMBAT: Vorhersage von Transkriptionsfaktor-Bindungsstellen unter Verwendung von Bayes’schen B\u00e4umen variabler Ordnung” (PDF). Nukleins\u00e4ureforschung. 34 (Webserver): W529 – W533. doi:10.1093 \/ nar \/ gkl212. PMC 1538886. PMID 16845064.^ “Der menschliche Proteinatlas”. www.proteinatlas.org. Abgerufen 2. Oktober 2017.^ “Die menschliche Zelle”. www.proteinatlas.org. Abgerufen 2. Oktober 2017.^ Thul, Peter J.; \u00c5kesson, Lovisa; Wiking, Mikaela; Mahdessian, Diana; Geladaki, Aikaterini; Blal, Hammou Ait; Alm, Tove; Asplund, Anna; Bj\u00f6rk, Lars (26. Mai 2017). “Eine subzellul\u00e4re Karte des menschlichen Proteoms”. Wissenschaft. 356 (6340): eaal3321. doi:10.1126 \/ science.aal3321. PMID 28495876. S2CID 10744558.^ Ja, Ferhat; Noble, William S. (2. September 2015). “Analysemethoden zur Untersuchung der 3D-Architektur des Genoms”. Genombiologie. 16 (1): 183. doi:10.1186 \/ s13059-015-0745-7. PMC 4556012. PMID 26328929.^ Hoy, JA; Robinson, H; Trent JT, 3 .; Kakar, S; Smagghe, BJ; Hargrove, MS (3. August 2007). “Pflanzenh\u00e4moglobine: ein molekularer Fossilienbestand f\u00fcr die Entwicklung des Sauerstofftransports”. Journal of Molecular Biology. 371 (1): 168\u201379. doi:10.1016 \/ j.jmb.2007.05.029. PMID 17560601.^ ein b “Open Bioinformatics Foundation: \u00dcber uns”. Offizielle Website. \u00d6ffnen Sie die Bioinformatics Foundation. Abgerufen 10. Mai 2011.^ “Open Bioinformatics Foundation: BOSC”. Offizielle Website. \u00d6ffnen Sie die Bioinformatics Foundation. Abgerufen 10. Mai 2011.^ Broh\u00e9e, Sylvain; Barriot, Roland; Moreau, Yves (2010). “Biologische Wissensdatenbanken mit Wikis: Kombination der Flexibilit\u00e4t von Wikis mit der Struktur von Datenbanken”. Bioinformatik. 26 (17): 2210\u201311. doi:10.1093 \/ bioinformatics \/ btq348. PMID 20591906.^ Nisbet, Robert (2009). “Bioinformatik”. Handbuch f\u00fcr statistische Analysen und Data Mining-Anwendungen. John Elder IV, Gary Miner. Akademische Presse. p. 328. ISBN 978-0080912035.^ Kommissar, B\u00fcro der. “Advancing Regulatory Science – 24. bis 25. September 2014 \u00d6ffentlicher Workshop: Sequenzierungsstandards der n\u00e4chsten Generation”. www.fda.gov. Abgerufen 30. November 2017.^ Simonyan, Vahan; Goecks, Jeremy; Mazumder, Raja (2017). “Biocompute-Objekte – Ein Schritt zur Bewertung und Validierung biomedizinischer wissenschaftlicher Berechnungen”. PDA Journal of Pharmaceutical Science and Technology. 71 (2): 136\u201346. doi:10.5731 \/ pdajpst.2016.006734. ISSN 1079-7440. PMC 5510742. PMID 27974626.^ Kommissar, B\u00fcro der. “Advancing Regulatory Science – Community-basierte Entwicklung von HTS-Standards zur Validierung von Daten und Berechnungen und zur F\u00f6rderung der Interoperabilit\u00e4t”. www.fda.gov. Abgerufen 30. November 2017.^ Alterovitz, Gil; Dean, Dennis A.; Goble, Carole; Crusoe, Michael R.; Soiland-Reyes, Stian; Bell, Amanda; Hayes, Anais; K\u00f6nig, Charles Hadley S.; Johanson, Elaine (4. Oktober 2017). “Aktivierung der Pr\u00e4zisionsmedizin durch Standardkommunikation der Herkunft, Analyse und Ergebnisse von NGS”. bioRxiv 10.1101 \/ 191783.^ Das BioCompute Object (BCO) -Projekt ist ein kollaboratives und Community-gesteuertes Framework zur Standardisierung von HTS-Computerdaten. 1. BCO-Spezifikationsdokument: Benutzerhandbuch zum Verst\u00e4ndnis und Erstellen von B., Biocompute-Objekte, 3. September 2017^ Barker, D; Ferrier, DEK; Holland, PW; Mitchell, JBO; Plaisier, H; Ritchie, MG; Smart, SD (2013). “4273\u03c0: Bioinformatik-Ausbildung zu kosteng\u00fcnstiger ARM-Hardware”. BMC Bioinformatik. 14: 243. doi:10.1186 \/ 1471-2105-14-243. PMC 3751261. PMID 23937194.^ Barker, D; Alderson, RG; McDonagh, JL; Plaisier, H; Comrie, MM; Duncan, L; Muirhead, GTP; Sweeny, SD (2015). “Praktische Aktivit\u00e4ten auf Universit\u00e4tsniveau in der Bioinformatik kommen freiwilligen Sch\u00fclergruppen in den letzten zwei Schuljahren zugute.”. Internationale Zeitschrift f\u00fcr MINT-Bildung. 2 (17). doi:10.1186 \/ s40594-015-0030-z.^ McDonagh, JL; Barker, D; Alderson, RG (2016). “Informatik der \u00d6ffentlichkeit zug\u00e4nglich machen”. SpringerPlus. 5 (259): 259. doi:10.1186 \/ s40064-016-1856-7. PMC 4775721. PMID 27006868.^ Robson, JF; Barker, D (2015). “Vergleich des proteinkodierenden Gengehalts von Chlamydia trachomatis und Protochlamydia amoebophila unter Verwendung eines Raspberry Pi-Computers”. BMC Research Notes. 8 (561): 561. doi:10.1186 \/ s13104-015-1476-2. PMC 4604092. PMID 26462790.^ Wregglesworth, KM; Barker, D (2015). “Ein Vergleich der Protein-kodierenden Genome von zwei gr\u00fcnen Schwefelbakterien, Chlorobium tepidum TLS und Pelodictyon phaeoclathratiforme BU-1”. BMC Research Notes. 8 (565): 565. doi:10.1186 \/ s13104-015-1535-8. PMC 4606965. PMID 26467441.Weiterf\u00fchrende Literatur[edit]Sehgal et al. : Strukturelle, phylogenetische und Docking-Studien des D-Aminos\u00e4ureoxidase-Aktivators (DAOA), eines Kandidaten-Schizophrenie-Gens. Theoretische Biologie und medizinische Modellierung 2013 10: 3.Raul Isea Die heutige Bedeutung des Wortes Bioinformatik, Global Journal of Advanced Research, 2015Achuthsankar S Nair Computational Biology & Bioinformatics – Ein sanfter \u00dcberblick, Mitteilungen der Computer Society of India, Januar 2007Aluru, Srinivas, hrsg. Handbuch der Computational Molecular Biology. Chapman & Hall \/ Crc, 2006. ISBN 1-58488-406-1 (Chapman & Hall \/ Crc Computer- und Informationswissenschaftliche Reihe)Baldi, P und Brunak, S, Bioinformatik: Der Ansatz des maschinellen Lernens, 2. Auflage. MIT Press, 2001. ISBN 0-262-02506-XBarnes, MR und Gray, IC, Hrsg., Bioinformatik f\u00fcr Genetiker, erste Ausgabe. Wiley, 2003. ISBN 0-470-84394-2Baxevanis, AD und Ouellette, BFF, Hrsg., Bioinformatik: Ein praktischer Leitfaden zur Analyse von Genen und Proteinen, dritte Edition. Wiley, 2005. ISBN 0-471-47878-4Baxevanis, AD, Petsko, GA, Stein, LD und Stormo, GD, Hrsg., Aktuelle Protokolle in der Bioinformatik. Wiley, 2007. ISBN 0-471-25093-7Cristianini, N. und Hahn, M. Einf\u00fchrung in die Computational Genomics, Cambridge University Press, 2006. (ISBN 9780521671910 |ISBN 0-521-67191-4)Durbin, R., S. Eddy, A. Krogh und G. Mitchison, Biologische Sequenzanalyse. Cambridge University Press, 1998. ISBN 0-521-62971-3Gilbert D (2004). “Bioinformatik-Softwareressourcen”. Briefings in Bioinformatik. 5 (3): 300\u2013304. doi:10.1093 \/ bib \/ 5.3.300. PMID 15383216.Keedwell, E., Intelligente Bioinformatik: Die Anwendung k\u00fcnstlicher Intelligenztechniken auf Bioinformatikprobleme. Wiley, 2005. ISBN 0-470-02175-6Kohane et al. Microarrays f\u00fcr eine integrative Genomik. The MIT Press, 2002. ISBN 0-262-11271-XLund, O. et al. Immunologische Bioinformatik. The MIT Press, 2005. ISBN 0-262-12280-4Pachter, Lior und Sturmfels, Bernd. “Algebraische Statistik f\u00fcr Computational Biology” Cambridge University Press, 2005. ISBN 0-521-85700-7Pevzner, Pavel A. Computational Molecular Biology: Ein algorithmischer Ansatz The MIT Press, 2000. ISBN 0-262-16197-4Soinov, L. Bioinformatik und Mustererkennung kommen zusammen Journal of Pattern Recognition Research (JPRR), Vol 1 (1) 2006 p. 37\u201341Stevens, Hallam, Leben au\u00dferhalb der Sequenz: Eine datengetriebene Geschichte der Bioinformatik, Chicago: Die University of Chicago Press, 2013, ISBN 9780226080208Tisdall, James. “Perl f\u00fcr Bioinformatik beginnen” O’Reilly, 2001. ISBN 0-596-00080-4Katalyse der Untersuchung an der Schnittstelle von Computer und Biologie (2005) CSTB-BerichtBerechnung der Geheimnisse des Lebens: Beitr\u00e4ge der mathematischen Wissenschaften und des Rechnens zur Molekularbiologie (1995)Grundlagen der Computer- und Systembiologie MIT-KursComputational Biology: Genome, Netzwerke, Evolution Free MIT-KursExterne Links[edit]H\u00f6ren Sie sich diesen Artikel an (17,9 Megabyte)Diese Audiodatei wurde aus einer \u00dcberarbeitung dieses Artikels vom 20. September 2013 erstellt ((2013-09-20)und spiegelt nachfolgende \u00c4nderungen nicht wider.DatenbankenSequenzdatenbanken: GenBank, European Nucleotide Archive und DNA Data Bank of JapanSekund\u00e4rdatenbanken: UniProt, Datenbank von Proteinsequenzen, die Swiss-Prot, TrEMBL und Protein Information Resource zusammenfassenAndere Datenbanken: Protein Data Bank, Ensembl und InterProSpezialisierte Genomdatenbanken: BOLD, Saccharomyces-Genomdatenbank, FlyBase, VectorBase, WormBase, Rattengenomdatenbank, PHI-Basis, Arabidopsis Information Resource und Zebrafish Information NetworkSoftwareAndereInstitutionenOrganisationenTreffenDateiformateverwandte Themen"},{"@context":"http:\/\/schema.org\/","@type":"BreadcrumbList","itemListElement":[{"@type":"ListItem","position":1,"item":{"@id":"https:\/\/wiki.edu.vn\/wiki13\/#breadcrumbitem","name":"Enzyklop\u00e4die"}},{"@type":"ListItem","position":2,"item":{"@id":"https:\/\/wiki.edu.vn\/wiki13\/2020\/12\/24\/bioinformatik-wikipedia\/#breadcrumbitem","name":"Bioinformatik – Wikipedia"}}]}]