Workflow-Management-System für Bioinformatik – Wikipedia

before-content-x4

EIN Workflow-Management-System für Bioinformatik ist eine spezielle Form des Workflow-Management-Systems, das speziell zum Erstellen und Ausführen einer Reihe von Rechen- oder Datenmanipulationsschritten oder eines Workflows im Zusammenhang mit der Bioinformatik entwickelt wurde.

Derzeit gibt es viele verschiedene Workflow-Systeme. Einige wurden allgemeiner als wissenschaftliche Workflow-Systeme für Wissenschaftler aus vielen verschiedenen Disziplinen wie Astronomie und Geowissenschaften entwickelt. Alle diese Systeme basieren auf einer abstrakten Darstellung des Ablaufs einer Berechnung in Form eines gerichteten Graphen, wobei jeder Knoten eine auszuführende Aufgabe darstellt und Kanten entweder Datenfluss- oder Ausführungsabhängigkeiten zwischen verschiedenen Aufgaben darstellen. Jedes System bietet normalerweise ein visuelles Front-End, mit dem der Benutzer komplexe Anwendungen mit wenig oder keiner Programmierkenntnis erstellen und ändern kann.[1][2][3]

Beispiele[edit]

In alphabetischer Reihenfolge umfassen einige Beispiele für Bioinformatik-Workflow-Management-Systeme:

Vergleiche zwischen Workflow-Systemen[edit]

Mit einer großen Anzahl von Bioinformatik-Workflow-Systemen zur Auswahl,[13] Es wird schwierig, die Funktionen der verschiedenen Workflow-Systeme zu verstehen und zu vergleichen. Bei der Bewertung und dem Vergleich der Systeme aus Sicht eines Bioinformatikers wurde wenig Arbeit geleistet, insbesondere beim Vergleich der Datentypen, mit denen sie umgehen können, der integrierten Funktionen, die dem Benutzer zur Verfügung gestellt werden, oder sogar ihrer Leistung oder Benutzerfreundlichkeit. Beispiele für bestehende Vergleiche sind:

  • Das Papier “Wissenschaftliche Workflow-Systeme – kann eine Größe für alle passen?”,[3] Dies bietet einen allgemeinen Rahmen für den Vergleich von Workflow-Systemen basierend auf ihren Kontrollfluss- und Datenflusseigenschaften. Zu den verglichenen Systemen gehören Discovery Net, Taverna, Triana, Kepler sowie Yawl und BPEL.
  • Das Papier “Meta-Workflows: Musterbasierte Interoperabilität zwischen Galaxy und Taverna”[14] Dies bietet einen benutzerorientierteren Vergleich zwischen Taverna und Galaxy im Zusammenhang mit der Ermöglichung der Interoperabilität zwischen beiden Systemen.
  • Das Infrastrukturpapier “Bereitstellung von IKT-Infrastruktur für die biomedizinische Forschung”[15] vergleicht zwei Workflow-Systeme, Anduril und Chipster,[16] in Bezug auf die Infrastrukturanforderungen in einem Cloud-Bereitstellungsmodell.
  • Das Papier “Ein Überblick über bioinformatische Pipeline-Frameworks”[17] Versuche, Workflow-Management-Systeme anhand von drei Dimensionen zu klassifizieren: “Verwenden einer impliziten oder expliziten Syntax, Verwenden eines Konfigurations-, Konventions- oder klassenbasierten Entwurfsparadigmas und Anbieten einer Befehlszeilen- oder Workbench-Schnittstelle”.

Verweise[edit]

  1. ^ Oinn, T.; Greenwood, M.; Addis, M.; Alpdemir, MN; Ferris, J.; Glover, K.; Goble, C.; Goderis, A.; Hull, D.; Marvin, D.; Li, P.; Lord, P.; Pocock, MR; Senger, M.; Stevens, R.; Wipat, A.; Wroe, C. (2006). “Taverna: Lektionen zur Schaffung einer Workflow-Umgebung für die Biowissenschaften” (PDF). Parallelität und Berechnung: Praxis und Erfahrung. 18 (10): 1067–1100. doi:10.1002 / cpe.993. S2CID 10219281.
  2. ^ Yu, J.; Buyya, R. (2005). “Eine Taxonomie wissenschaftlicher Workflow-Systeme für Grid Computing”. ACM SIGMOD-Aufzeichnung. 34 (3): 44. CiteSeerX 10.1.1.63.3176. doi:10.1145 / 1084805.1084814. S2CID 538714.
  3. ^ ein b Curcin, V.; Ghanem, M. (2008). Wissenschaftliche Workflow-Systeme – kann eine Größe für alle passen?. 2008 Internationale Konferenz für biomedizinische Technik in Kairo. S. 1–9. doi:10.1109 / CIBEC.2008.4786077. ISBN 978-1-4244-2694-2. S2CID 1885579.
  4. ^ “Anduril Workflow-Website”.
  5. ^ Ovaska, Kristian; Laakso, Marko; Haapa-Paananen, Saija; Louhimo, Riku; Chen, Ping; Aittomäki, Viljami; Valo, Erkka; Núñez-Fontarnau, Javier; Rantanen, Ville (07.09.2010). “Ein umfangreiches Datenintegrations-Framework bietet einen umfassenden Überblick über Glioblastoma multiforme.”. Genommedizin. 2 (9): 65. doi:10.1186 / gm186. ISSN 1756-994X. PMC 3092116. PMID 20822536.
  6. ^ Elhai, J.; Taton, A.; Massar, J.; Myers, JK; Travers, M.; Casey, J.; Slupesky, M.; Shrager, J. (2009). “BioBIKE: Eine webbasierte, programmierbare, integrierte biologische Wissensbasis”. Nukleinsäureforschung. 37 (Webserver-Problem): W28 – W32. doi:10.1093 / nar / gkp354. PMC 2703918. PMID 19433511.
  7. ^ Brandt, Jörgen; Bux, Marc N.; Leser, Ulf (2015). “Keilschrift: Eine funktionale Sprache für die groß angelegte wissenschaftliche Datenanalyse” (PDF). Ablauf der Workshops des EDBT / ICDT. 1330: 17–26.
  8. ^ Goecks, J.; Nekrutenko, A.; Taylor, J.; Galaxy Team, T. (2010). “Galaxy: Ein umfassender Ansatz zur Unterstützung zugänglicher, reproduzierbarer und transparenter Computerforschung in den Biowissenschaften”. Genombiologie. 11 (8): R86. doi:10.1186 / gb-2010-11-8-r86. PMC 2945788. PMID 20738864.
  9. ^ Reich, Michael; et al. (2006). “GenePattern 2.0”. Naturgenetik. 38 (1): 500–5001. doi:10.1038 / ng0506-500. PMID 16642009. S2CID 5503897.
  10. ^ Tiwari, Abhishek; Sekhar, Arvind KT (2007). “Workflow-basiertes Framework für Life-Science-Informatik”. Computational Biology and Chemistry. 31 (5–6): 305–319. doi:10.1016 / j.compbiolchem.2007.08.009. PMID 17931570.
  11. ^ Okonechnikov, K; Golosova, O; Fursov, M; Ugene, Team (2012). “Unipro UGENE: Ein einheitliches Bioinformatik-Toolkit”. Bioinformatik. 28 (8): 1166–7. doi:10.1093 / bioinformatics / bts091. PMID 22368248.
  12. ^ Bavoil, L.; Callahan, SP; Crossno, PJ; Freire, J.; Scheidegger, CE; Silva, CT; Vo, HT (2005). VisTrails: Aktivieren interaktiver Visualisierungen mit mehreren Ansichten. VIS 05. IEEE Visualization, 2005. S. 135–142. doi:10.1109 / VISUAL.2005.1532788. ISBN 978-0-7803-9462-9.
  13. ^ “Bestehende Workflow-Systeme”. Common Workflow Language Wiki. Archiviert vom Original am 17.10.2019. Abgerufen 2019-10-17.
  14. ^ Abouelhoda, M.; Alaa, S.; Ghanem, M. (2010). “Meta-Workflows”. Vorträge des 1. Internationalen Workshops zu Workflow-Ansätzen für neue datenzentrierte Wissenschaft – Wands ’10. p. 1. doi:10.1145 / 1833398.1833400. ISBN 9781450301886. S2CID 17343728.
  15. ^ Nyrönen, TH; Laitinen, J; et al. (2012), Bereitstellung von IKT-Infrastruktur für die biomedizinische Forschung, Proceedings of the WICSA / ECSA 2012 Companion Volume (WICSA / ECSA ’12), ACM, S. 37–44, doi:10.1145 / 2361999.2362006, ISBN 9781450315685, S2CID 18199745
  16. ^ Kallio, MA; Tuimala, JT; Hupponen, T; Klemelä, P; Gentile, M; Scheinin, ich; Koski, M; Käki, J; Korpelainen, EI (2011). “Chipster: Benutzerfreundliche Analysesoftware für Microarray- und andere Hochdurchsatzdaten”. BMC Genomics. 12: 507. doi:10.1186 / 1471-2164-12-507. PMC 3215701. PMID 21999641.
  17. ^ Leipzig J (2016). “Eine Überprüfung der bioinformatischen Pipeline-Frameworks”. Briefings in Bioinformatik. 18 (3): 530–536. doi:10.1093 / bib / bbw020. PMC 5429012. PMID 27013646. Abgerufen 23. März 2016.


after-content-x4