Software und Scientific Computing

Die Gruppe Software und Scientific Computing beschäftigt sich mit der Entwicklung von Algorithmen und Software-Werkzeugen zum schnellen Auffinden und Explorieren von Wissen in strukturierten und unstrukturierten frei verfügbaren Quellen. Beim Stöbern in der wissenschaftlichen Literatur, der Recherche in Datenbanken oder dem Browsen von Online-Medien fragt man sich häufig »Kann das sein?« oder »Was ist eigentlich der aktuelle Stand des Wissens?«. Nutzt man Portale, um das Web zu durchsuchen, muss man sich durch lange Ergebnislisten wühlen. Wir forschen an verteilten Informationssystemen, die solche Fragen ad hoc beantworten sollen. Das geht weit über stichwortbasierte Suchen hinaus. In unserem Data Center sind sowohl strukturierte Datenbanken (etwa zu Proteinen, Chemikalien, Wirkstoffen, klinischen Studien) als auch riesige unstrukturierte Dokumentensammlungen (beispielsweise Forschungsartikel, Patente, Beipackzettel) integriert. Das Ziel ist die Vernetzung unterschiedlicher Quellen über die Erkennung und Normalisierung von Konzepten und deren Beziehungen zu hochkomplexen Wissensgraphen. Wir nutzen dazu moderne Verfahren der Informationsextraktion, um mit Hilfe von Terminologien und Ontologien automatisch Nennungen von Konzepten (inklusive Synonymen und Abkürzungen) zu finden und diese in Beziehung zu setzen (Relation Mining). Das so gesammelte Wissen wird in föderierten Graphdatenbanken abgelegt und lässt sich so von Experten aus den Anwendungsfeldern (zum Beispiel Biomedizin, Pharmazie, Chemie, Biotechnologie) abfragen. Wir setzen dabei auf moderne Big-Data-Architekturen, Open-Source-Software-Lösungen (etwa Kubernetes, Apache Spark, Apache UIMA, Apache Spring, REACT) und Schnittstellen (etwa OpenAPI, OAuth), die wir anpassen und erweitern.
 

Wir bieten:

  • Beratung und Schulung zum Thema Informationsextraktion, Modellierung von Wissensgraphen, Aufsetzen und Betrieb von Mikroservice Architekturen im Big-Data-Umfeld, Digitalisierung und Datenaufbereitung
  • Entwicklung und Anpassung grafischer Analysewerkzeuge und Programmierschnittstellen (API)
  • Beteiligung an nationalen und internationalen Forschungsprojekten
  • Kooperationen mit der Industrie und Auftragsarbeiten
  • Vergabe und Betreuung von spannenden Forschungsarbeiten (Praxisprojekte, Bachelor-/Master-Arbeiten)
  • Lizenzierung und Wartung unserer Softwareprodukte
     

Wir verfügen über:

  • eine hervorragende Infrastruktur (Rechenzentrum, Datazentrum, schnelle Anbindung)
  • Expertenwissen in Chemie, Molekularbiologie, Biomedizin, Pharmakologie, Informatik und Mathematik
  • ein breites informatisches Kompetenzspektrum

Ausgewählte Publikationen

  • Jens Dörpinghaus, Marc Jacobs (2019), Semantic Knowledge Graph Embeddings for biomedical Research: Data Integration using Linked Open Data. Semantics.
  • Jens Dörpinghaus, Marc Jacobs, Martin Hofmann-Apitius (2019), Context graph for biomedical research data: A FAIR and open approach towards reproducible research in Medicin. Conference: MAQC2019.
  • Jens Dörpinghaus, Jürgen Klein, Johannes Darms, et al. (2018), SCAIView – A Semantic Search Engine for Biomedical Research Utilizing a Microservice Architecture. Semantics 2018.
  • Marc Jacobs, Sven Hodapp, Jens Dörpinghaus (2018), SDA: Towards a novel knowledge discovery model for information systems. IADIS Information Systems Conference (IS 2018).
  • Juliane Fluck, Philipp Senger, Wolfgang Ziegler, Steffen Claus, Horst Schwichtenberg (2017), The cloud4health Project – Secondary Use of Clinical Data with Secure Cloud-Based Text Mining Services. Scientific Computing and Algorithms in Industrial Simulations.Alle Publikationen des Geschäftsfelds Bioinformatik

Software und Scientific Computing Knowledge Graph

Software und Services im Geschäftsfeld Bioinformatik