Neuer Sonderforschungsbereich für die Datenanalyse

Medieninformation | 25. Juni 2020 | kjAb dem 1. Juli 2020 fördert die Deutsche Forschungsgemeinschaft (DFG) den neuen Sonderforschungsbereich (SFB) „FONDA – Grundlagen von Workflows für die Analyse großer naturwissenschaftlicher Daten“. Zu den beteiligten Institutionen gehören auch zwei Fachgebiete der Technischen Universität Berlin: Distributed and Operating Systems von Prof. Dr. Odej Kao sowie Database Systems and Information Management von Prof. Dr. Volker Markl. Die Sprecherschaft des ersten Berliner SFB in der Informatik liegt bei Prof. Dr. Ulf Leser von der Humboldt-Universität zu Berlin.„Die Untersuchung vieler aktueller Fragestellungen der Naturwissenschaften basiert auf der Auswertung großer Datenbestände – Big Data – mit automatischen Analysewerkzeugen, deren Zusammenspiel in sogenannten Datenanalyseworkflows festgelegt wird“, so Volker Markl. „Der Begriff ‘Big Data‚ umschreibt dabei eine herausfordernde Datenanalyse, weil die Datensätze zum einen sehr groß und zum zweiten heterogen sind. Hinzu kommt, dass sie sich im Laufe der Zeit ändern oder schnell wachsen können.“„Eine effiziente Analyse solcher Daten erfordert sowohl parallele als auch verteilte Rechensysteme, die Einbeziehung fortschrittlicher statistischer Methoden sowie geeignete Mittel zur Durchführung der Datenintegration, -normalisierung und -filterung. Die Abfolge dieser Verarbeitungsschritte wird als Data Analysis Workflows bezeichnet“, weiß Odej Kao. Beispiele für solche Data Analysis Workflows (DAW) gehören mittlerweile zu den alltäglichen Werkzeugen in zahlreichen wissenschaftlichen Disziplinen. Dazu zählen eine Gen-Sequenzierung in der Biotechnologie, die Auswertung von Satellitenbildern in der Geowissenschaft oder auch die Beobachtung von biologischen Prozessen mit Mikroskopen. Die DAW setzen das Wissen der einzelnen Schritte in entsprechende Verarbeitungsketten um, so dass große Datenmengen effizient, nachvollziehbar und reproduzierbar ausgewertet und neue wissenschaftliche Erkenntnisse generiert werden können.Der dafür notwendige Entwicklungsaufwand ist nach wie vor sehr hoch, da die Entwicklung Detailkenntnisse über moderne Computerinfrastrukturen, komplexe Hardware (Computercluster, Multi-Core-Server, Hochleistungsrechnersysteme), Software (Ressourcenmanager, Scheduler, Dateisysteme), Programmiersprachen sowie Datenanalysewerkzeuge erfordert. Diese Kenntnisse sind nicht in allen wissenschaftlichen Bereichen vorhanden, wodurch sehr viel Entwicklungszeit abseits der eigentlichen Forschung zum Beispiel für Datenanalyse und Erkenntnisgewinn benötigt wird. „Daher ist ein interdisziplinärer Ansatz bei diesem Thema entscheidend“, so Odej Kao. Der SFB „FONDA“ will diese Lücke schließen und Techniken, Verfahren und Werkzeuge erforschen, die eine Steigerung der Produktivität von Wissenschaftler*innen bei der Erstellung und Anwendung von Datenanalyseworkflows ermöglichen.KontaktProf. Dr. Odej Kao TU Berlin Fachgebiet Distributed and Operating Systems Tel.: 030 314-25154 E-Mail: odej.kao(at)tu-berlin.deProf. Dr. Volker Markl TU Berlin Fachgebiet Database Systems and Information Management Tel.: 030 314-25553 E-Mail: volker.markl(at)tu-berlin.de

zum Artikel gehen

Über 110 Millionen Euro für Berlins Wissenschaft

Das trilaterale Projekt „Mehrsprachige wissensverbesserte Informationsextraktion für die Pharmakovigilanz“, das von Prof. Dr.-Ing. Sebastian Möller, Fachgebiet Quality and Usability Lab der TU Berlin, mitgeleitet wird, gehört zu den Projekten, die in der

zum Artikel gehen

Google Analytics 4 – Arbeiten mit Berichten und der explorativen Datenanalyse

Mit der Umstellung auf Google Analytics 4 ändert sich einiges bei der Arbeit mit den Standardberichten. Neu dazu kommt außerdem die explorative Datenanalyse. Damit euch der Einstieg möglichst gut gelingt, geben wir euch in diesem Tutorial einen Einblick i

zum Artikel gehen

Transparenz als Antwort auf aktuelle gesellschaftliche Herausforderungen?

Wie kann Transparenz auf dem Weg zu einer nachhaltigeren Gesellschaft unterstützen? Und wann wird sie zum Problem? Wie können Unternehmen Krisen besser überstehen? Und lassen sich Bilanz- und Steuerskandale durch mehr Transparenz vermeiden? Wichtige Frage

zum Artikel gehen

Ideen für Sensoren

Sensoren und Datenanalyse sind für unser modernes Leben von essenzieller Bedeutung und begegnen uns überall und täglich - beispielsweise in Smartphones und Smart Watches. Dort sind Sensoren integriert, die Daten messen, analysieren und registrieren. Durch

zum Artikel gehen

Neue Ansätze und Anwendungen in der Softwaretechnik

Software nimmt in vielen Bereichen eine immer größere Rolle ein. Autos, Züge, Smart Home-Technologien oder intelligente Stromnetze sind nur eine kleine Auswahl der Anwendungen, bei denen cyber-physikalische Systeme (CPS), also mit Software kombinierte ele

zum Artikel gehen