Open Source Basierte Virtuelle Forschungsumgebungen Für Projekte in Der Ökologischen Langzeitforschung
Total Page:16
File Type:pdf, Size:1020Kb
Open Source basierte Virtuelle Forschungsumgebungen für Projekte in der ökologischen Langzeitforschung Das „Rapid L-TER VRE“ Baukastenkonzept zur schnellen und nachhaltigen Realisierung Von der Fakultät für Umwelt und Naturwissenschaften der Brandenburgischen Techni- schen Universität Cottbus – Senftenberg zur Erlangung des akademischen Grades eines Doktors der Ingenieurwissenschaften genehmigte Dissertation vorgelegt von Diplom-Umweltingenieur Mirko Filetti aus Offenbach, am Main (Hessen) Gutachter: apl. Prof. Dr.-Ing. habil. Frank Molkenthin Gutachter: Prof. Dr. rer. nat. habil. Albrecht Gnauck Gutachter: Prof. Dr. rer. nat. habil. Gerhard Wiegleb Tag der mündlichen Prüfung: 28.06.2018 Kurzfassung Virtuelle Forschungsumgebungen (engl. virtual research environments, im Folgenden als VRE bezeichnet), sind nach allgemeinem Verständnis Plattformen auf Basis von Informations- und Kommunikationstechnologien (engl. ICT) mit ganzheitlichem Ansatz, die das wissenschaftliche Arbeiten im Team und insbesondere dessen Kommunikation und Organisation unterstützen sollen. Sie haben zum Ziel, schneller und besser zu nachvollziehbaren Ergebnissen zu gelangen und Wissen persistent verfügbar zu machen. Derzeit existiert jedoch kein VRE-Software- Framework, das „out-of-the-box“ sofort einsatzfähig oder für alle Anforderungen geeignet wäre („one size fit them all“). Projekte in der ökologischen Langzeitforschung (engl. long-term ecological research, im Folgenden als L-TER bezeichnet) sind durch den Langzeitaspekt und Raumbezug in der Regel umfangreiche Projekte mit mittleren und großen Datenmengen (Medi- um Data und Big Data) sowie interdisziplinären, örtlich verteilten Forschungsgruppen. Sie sind daher prädestiniert für den Einsatz von VREs. Die vorliegende Arbeit untersucht die spezifi- schen Aspekte und Anforderungen an virtuelle Forschungsumgebungen von Projekten in der ökologischen Langzeitforschung. Dazu wird der Begriff „L-TER VRE“ eingeführt. Grundlage hierfür ist der Stand des Wissens zu allgemeinen VREs, Datenmanagement und ICT, die inter- disziplinär in Verbindung gebracht werden mit den Zielen, Methoden und Daten der ökologi- schen Langzeitforschung. Es zeigt sich, dass sich die Anforderungen an L-TER VREs – auf- grund ihres Einsatzbereiches für langfristige L-TER Projekte – in der Nachhaltigkeit durch ihre Persistenz (Daten, Infrastruktur), Flexibilität (projektspezifische Rahmenbedingungen), der eingesetzten ICT und vom Faktor „Mensch“ mit seinem gesellschaftlichen Umfeld von VREs für andere Aufgaben unterscheiden. Aus den Erkenntnissen wird ein innovatives Baukastenkon- zept mit dem Namen „Rapid L-TER VRE“ zur Planung, dem Aufbau und Betrieb von L-TER VREs vorgestellt. Es basiert auf Open-Source-Software und kann durch die gemeinsame Basis der Bausteine auch für allgemeine VREs Verwendung finden. Da VREs oder ähnliche ICT- Infrastrukturen im Rahmen von „e-Science“ als Rückgrat für die Organisation der Projekte prädestiniert sind, ist der Aufbau solcher Infrastrukturen oft schon zur Voraussetzung bei der Antragstellung von Projekten geworden. Ein Prototyp sollte daher bereits vor oder bei der Antragstellung existieren - spätestens zum Projektbeginn muss eine Produktivumgebung zur Verfügung stehen. Vor diesem Hintergrund ist das Konzept „Rapid L-TER VRE“ speziell für eine schnelle (engl. rapid) Entwicklung von VRE Prototypen mit einer kurzen Übergangsphase in den Produktivbetrieb ausgelegt. Das Baukastenkonzept wird auf verschiedene existierende Projekte im Umfeld des Fachgebietes „Environmental Informatics“ und der Fakultät „Umwelt und Naturwissenschaften“ der BTU Cottbus-Senftenberg konzeptionell, sowie in der Form von Prototypen angewendet und dessen Anwendbarkeit auch allgemein bewertet. Aus den Erkennt- nissen werden allgemeine Schlussfolgerungen für den erfolgreichen Betrieb von L-TER VREs gezogen – hier steht der Mensch als „maßgeblicher“ Faktor im Mittelpunkt. Im Anhang finden sich zusammengefasste Informationen zu den ausgewählten Projekten sowie spezifischen Soft- ware-Empfehlungen (Open Source), die aus der praktischen Erfahrung dieser Arbeit stammen und zum Teil separat im längeren Produktivbetrieb getestet wurden. Schlagwörter: Virtuelle Forschungsumgebung (VRE), ökologische Langzeitforschung (L-TER), Open-Source, e-Science, Langzeit-Datenmanagement, Umweltinformatik Abstract Virtual research environments (VREs) are information and communication technology (ICT) platforms that apply a holistic approach in supporting scientific communities. In particular communication and organization among members of a research group is necessary. With VREs scientific results can be obtained faster, more efficiently and shared with the community on the platform in an immediate, comprehensible and easily accessible form. At the moment, there is no VRE software framework existing, that would be immediately applicable - "out-of-the-box" and suitable for any field of research - "one size fit them all". Large scale and long-term re- search projects are often interdisciplinary, generate large data sets and may involve the collabo- ration of spatial distributed research groups. In this thesis project specific aspects and their associated requirements for VREs are examined on the basis of exemplary long-term ecological research (L-TER) projects. The premise for this objective is a profound comprehension of the general functioning of VREs, data management and ICT, which are merged from an interdisci- plinary point of view with the objectives, methods and data management of long-term ecologi- cal research. It could be shown that in the field of sustainability the requirements of L-TER VREs differ from general VREs in terms of persistence (data, infrastructure), flexibility (project specific), ICT, and "humans" with their social interaction. Based on these findings, an innova- tive model kit called "Rapid L-TER VRE" was developed, which is comprised of several com- patible modules. By combining them, an efficient framework for planning, setup and operation of L-TER VREs can be presented. "Rapid L-TER VRE" utilizes open-source software and can be applied in any VREs, thanks to the shared conceptual basis of the modules. In the context of “e-science” VREs or similar ICT-platforms are predestined to become the backbone of complex research projects and as a result of this, are often viewed as a prerequisite for novel research proposals. A prototype should therefore be available before or during an application process, but latest at the beginning of a research project. "Rapid L-TER VRE" was specifically designed for the rapid development of VRE prototypes having a short transition phase to an efficient infra- structural research tool in a productive environment. The model kit was applied conceptually, as well as in the form of a prototype to various existing projects from the chair of environmental informatics and the faculty of environment and natural science of the BTU Cottbus-Senftenberg. By assessing the VRE’s practicality, general conclusions on the successful operations of VREs could be drawn. Humans with their communities must are the „evaluating“ and leading factor in the centre. The appendix contains further information on the presented research projects and related software recommendations (open source) from a „VRE construction kit“ that are based on the experience of project specific VRE applications. These have been partially tested in long- term applications and can be helpful for the technical implementation of individual VREs sup- porting an interdisciplinary team of researchers. Keywords: Virtual Research Environments (VRE), long-term ecological research (L-TER), Open-Source, e-Science, long-term data management, Environmental Informatics I Inhalt Inhaltsverzeichnis ............................................................................................................ I Abbildungsverzeichnis ................................................................................................... V Tabellenverzeichnis .................................................................................................... VII Abkürzungsverzeichnis ................................................................................................ XI 1. Einleitung ................................................................................................................. 1 1.1 Motivation ........................................................................................................... 4 1.2 Zielstellung und Forschungsfragen ..................................................................... 5 2. Stand des Wissens und der Technik ...................................................................... 7 2.1 Alte und neue Paradigmen der Wissenschaft ...................................................... 7 2.2 Entwicklung der ökologischen Informatik .......................................................... 9 2.3 Ökologische Langzeitforschung (L-TER) ......................................................... 11 2.4 Open Source – von der Insellösung zum „Software-Ökosystem“ ..................... 13 2.5 Virtuelle Forschungsumgebungen ..................................................................... 16 2.5.1 Aktueller Stand ........................................................................................ 17 2.5.2 Management von Forschungsdaten ......................................................... 22 2.5.3 Life-Cycle-Modell für VREs................................................................... 24 2.5.4 Langzeitarchivierung