KOS.Content 01 | 2015
Total Page:16
File Type:pdf, Size:1020Kb
KOS.content 01 | 2015 Ergebnisse der Untersuchungen des Kompetenzzentrum Open Source der DHBW-Stuttgart Frühjahr 2015 band.2 KOS.content 01 | 2015 INHALT BAND.2 Inhalt — Testszenarien für NoSQL-Datenbanksysteme Marktanalyse über OS Dokumentationssyste- me für das Wissensmanagement 741 und -dienste aus der Cloud (2) — 559 — Konzepte und Einsatzszenarien von Einsatz von Open Source Tools zur PDF-Erzeugung bei Versicherungen 837 Wide Column Datenbanken (2) — 593 — Einsatzszenarien von MVC-Frameworks zur Auswahl und Bewertung von Open Source Schnittstellentransformationstools 897 Entwicklung client-seitiger SPAs— 657 — Untersuchung von Open Source Thin Client Produkten Open Source Security: Sicherheit von Linux auf System z 975 in Verbindung mit einer Citrix VDI-Umgebung — 691 — Das Kompetenzzentrum Open Source (KOS) Ziel des Projektes Das Projekt Kompetenzzentrum Open Source der DHBW Stuttgart wurde mit der Zielsetzung ins Leben gerufen, die Einsatzfelder für Open Source Software in Unternehmen zu identifizieren und durch den Einsatz quelloffener Produkte und deren kostengünstigen Einsatzmöglichkeiten Optimierungen in ausgewählten Geschäftsbereichen zu erzielen. Dies bedeutet konkret, dass z.B. Open Source Software evaluiert wird, um Lizenzkosten zu reduzieren, bewertet wird, ob sie diverse Qualitätskriterien erfüllt und erfolgreich(er) und effizient(er) in Unternehmen genutzt werden kann. Das Ziel des Projektes ist es hierbei, allgemeingültige Lösungskonzepte für Problemstellungen zu erarbeiten, welche von den am Projekt beteiligten Unterneh- men zu firmenspezifischen Lösungen weiterentwickelt werden können. Die beteiligten Unternehmen partizipieren so an den Ergeb- nissen des Projekts. Zusammenarbeit mit den Dualen Partnern Die Zusammenarbeit mit den Dualen Partnern gestal- tet sich entlang deren Anforderungen und Bedürfnis- sen. Sie sind die Themengeber für betriebliche Frage- stellungen, die im Rahmen des Projekts untersucht werden. Die DHBW steuert die wissenschaftliche, di- daktische und methodische Expertise und Forschungs- kompetenz bei und untersucht die identifizierten The- menfelder. Im Rahmen des Projektes steuert die DHBW Stuttgart die wissenschaftliche Expertise und Forschungskompetenz bei zur Bearbeitung der betrieblichen Fragestellungen der Dualen Partner. Es entstehen generische Lösungen, welche von den Partnern an Ihre Situation angepasst werden kann. Im Rahmen der Arbeit entstehen (generische) Lösungen, an denen die Partner teilhaben können indem sie diese auf ihre spezifische Unternehmenssituation anpassen. Zudem fließen die Ergebnisse in die Arbeit der DHBW ein, sodass hier dem Anspruch an eine hohe Anwendungs- und Transferorientierung ganz im Sinne einer kooperativen Forschung Rechnung getragen wird. An den Ergebnissen des Projekts partizipieren die Dualen Partner Allianz Deutschland AG, die Deutsche Rentenversicherung Baden- Württemberg, die HALLESCHE Krankenversicherung a.G. und die WGV-Informatik und Media GmbH. Inhalt + Projektdarstellung | Duale Hochschule Baden-Württemberg Testszenarien für NoSQL-Datenbanksysteme/- dienste aus der Cloud Schriftliche Ausarbeitung im Rahmen der Lehrveranstaltung „Integrationsseminar“ für das Kompetenzzentrum Open Source (KOS) Vorgelegt von Eitel, Fabian Neef, Jacqueline Seibold, Marcel Weber, Maximilian am 26.01.2015 Fakultät Wirtschaft Studiengang Wirtschaftsinformatik WI2012I KOS.content 1.2015 | 559 Inhaltsverzeichnis Abkürzungsverzeichnis .........................................................................................................III Abbildungsverzeichnis ...........................................................................................................III 1 Einleitung ........................................................................................................................1 1.1 Problemstellung und Zielsetzung .............................................................................1 1.2 Struktur und Beiträge der Arbeit ...............................................................................1 2 Theorie ............................................................................................................................2 2.1 NoSQL im Überblick ................................................................................................. 2 2.2 Theoretische Konzepte der NoSQL-Bewegung ........................................................2 2.2.1 Apache Hadoop ................................................................................................3 2.2.2 MapReduce-Verfahren ......................................................................................4 2.3 CouchDB..................................................................................................................5 2.4 Cloud Provider .........................................................................................................8 3 Praxis ............................................................................................................................11 3.1 Untersuchung von Testdaten .................................................................................11 3.2 Testszenario 1 – Analyse der Common Crawl DB mit Amazon EMR ..................... 14 3.3 Testszenario 2 – Regionale Analyse von Tweets mit Cloudant .............................. 20 4 Fazit und Ausblick: Anwendungsfälle von NoSQL-DB ................................................... 27 4.1 Fazit .......................................................................................................................27 4.2 Ausblick .................................................................................................................27 Anhang ................................................................................................................................. 29 Quellenverzeichnisse ...........................................................................................................29 KOS.content 1.2015 | 560 Abkürzungsverzeichnis ASF Apache Software Foundation AWS Amazon Web Services DBMS Datenbankmanagementsystem DBaaS Database as a Service EMR Elastic MapReduce ENISA European Network and Information Security Agency IBM International Business Machines IaaS Infrastructure as a Service NIST National Institute of Standards and Technology PaaS Plattform as a Service SaaS Software as a Service URI Uniform Resource Identifier Abbildungsverzeichnis Abb. 1: MapReduce Model .....................................................................................................4 Abb. 2: Beispiel eines Dokuments im JSON-Format ...............................................................6 Abb. 3: Kategorien der Cloud Services ...................................................................................9 Abb. 4: Common Crawl Datenset auf AWS Homepage ........................................................ 13 Abb. 5: AWS Dashboard ......................................................................................................15 Abb. 6: EC2 Instanzen aktiviert ............................................................................................ 15 Abb. 7: Inhalt der credentials.json Datei ...............................................................................16 Abb. 8: Download des Codes von Github .............................................................................16 Abb. 9: Definition des Builders in Eclipse .............................................................................17 Abb. 10: Erstellung des MapReduce Jobs und Auflistung ..................................................... 17 Abb. 11: Cluster Übersicht ....................................................................................................18 Abb. 12: Volltextsuche in der Ergebnis-Datei........................................................................19 Abb. 13: Ausgabenübersicht ............................................ Fehler! Textmarke nicht definiert. Abb. 14: Erstellung einer Cloudant Datenbank .....................................................................20 Abb. 15: Verbindung von Cloudant und Twitter API in Cloudant ........................................... 21 Abb. 16: URI eines JSON-Dokuments ..................................................................................21 Abb. 17: JSON-Dokument der Twitterdatenbank in Cloudant ............................................... 22 Abb. 18: MapReduce-Funktion zur Durchführung des Testfalls ............................................ 23 Abb. 19: Absolute Häufigkeit der Tweets in einer Zeitzone ................................................... 24 Abb. 20: MapReduce-Funktion zur Anzeige der Sprache der Tweets ................................... 24 Abb. 21: Ausgabe der Gesamtzahl an Tweets in Französisch .............................................. 25 Abb. 22: Preisliste für die Nutzung von Cloudant (Stand 15.01.2015) .................................. 25 KOS.content 1.2015 | 561 1 Einleitung 1.1 Problemstellung und Zielsetzung Wissen ist Macht. Das gilt insbesondere für heutige Unternehmen. Folglich werden Daten immer wichtiger für die moderne Wirtschaft.1 Insbesondere da diese sich als Entscheidungs- grundlage anbieten. Die große Herausforderung ist dabei die Vielzahl der Daten schnell und effizient aufzubereiten. Bei großen Mengen an unstrukturierten Daten kommen klassische, relationale Datenbanksysteme schnell an ihre Grenzen. Ein alternativer Lösungsansatz sind NoSQL-Datenbanksysteme zur effizienten Speicherung der Daten – die vermehrt