Die Themen Big Data und Cloud beschäftigen die Unternehmen in allen Branchen. Digitalisierung, Internet of Things, Social Media und cloudbasierte Geschäftsmodelle produzieren massenhaft Daten, die verwertbar und überall zugänglich sein sollen. Doch wohin damit? Am besten wäre es doch, alle Daten je nach Bedarf in ein über die Cloud flexibel erweiterbares Data Warehouse abzulegen, also Database-as-a-Service zu nutzen. Experten mahnen hier aber zur Vorsicht.
Schnell anpassungsfähige Cloud-Angebote wie Software-as-a-Service (SaaS), Infrastructure-as-a-Service (IaaS) oder Database-as-a-Service (DBaaS), sozusagen ein cloudbasiertes Data Warehouse (DWH), gewinnen in sämtlichen Branchen mehr und mehr an Bedeutung. In einer Studie zum Thema Hybrid-Cloud, einem Mix aus On-Premise- und Cloud-Lösungen, wurden weltweit IT-Verantwortliche befragt. 85 Prozent der Unternehmen, die bereits eine sehr gut integrierte hybride IT-Infrastruktur aufweisen, gaben an, dass sie ihre Kosten durch den Cloud-Einsatz signifikant reduzieren konnten. Bei den Firmen mit weniger gut integrierter Hybrid-Cloud gelang dies gerade einmal der Hälfte. „Ob ein Data Warehouse aus der Cloud allerdings die richtige Lösung für ein Unternehmen darstellt, muss sorgfältig von Fall zu Fall geprüft werden“, so Markus Ruf, Daten-Experte der mip GmbH.
Mehr Flexibilität: Data Warehouse als Cloud-Service
Dabei arbeitet ein DWH eher im Hintergrund. Es sammelt strukturierte und unstrukturierte Daten, die gesäubert, analysiert und für die Weiterverarbeitung in anderen Systemen aufbereitet werden. Ein Schattendasein hat es jedoch nicht verdient: Denn um unternehmensrelevante Informationen gewinnen und auswerten zu können, müssen stets historische Daten sowie Muster für einen Vergleich herangezogen werden – und diese liefert das Data Warehouse. „Deshalb arbeiten wir gerade mit unseren Kunden daran, Data-Warehouse-, Echtzeit- und Big-Data-Technologien stärker zu integrieren“, meint Ursula Flade-Ruf, Gründerin und Geschäftsführerin der mip GmbH. „Die Kunden müssen schneller sowie flexibler auf neue Technologien und Entwicklungen in den Märkten reagieren können. Darum greifen sie vermehrt auf Cloud-Produkte zurück, die sich rasch und ohne große Anfangsinvestition einbinden lassen.“ Laut Flade-Ruf eignet sich die Cloud vor allem für Testzwecke oder zeitlich begrenzte Services: „Über die Cloud-Plattform Bluemix können beispielsweise Watson-Services bezogen werden – mithilfe des kognitiven Supercomputers lassen sich Datenpakete besonders schnell analysieren.“ Dieses bedarfsorientierte Vorgehen ist viel kosteneffizienter als die Installation von Watson im Unternehmen.
Alles immer noch eine Frage der Cloud-Sicherheit
Mit dem Cloud-Einsatz geben Unternehmen aber auch den Betrieb ihrer Software, teilweise sogar ihre komplette IT-Infrastruktur in die Hände der Cloud-Anbieter – und damit auch Performance und Datensicherheit. Eine Studie zeigt in diesem Zusammenhang, dass besonders die Sicherheitsbedenken sowohl bei Cloud-Verweigerern (83,6 %) als auch bei Cloud-Befürwortern (68 %) immer noch hoch sind. „Cloud-Provider können allerdings einen viel höheren und professionelleren Sicherheitsstandard anbieten, als etwa ein kleines mittelständisches Unternehmen“, so Flade-Ruf. „Jedoch stellt sich immer die Frage, ob die Anbieter überhaupt Interesse daran haben, für eine maximal mögliche Cloud-Sicherheit zu sorgen.“ Die großen Provider suggerieren dabei oft ein Gefühl von Sicherheit. Cyber-Attacken und Datendiebstähle, wie etwa der jüngst bekannt gewordene Hacker-Angriff auf Microsoft-, Google- und Yahoo-Konten belegen aber immer wieder das Gegenteil. Zudem haben die Rechtsstreitigkeiten von Apple mit der US-Regierung gezeigt, dass Staaten wie die USA weiterhin unter bestimmten sicherheitsrelevanten Bedingungen auf Daten von US-Firmen zugreifen können. „Dabei ist egal, in welchem Land die Daten gespeichert sind“, konstatiert Flade-Ruf. „Wir beobachten, dass die deutschen Unternehmen hier immer noch zögerlich sind, ihre sensiblen, für Auswertungen relevanten Daten in die Cloud zu legen.“
Keine Performance-Garantie über die Cloud
Ein anderer Nachteil der Cloud sind Performance-Probleme, die etwa beim Verschieben von großen Datenmengen auftreten. „Im Gegensatz zu einem operationalen System, das nur nacheinander Transaktionen abwickelt, sind Data-Warehouse- und auch künftige Big-Data-Anwendungen nach wie vor stark Input/Output-lastig“, erklärt Flade-Ruf. „Beim Thema Cloud und Übertragungsgeschwindigkeit sind wir in Deutschland auf den letzten Metern, selbst in Großstädten, einfach noch nicht schnell genug.“ Ruf ergänzt: „Cloud-Provider werden niemals eine bestimmte Leistung oder I/O-Werte garantieren. Derartige Service Level Agreements auf Performance oder auf eine bestimmte Anzahl an CPU-Kernen, RAM- und Festplatten-Speicher gibt es nicht.“ Dieses Thema wird in der medialen Diskussion umgangen, da bisher niemand genau messen kann, wo der Geschwindigkeitsverlust entsteht: Verliert der Rechner selbst die Zeit oder wird die Zeit auf dem Weg dorthin eingebüßt? „Der Cloud-Kunde erhält daher nur eine virtuelle Maschine“, erläutert Ruf. „Diese bekommt bestimmte Prozessoren zugewiesen, die aber over provisioned sind, sprich: die Prozessoren sind mehreren Rechnern zugewiesen. Nur wenn eine Bare-Metal-Maschine angemietet wird, lassen sich vorgegebene Leistungsparameter in etwa einhalten. Diese werden aber seltener angeboten und sind natürlich dementsprechend teurer.“
Information for everybody
Für flexible und schnelle Hilfe bei Analysen oder für Testzwecke sind Cloud- und DBaaS-Angebote schon heute sehr gut geeignet, weil keine eigene kostenintensive Infrastruktur aufgebaut werden muss. „Zudem werden die Menschen in Zukunft sicher auch etwas lockerer mit ihren Daten umgehen, wie Facebook, Twitter und Co es bereits andeuten – ganz nach dem Motto: Information for everybody“, so Flade-Ruf. „Aber hier benötigt es noch ein wenig Zeit. Zu klären ist unter anderem auch die Frage, wie belastbar die Rechtslage rund um die Cloud einzuschätzen ist.“ Ansonsten werden deutsche Unternehmen zumindest in Bezug auf ihre sensiblen, erfolgsrelevanten Daten weiterhin einen Bogen um das Data Warehouse in der Cloud machen.