Fachbeiträge

Ausgabe 5 / /2017

Fachbeitrag Big Data

Wie gut sind Ihre Daten vor Ausfällen geschützt?

Big Data, Small Data, Sensor- oder Log-Daten, strukturiert oder unstrukturiert – deutsche Unternehmen nutzen endlich ihre Informationen: Bei vier Fünfteln basieren Unternehmensentscheidungen auf Datenanalysen. Das ergab die gemeinsam von Bitkom und KMPG durchgeführte Studie „Mit Daten Werte schaffen 2016“. In modernen Data-Warehouse-Architekturen sollten heute Informationen zentral, sicher, indexiert und bereits vorsortiert für weiterführende Analysen vorliegen. Doch was ist, wenn beispielsweise ein Server ausfällt oder ein Netzteil in Rauch aufgeht? Themen wie Hochverfügbarkeit und fehlertolerante IT-Architekturen werden dabei auch im Zusammenhang mit dem Data Warehouse (DWH) immer wichtiger.

Inhaltsübersicht:

Hochverfügbares Data Warehouse: Welche Variante macht Sinn?
Verschiedene Wege führen zu mehr Hochverfügbarkeit
Synchron oder asynchron – das ist hier die Frage
Cloud und Hochverfügbarkeit
Hochverfügbare DWH-Strategien verlangen genaue Planung
Übergangsphase von On-Premise in die Cloud

„Die frühere Ansicht, dass Daten nicht unbedingt hochverfügbar sein müssen, da ja Unternehmen ohne sie bzw. ohne Auswertungen und Analysen weiter funktionieren können, zählt heute nur noch eingeschränkt“, erklärt der Big-Data-Experte Markus Ruf von der mip GmbH. Zwar haben immer noch die tatsächlich wertschöpfenden Prozesse Priorität. Jedoch sind in der Zwischenzeit Informationen sowie Datenanalysen teilweise selbst zu wertschöpfenden Prozessen in Unternehmen geworden. Vortages- oder Tagesauswertungen gehören zu wichtigen Entscheidungshilfen für Vorstände, Management und Unternehmensführung, genauso wie für Abteilungen. „Daten etwa zum Kundenverhalten sind heute wesentlich für aktuelle sowie künftige Entwicklungen und Trends – Stichwort: Predictive Analytics“, so Ruf.

Hochverfügbares Data Warehouse: Welche Variante macht Sinn?

Auch wenn bei einem Ausfall die Firma nicht gleich zusammenbricht, ist ein hochverfügbares Data Warehouse (DWH) sinnvoll. Welche Methode bzw. Hochverfügbarkeitsstrategie sich hierfür am besten eignet, muss von Fall zu Fall idealerweise zusammen mit DWH-Experten geprüft werden: Wie lange darf mein DWH im Jahr höchstens ausfallen? Müssen die Daten 24 Stunden am Tag, 7 Tage die Woche vorliegen? Damit hängt meist auch die Frage zusammen, wie viel das Thema Hochverfügbarkeit überhaupt kosten darf.

Sehr häufig wird ein Data Warehouse nur tagesaktuell genutzt. Aber selbst wenn bei einem Ausfall die Berechnungen und Auswertungen über Nacht nicht stattfinden können, weil kein paralleler bzw. gespiegelter DWH-Aufbau vorliegt, lassen sich die Informationen aus den operationalen Daten wiedergewinnen. „Eine Herausforderung ist jedoch, dass einige Firmen ihre Daten direkt im Data Warehouse archivieren und so nicht mehr alles aus dem operativen System rekonstruieren können“, erklärt Ruf. „Hier ist es deshalb entscheidend, dass die Informationen zum Beispiel auf einem parallel betriebenen DWH oder in der Cloud gesichert sind.“

Verschiedene Wege führen zu mehr Hochverfügbarkeit

Um Daten hochverfügbar zu machen, existieren mehrere Methoden, die jeweils von der im Vorfeld ermittelten höchstmöglichen Ausfallzeit und dem eigenen Geldbeutel abhängen. Dazu gehören:

eine vollständige (und bestenfalls automatisierte) Rekonstruktion der Daten aus den operativen Vorgängen (über Nacht) – allerdings mit einem Tag Verzögerung
die Virtualisierung des Data Warehouse über eine virtuelle Maschine (VM): Wenn eine DWH-Hardware-Komponente ausfällt, wird die VM einfach auf einen anderen physikalischen Server oder ins Storage Area Network (SAN) verschoben. So lässt sich das DWH wieder starten. Diese Variante setzt voraus, dass der Storage- bzw. VM-Server nicht ausgefallen ist. Erst eine Spiegelung auf der physikalischen Ebene macht das System hochverfügbar.
ein HADR-Cluster (High-Availability Data Replication) in der Datenbank selbst: Während der Datenaufbereitung wird eine Kopie des gesamten DWH angelegt. Somit lassen sich die Informationen bereits dort auf einer zweiten physikalischen Ebene spiegeln. Das hat aber auch Performance-Einbußen zur Folge, weil die Daten jedes Mal doppelt geschrieben werden müssen.

Synchron oder asynchron – das ist hier die Frage

Beim Thema Hochverfügbarkeit im Data Warehouse muss zudem im Vorfeld entschieden werden, ob dieser Bereich synchron oder asynchron aufgebaut werden soll. „Bei angestrebter Synchronität muss man stets darauf warten, bis alle Informationen geschrieben worden sind, was ein DWH langsam macht“, so Ruf. „Beim asynchronen Schreiben der Daten können diese allerdings verloren gehen, während sie ins DWH übernommen werden.“ Die wenigen so eingebüßten Datensätze lassen sich jedoch wieder per Datenrekonstruktion vervollständigen. Hier müssen sich Unternehmen entscheiden, ob sie nicht zugunsten einer höheren Performance eventuelle Datenverluste verschmerzen können.

Cloud und Hochverfügbarkeit

Geht es darum, Daten im Notfall dynamisch verschieben zu können, kommt beim Thema Hochverfügbarkeit die Cloud ins Spiel. Hierbei sind aber wieder zwei Seiten zu betrachten. Ruf: „Zum einen liegen die bekannten Cloud-Vorteile vor, wie etwa mehr Flexibilität durch eine bedarfsgerechte Speicherplatznutzung, ein höherer Sicherheitsstandard, den sich Firmen aus dem Mittelstand so gar nicht leisten können, und die wegfallenden bzw. geringeren Wartungs- sowie Administrationsaufwände.“ Wenn das komplette Data Warehouse in der Cloud aufbereitet wird, etwa als Database-as-a-Service (DBaaS), werden bestenfalls nur die Deltas aus den operativen Prozessen in die Cloud übertragen, wodurch keine Performance-Probleme auftreten. Allerdings könnten im schlechtesten Fall beide DWHs asynchron auseinanderlaufen.

„Arbeitet die Firma jedoch mit einem lokal aufgebauten Data Warehouse, welches zunächst alle Daten verarbeitet, um dann das gebündelte Gesamtvolumen zur Absicherung in die Cloud zu übertragen, kann sich dies auf die Performance auswirken“, beschreibt Ruf. Übertragungsgeschwindigkeiten von einem Gigabyte pro Sekunde reichen bei einem DWH mit Massendaten-Transfer bis zu mehreren Terabyte pro Nacht nicht mehr aus. Außerhalb der von Providern gut abgedeckten Gebiete sind Gigabyte-Bandbreiten allerdings kaum bis gar nicht verfügbar.

Hochverfügbare DWH-Strategien verlangen genaue Planung

Bereits vor dem Aufbau eines Data Warehouse und einer entsprechenden IT-Infrastruktur sollte deshalb darauf geachtet werden, welche DWH-Strategie das Unternehmen verfolgen möchte. Die grundlegende Frage lautet dabei, wie sich das DWH-Architektur-Konzept so aufsetzen lässt, dass das lokale DWH und die DBaaS-Lösung synchron laufen, ohne durch einen Infrastrukturteil wie eine langsame Cloud-Anbindung ausgebremst zu werden.

Eine hybride Cloud ist beispielsweise dann sinnvoll, wenn ein asynchrones Modell verfolgt wird, bei dem sich mit einem Versatz von ein oder zwei Stunden arbeiten lässt. Damit lassen sich immer so viele Daten verschieben, wie die jeweilige Bandbreite erlaubt, während die User im On-Premise-DWH auf die aktuellen Daten zugreifen können. Wenn nur in der Cloud gearbeitet wird, besteht immer ein Zeitversatz-Problem. Teams, die sich an verschiedenen Standorten mit dem gleichen Projekt beschäftigen, müssen so mit unterschiedlich aktuellen Informationen arbeiten, was zu Fehlern führen kann.

Übergangsphase von On-Premise in die Cloud

Ruf: „Wir bei mip gehen davon aus, dass es künftig für Kunden einfacher wird, mit Echtzeitdaten aus ihren DWHs zu arbeiten. Das Hauptproblem bezüglich Datentransfers ist ja, dass die meisten Unternehmen ihre großen ERP-Systeme heute noch lokal installiert haben und auf dieser Ebene die operativen Daten erzeugen.“ Deshalb müssen sich Firmen beim Thema Data Warehouse überlegen, ob sie die Daten aus der ERP-Lösung in zwei physikalische, parallel laufende und damit hochverfügbare DWHs verschieben oder alternativ VMs bzw. eine zeitversetzt arbeitende hybride Cloud-Architektur nutzen – mitsamt Performance-Einbußen oder asynchronen Datensätzen.

„In Zukunft werden aber verstärkt auch die großen IT-Infrastrukturen über die Cloud betrieben“, führt Ruf weiter aus. „Infrastructure-as-a-Service oder Cloud-Systeme werden gerade von den ERP-Anbietern vorangetrieben.“ Dabei „zwingen“ SAP Hana Cloud Platform, Microsoft Dynamics Nav etc. Unternehmen dazu, mit ihrer gesamten IT in die Cloud umzuziehen, da sie sonst keine Software-Unterstützung mehr erhalten. Dann werden sowohl operative Daten als auch DWHs in der Cloud liegen, also in großen Rechenzentren. Durch die kurzen Wege sowie den schnell erweiterbaren Speicherplatz verschwinden Performance-Probleme. Die jeweiligen finanziellen Möglichkeiten bestimmen dabei die Übertragungsgeschwindigkeit sowie die Ausfallsicherheit.

Diese Entwicklung wird von den Anbindungsmöglichkeiten der Unternehmen an die Cloud bzw. der Netzwerk-Topologie der Provider abhängen. An die Frage nach einem uneingeschränkten Datenzugriff schließt sich auch die Diskussion um den Ausbau des Glasfasernetzes in Deutschland an – andere Länder sind schon viel weiter. „Hier muss sich noch einiges tun, damit auch die Unternehmen aus Randgebieten besser angebunden werden“, so Ruf. „Denn eine Hochverfügbarkeit ist erst dann gegeben, wenn ich über zwei getrennte Internet-Leitungen von zwei unterschiedlichen Providern verfüge. Der berühmt-berüchtigte Bagger, die häufigste Ursache für einen Ausfall, lauert überall!“

Diese Artikel könnten Sie auch interessieren

Online Fachbeiträge Ausgabe 7 / 2013
Fachbeitrag Enterprise Search

Big Data: Informationen im Unternehmen finden & effizient nutzen

Artikel lesen

Online Fachbeiträge Ausgabe 8 / 2013
Fachbeitrag Big Data

Data Scientists – heiß begehrte Datenexperten

Artikel lesen

Online Fachbeiträge Ausgabe 9 / 2013
Fachbeitrag Big Data

Das Datenzeitalter – die Informationsflut als Chance

Artikel lesen

Online Fachbeiträge Ausgabe 12 / 2013
Fachbeitrag Qualitätsmanagement

Kein Prozess ohne Daten – Datenqualität bestimmt die Prozessqualität

Artikel lesen

Online Fachbeiträge Ausgabe 1 / 2014
Fachbeitrag Studie

Big Data – das „Öl des 21. Jahrhunderts“

Artikel lesen

Unsere Empfehlungen

Beitrag

Corporate Web 2.0 - eine Herausforderung für Unternehmen

WISSENplus

War der Begriff Web 2.0 bis vor kurzem Unternehmen noch weitgehend fremd und in erster Linie mit den Erfolgsgeschichten großer Firmen wie Amazon, Google oder Wikipedia verbunden, so werden zunehmend auch traditionelle Unternehmen darauf aufmerksam und stellen sich die Frage, wie sie das Web 2.0 für sich nutzen können. Und auch Analysten sehen und analysieren diesen Trend. So ist im 2006 Emerging Technolo...

Event

Online-Seminar | Erfahrungswissen sichern: So geht's!

25.06.2025

Die Demografiespirale spitzt sich unaufhaltsam zu. Wir erleben derzeit die Anfänge einer nie da gewesenen Pensionierungswelle. Mit ihr verabschiedenen sich in den nächsten Jahren sukzessive hunderttausende erfahrene Mitarbeiter in den Ruhestand. Hinzukommt, dass auch jüngere Mitarbeiter zunehmend nur noch projektgebunden arbeiten wollen und häufiger das Unternehmen wechseln. ...

Mehr Infos & Anmeldung

Beitrag

Alter Wein in modernen Schläuchen – wie innovativ sind intelligente Suchmaschinen wirklich?

Neue, scheinbar intelligente Internet-Suchmaschinen verblüffen durch ihre innovativen Funktionen: Jedem Suchwort werden inhaltliche Kategorien zugeordnet, die die Suche wesentlich überschaubarer machen. Parallel dazu wird zunehmend auch Datenbank- und Dokumentenmanagement-Software mit intelligenten Retrieval-Funktionalitäten ausgestattet. Der Frage, worin sich die zahlreichen am Markt angebotenen Produkt...

Event

Webconference | Prozessdigitalisierung und -automatisierung

18.09.2025

Strukturierte Abläufe, effiziente Prozesse und einheitliche Standards: Ein verlässliches Prozessmanagement ist essentiell, um die Zusammenarbeit von Kollegen zu organisieren. Neben Transparenz braucht es ein Verständnis über vor- und nachgelagerte Prozesse sowie ineinandergreifende Workflows ohne Mehraufwand für den einzelnen Anwender. Mittels Digitalisierung und Automatisierung der admini...

Mehr Infos & Anmeldung

Beitrag

Fit für den Wissenswettbewerb - Wissensmanagement im Mittelstand

WISSENplus

Kleine und mittlere Unternehmen (KMU) stehen vor der Herausforderung, mit überschaubaren Ressourcen sowohl auf externe als auch interne Anforderungen flexibel und schnell reagieren zu müssen. Durch ein effizientes Wissensmanagement lässt sich dieses Reaktionsvermögen verbessern. Für Vertreter von KMU liegt jedoch eine Schwierigkeit darin, Wissensmanagement im laufenden Tagesgeschäft so zu etablieren, ...

Beitrag

Nachhaltigkeit im Spannungsfeld von Wissensgesellschaft und Demografie

Nachhaltigkeitsberichte belegen ökologische, soziale und wirtschaftliche Engagements, die Unternehmen im Umgang mit internen und externen Ressourcen eingehen. Sie befriedigen die gesteigerten Informationsbedürfnisse von Stakeholdern. Die Berichterstattung konzentriert sich auf Kenndaten und somit auf harte Fakten. Die wichtigste Unternehmens-Ressource, der weiche Faktor Wissen, wird jedoch ungeachtet der ...

Event

Webconference | KI-gestützte Lösungen im Unternehmenseinsatz

15.10.2025

Metaverse, GPT-Technologie & Chatbots: Virtuelle Welten & KI-Tools sind auf dem Vormarsch. Leben, Lernen und Arbeiten verlagern sich mehr und mehr in den virtuellen Raum und werden von intelligenten Assistenten unterstützt. Wie sieht die Arbeit der Zukunft aus? Und mit welchen KI-Tools lässt sich die Effizienz erhöhen und die Produktivität verbessern?...

Mehr Infos & Anmeldung

Event

Webconference | Lösungen für Wissensmanagement: Wissen sammeln, nutzen, entwickeln, teilen, bewerten und erhalten

15.07.2025

Wissen teilen per E-Mail? Daten auswerten in Excel? Und Informationssammlungen in Word? Unternehmen wissen längst, dass Ihr Erfolg maßgeblich von ihren Wissensmanagement-Aktivitäten abhängt. Doch noch viel zu oft werden reibungslose Wissensflüsse durch teaminterne Insellösungen oder tradierte Vorgehensweisen verhindert. Mit der passenden Wissensmanagement-Lösung kanalisieren Sie Ihre Wissensma...

Mehr Infos & Anmeldung

Das Magazin für Digitalisierung, Vernetzung & Collaboration

Fachbeiträge

Wie gut sind Ihre Daten vor Ausfällen geschützt?

Hochverfügbares Data Warehouse: Welche Variante macht Sinn?

Verschiedene Wege führen zu mehr Hochverfügbarkeit

Synchron oder asynchron – das ist hier die Frage

Cloud und Hochverfügbarkeit

Hochverfügbare DWH-Strategien verlangen genaue Planung

Übergangsphase von On-Premise in die Cloud

Beratungsexperte Digitalisierung:
Steinbeis-Beratungszentrum Wissensmanagement

Diese Artikel könnten Sie auch interessieren

Big Data: Informationen im Unternehmen finden & effizient nutzen

Data Scientists – heiß begehrte Datenexperten

Das Datenzeitalter – die Informationsflut als Chance

Kein Prozess ohne Daten – Datenqualität bestimmt die Prozessqualität

Big Data – das „Öl des 21. Jahrhunderts“

Unsere Empfehlungen

Das Magazin für Digitalisierung, Vernetzung & Collaboration