Data-Warehouse (DWH)

Unter einem Data-Warehouse versteht man eine zentrale Sammelstelle für interne und externe Daten, die aus unterschiedlichen Datenquellen generiert werden. Diese Daten werden aus den Vorsystemen mithilfe eines ETL-Prozesses (Extract-Transform-Load) geholt und dann im zentralen Data-Warehouse dauerhaft gespeichert.

Unternehmensweites Data-Warehouse: Sinnvolle Investition oder Kosten ohne nennenswerten Businessnutzen?

Im Rahmen unserer Tätigkeit in mittelständischen Konzernen und zahlreichen DAX-Unternehmen haben wir die Erfahrung gemacht, dass wir neben SAP in der Regel noch zahlreiche anderen Datenquellen (CRM, Branchenlösungen, Cloud-Software usw.) in den Unternehmen vorfinden. Gerade diese Heterogenität in den Datenquellen (z.B. Daten aus Social Media, Daten aus Tabellen aus Excel, Daten aus Anwendungen) ist der Grund, warum eine Zusammenführung der verschiedenen Informationen in ein unternehmensweites Data-Warehouse Sinn macht. Darüber hinaus haben viele Unternehmen sehr große Datenmengen zu handhaben, sie sprechen in diesem Zusammenhang auch gerne von Big-Data und finden im Data-Warehousing einen geordneten Umgang mit dem Thema Big-Data. Aber auch inhaltliche Anforderungen sind ein wichtiger Grund für ein zentrales Data-Warehouse. So habe ich vor einigen Wochen mit einem CEO gesprochen, der mir sein Leid wie folgt klagte: Ich bekomme im Monat an die 40 Berichte aus den verschiedenen Unternehmensbereichen, teilweise widersprechen sich die Zahlen, der Vertrieb meldet andere Umsatzzahlen als in der Buchhaltung ausgewiesen werden. Mit einigem Aufwand lassen sich die Abweichungen aufklären, es ändert aber nichts daran, dass das Vertrauen in die bereitgestellten Zahlen sinkt, die Entscheidungsfindung verlangsamt wird und gerade bei Unternehmen, die in volatilen Märkten tätig sind, durch zu langsames Reagieren Unternehmenswert vernichtet wird. Die Ursache für derartige Ineffizienzen liegt oft darin, dass das Berichtswesen nicht auf einem einheitlichen Datenbestand aufbaut, wie ihn ein Data-Warehouse bieten kann.

Sehr oft greifen Berichtssysteme direkt auf die operativen Daten aus den Vorsystemen zu, was zur Folge hat, dass die jeweilige Nomenklatur des aktuell angezapften Systems sich auch in den bereit gestellten Berichten wieder findet. Die Konsequenz davon ist, dass in den bereitgestellten Berichten Gleiches unterschiedlich bezeichnet wird und Unterschiedliches gleich bezeichnet wird. Umsatz aus dem Kassensystem versteht sich meist als Umsatz mit Mehrwertsteuer, Umsatz aus dem Buchhaltungssystem versteht sich meist als Umsatz ohne Mehrwertsteuer. Fehlt ein korrigierendes unternehmensweites Data-Warehouse (DWH) erhalten die Berichtsempfänger unterschiedliche Umsatzzahlen aus unterschiedlichen Vorsystemen.

Damit alle Mitarbeiter auf derselben Datengrundlage arbeiten, liefern zentrale Data-Warehouses den Single Point of Truth, den sogenannten SPOT. Der SPOT ist eine einheitliche Basis, die für das gesamte Unternehmen gültig ist, es werden Kennzahlen einheitlich errechnet und unternehmensweit gleich definiert. Auf die Daten kann dann mit verschiedenen Planungs- oder Konsolidierungswerkzeugen wie z.B. LucaNet oder CCH Tagetik zugegriffen werden. Darüber hinaus ist ein Zugriff natürlich auch mit allen gängigen BI-Tools wie mit Microsoft Power BI, der SAP Analytics Cloud oder Cubeware möglich.

Wie ein Data Warehouse strukturiert ist und wie die Interaktion mit Vorsystemen und verschiedenen BI Werkzeugen funktioniert, erfahren Sie in unserem Video "Data Warehouse - Grundlagen". Zudem erfahren Sie, welche Vorteile und Nachteile Data Warehousing mit sich bringt.


Was ist ein Data-Warehouse?

Ein Data-Warehouse (DWH) bildet eine zentrale Sammelstelle für interne und externe Daten, die aus unterschiedlichen Datenquellen generiert werden. Diese Daten werden aus den Vorsystemen extrahiert, falls erforderlich transformiert, dann in das zentrale Data-Warehouse geladen und dort dauerhaft gespeichert. Man spricht in diesem Zusammenhang auch von einem ETL-Prozess (Extract-Transform-Load). Mit Hilfe von Business-Intelligence-Anwendungen werden die Daten für das Management aufbereitet und bilden so die Grundlage für eine aktive Unternehmenssteuerung. Das Data-Warehouse soll helfen Transparenz hinsichtlich Kosten, Erlösen und Geschäftsprozessen zu schaffen. Es soll helfen, neue unbekannte Zusammenhänge aufzudecken, welche ohne zentrales Data-Warehouse unbekannt blieben und so dem Entscheider neue Handlungsoptionen eröffnen. In einem umfassenden Data-Warehouse sollten nicht nur Informationen für die Führungsebene bereitgestellt werden, es geht vielmehr darum die unternehmensweiten Informationsbedürfnisse zu erfüllen, d.h. jedem Mitarbeiter jene Informationen zur Verfügung zu stellen, die er für die effiziente und effektive Bearbeitung seines Verantwortungsbereichs benötigt.

Mithilfe von Data-Warehousing können Mitarbeiter spezifische Auszüge aus dem Datenbestand erstellen, diese Auszüge werden als Data-Marts bezeichnet. Ein Data-Mart ist eine Kopie eines Teilbestandes der Warehouse-Data, dadurch kann die Arbeitsweise vereinfacht und beschleunigt werden. Diese sogenannten Data-Marts lassen sich anwendungsspezifisch optimieren und verhelfen dem Anwender zu einer übersichtlichen Zusammenstellung von Daten. Ein wesentliches Merkmal eines guten Data-Warehouses ist, dass heterogene Daten zu einem konsistenten Datenbestand, der eine globale Sicht auf das Unternehmen ermöglicht, zusammengeführt werden. Darüber hinaus ist es wichtig, dass die Daten für die Entscheidungsträger leicht zugänglich sind und Datenabfragen auch bei großen Datenmengen schnell Ergebnisse liefern. Gleichzeitig ist sicher zu stellen, dass die Daten vor unbefugten Zugriffen geschützt sind und der Verwaltungsaufwand für die Datengewinnung und Datenbereitstellung in Relation zum Businessnutzen gering bleibt.

Wie ist ein Data-Warehouse aufgebaut?

Als erstes werden die Daten aus den Vorsystemen extrahiert und in die unterste Ebene des Datawarehouses geladen. Diese unterste Datenebene ist im wesentlichem ein Abbild der Daten aus den Vorsystemen und wird als STAGING bezeichnet. Bereits mit dieser ersten Operation generiert das zentrale, unternehmensweite DWH einen Businessnutzen, da nicht mehr wie bei einer Lösung ohne Data-Warehouse jede Planungs- Konsolidierungs- oder BI-Applikation auf die operativen Systeme wie zum Beispiel SAP zugreifen muss und diese dadurch auch nicht mehr langsam werden. Mit Werkzeugen wie den SQL-Server-Integration-Services oder dem Cubeware Importer kann die Extraktion und das Laden der Daten automatisiert werden.

Im nächsten Schritt werden die Daten in den OPERATIONAL DATA STORE (ODS) extrahiert, bereinigt und nach Bedarf transformiert. Software Tools wie Tagetik oder das Excel Application Framework können nun direkt auf die im ODS gespeicherten Daten zugreifen. In vielen Fällen macht es Sinn neben dem ODS auch noch ein STAR-SCHEMA aufzubauen. Die Daten des Star-Schemas sind die Grundlage für den Aufbau eines multidimensionalen Datenwürfels. Im Star-SCHEMA werden die Daten so bereitgestellt, dass der Aufbau der Datenwürfel mit seinen Dimensionen optimal unterstützt wird. Im Zentrum befindet sich eine Tabelle mit Kennzahlen, Metriken und Messwerten, die sogenannte Faktentabelle. Um sie herum sind sternförmig Tabellen angeordnet, welche die Faktentabelle näher beschreiben, sie werden als Dimensionstabellen bezeichnet. Die einzelnen Informationen der Dimensionstabellen definieren in ihrer Gesamtheit wiederum die Faktentabelle. Der Aufbau der Datenwürfel kann zum Beispiel mit den SQL Server Analysis Services oder dem Cubeware Importer realisiert werden. Die Analyse der Würfel kann im Anschluss über verschiedene Applikationen, wie beispielsweise Excel oder Cubeware Cockpit ausgelesen werden. Um die Daten auf die Analyse vorzubereiten, werden sie im Zuge des sogenannten Data-Mining aufbereitet und gefiltert. Die Planungsapplikationen können aber auch Daten an das DWH zurückschreiben. Somit ist sichergestellt, dass auch die Plandaten im zentralen Warehouse unternehmensweit verfügbar sind.

Die Daten im DWH können sowohl nach dem PUSH- als auch nach dem PULL-PRINZIP verteilt werden. Beim Pull-Prinzip ist der Datenempfänger, der eine Abfrage durchführt, für die Auswahl der Informationen und deren Transport verantwortlich. Auf Basis von Berechtigung kann geregelt werden, welche Daten aus dem Data-Model abgegriffen werden, die Häufigkeit und der Zeitpunkt der Abfrage wird dem Empfänger überlassen. Beim Push-Prinzip entscheidet der Lieferant, hier das DWH, welche Daten in welcher Form und zu welchem Zeitpunkt angeboten werden. Der Empfänger entscheidet dabei nur, welche Daten er benötigt. Besonders bei größeren DWHs ist diese Art der Verteilung sinnvoll, da dadurch ein willkürlicher Zugriff auf die Daten nicht möglich ist. Im DWH können Tabellen, Spalten aber auch eine Row Level Security mit dem SQL Server umgesetzt werden. Auf Basis von bestimmten User Rollen können eigene SQL User wie auch Domain User spezielle Berechtigungen erhalten. Die Lese- und Schreibzugriffe werden damit bereits auf unterster Ebene geregelt, wodurch ein unberechtigter Zugriff auf die Daten nicht erfolgen kann.

Kostenloses Whitepaper zum Thema Data-Warehouse

Weitere und vertiefendere Informationen zum Thema Data-Warehouse finden Sie in unserem kostenlosen Whitepaper, welches Sie gleich hier anfordern können und innerhalb weniger Sekunden zugesandt bekommen.

Jetzt Data-Warehouse Whitepaper anfordern!

Bitte geben Sie uns Ihre Kontaktdaten bekannt, damit wir Ihnen umgehend den Link zur Freischaltung per E-Mail schicken können. Ihre Daten werden von uns vertraulich behandelt und nicht weitergegeben, siehe Datenschutz.

Hier ist Ihr Data-Warehouse Whitepaper

Data-Warehouse Whitepaper (1,0 MiB)


Wie aufwändig ist die Implementierung eines unternehmensweiten DWHs?

Wie aufwändig die Implementierung eines wie oben umrissenen Data-Warehouses ist, hängt im Wesentlichen vom zu implementierenden Umfang ab. Der Aufbau eines Data-Warehouses kann auch schrittweise erfolgen. Grundsätzlich gibt es zwei Herangehensweisen wie folgt:

  • Umfassendes Data-Warehouse
    Bei einem umfassenden DWH entscheidet man sich dazu, alle irgendwie relevant erscheinenden Daten, welche im Unternehmen vorhanden sind, in das DWH zu laden. Erst im nächsten Schritt wird dann überlegt, wie die Warehouse-Data weiter bearbeitet wird.
  • Bedarfsorientiertes Data-Warehouse
    Die zweite Möglichkeit ist das bedarfsorientierte DWH. Zunächst wird festgelegt, welche Daten für die verschiedenen Applikationen benötigt werden, es wird ein entsprechendes Datenmodell entwickelt und erst danach werden die Daten in ein DWH geladen. Der Aufbau des Data-Warehouses orientiert sich an den Anforderungen der verschiedenen Themengebiete bzw. Applikationen.

Brauchen wir überhaupt ein Data-Warehouse in Zeiten von Self Service BI?

Sie interessieren sich nicht nur für die Datenhaltung in einem Data Warehouse, sondern möchten auch sehen, wie Daten aufbereitet werden müssen, damit Berichtsempfänger aus dem Top-Management optimal unterstützt werden? Dann empfehlen wir Ihnen unsere dreiteilige kostenlose Videoserie zum Thema ONE PAGE Cockpit.


Interesse?
Fragen Sie uns!

Mario Rosenfelder - Controllingexperte