viadee

DWH-Modellierung für spaltenorientierte Datenbanken

Münster/Köln (ots) - Spaltenorientierte Datenbanken gewinnen im Bereich der Data Warehouse Systeme zunehmend an Bedeutung. Neben der Art der Datenorganisation setzen die Hersteller auf unterschiedliche Implementierungskonzepte, um die Effizienz in teils beeindruckender Weise zu steigern. In Bezug auf die Datenmodelle stellt sich die Frage, ob die typischen Data Warehouse-Schemata, wie z.B. Star- und Snowflake-Modell, noch erforderlich sind. Die Transformation operativer Datenstrukturen in eines der klassischen Modelle beansprucht einen Großteil der Ressourcen eines DWH-Projekts. Dieser setzt sich zusammen aus der technischen und fachlichen Transformation. Letztere verursacht oft den bedeutend höheren Aufwand. Daher ergibt sich die Frage, ob die Performanzsteigerung der spaltenorientierten Technologien ausreicht, um einen Teil dieser Transformation überflüssig zu machen. Die viadee Unternehmensberatung GmbH ging dieser Frage im Rahmen von Forschungsarbeiten im unternehmenseigenen OSBI-Labor nach.

Dazu wurden verschiedene Modelle für einen Benchmark gegenübergestellt. Der Aufbau orientiert sich am TPC-H-Benchmark. Neben einem Star- und Snowflake-Modell wurden ein normalisiertes, operatives Datenschema sowie ein vollständig denormalisiertes Schema entwickelt. Als fachliches Beispielszenario diente eine Leihbibliothek. Die ETL-Prozesse für alle Modell- und Datenbankvarianten wurden auf Basis der Pentaho-Suite erstellt.

Der Benchmark betrachtet den Ressourcenverbrauch beim Laden der Daten sowie bei der Ausführungszeit von sehr verschiedenen analytischen Ad-Hoc-Abfragen. Eingesetzt wurden die spaltenorientierten Open Source Datenbanksysteme Infobright und MonetDB. MonetDB ist ein Vorgänger der neuen VectorWise-Plattform, die gemeinsam mit der open source Datenbank Ingres entwickelt wird. Der Ansatz ist sehr vielversprechend. Leider war der Benchmark auf der VectorWise-Plattform (noch) nicht ausführbar. Zur Illustration wurde ein aktuelles MySQL-System in die nachfolgende Übersicht der Ausführungszeiten aufgenommen. Dargestellt werden elf typische analytische Abfragen (A1 bis A11).

Die Messwerte des Vergleichs lassen nur kleine Unterschiede zwischen dem normalisierten Modell und den typischen Data Warehouse-Schemata erkennen. Dies ist überraschend, weil sich deren Struktur und die Queries dazu stark unterscheiden. Das denormalisierte Datenmodell grenzt sich von diesen beiden insbesondere durch den hohen Speicherbedarf ab.

Analyse

Auch wenn die Zahlen stark von Dateninhalten und Anfragetypen abhängig sind, lässt sich erkennen, dass die Technologien unterschiedliche Stärken und Schwächen haben. Infobright fällt insgesamt durch die vergleichsweise geringe Streuung der Anfragezeiten auf. Beide spaltenorientierten Datenbanken verlieren prinzipbedingt Zeit, wenn die Anfragen Datumskonvertierungen notwendig machen (Bspw. A11). Allerdings ist mit einem Fokus auf einer schnellen Realisierung, der Minimierung von Komplexität im ETL-Lauf oder der Minimierung des Aufwands im Transformationsprozess das um Historisierung erweiterte, operative Datenmodell gegenüber den anderen Schemata klar zu bevorzugen. Neue best-practices für die Modellierung müssen sich noch herausbilden.

Fazit

Spaltenorientierte Datenbanken sind eine echte Innovation. Diese disruptive Technologie hat das Potenzial, die Spielregeln im Markt zu ändern. Der geringe Erstellungs- und Wartungsaufwand ermöglichen den Einsatz von Business Intelligence-Verfahren auch für kleine Unternehmen, einzelne Projekte oder Abteilungen.

Autoren

Dr. Frank Köhne studierte Wirtschaftsinformatik an der Universität Münster. Dort, an der RTWH-Aachen und der Universität Hohenheim war er an diversen Forschungsprojekten beteiligt. Seit etwa zwei Jahren verantwortet er die Bereiche Neue Technologien und Open Source Business Intelligence der viadee Unternehmensberatung GmbH.

Andreas Hellmann ist Werksstudent der viadee. In seiner praxisorientierten Abschlussarbeit hat er Modelvarianten im Kontext spaltenorientierter Datenbanken untersucht. Nach Abschluss seiner Bachelorarbeit absolviert er momentan sein Masterstudium. Für Rückfragen steht Dr. Frank Köhne zur Verfügung.

Über viadee

viadee steht seit 1994 für Unabhängigkeit, fachliches Know-how und Innovationsfreude. Mit mehr als 100 Mitarbeitern an den Standorten in Köln und Münster berät viadee namhafte Unternehmen aus unterschiedlichen Branchen in allen Phasen der Softwareentwicklung. Die Dienstleistungen reichen von der Entwicklung komplexer Anwendungssysteme über den Aufbau der IT-Architekturen bis zur Optimierung der Geschäftsprozesse, gesteuert durch exzellentes Qualitäts- und Projektmanagement, die Garanten für den Erfolg der viadee-Projekte.

Weitere Informationen: www.viadee.de

Druckfähiges Bildmaterial sowie eine Grafik zu dieser Pressemitteilung unter www.viadee.de/download/presse.html

Pressekontakt:

Christian Schulze Dieckhoff
Marketing & Vertrieb
viadee Unternehmensberatung GmbH
Anton-Bruchausen-Str. 8
48147 Münster
Telefon: +49 251 7 77 77 128
Telefax: +49 251 7 77 77 99 128
christian.schulze-dieckhoff@viadee.de

Original-Content von: viadee, übermittelt durch news aktuell

Weitere Meldungen: viadee

Das könnte Sie auch interessieren: