18.05.2026

Effizienzsteigerung im Data Warehousing: Entwicklung eines Proof of Concept zur Data Vault Automatisierung

Im Rahmen eines BI-Praxisprojekts im Sommersemester 2026 hat eine Studierendenprojektgruppe des Schwerpunktes BI im Bachelorstudiengang Wirtschaftsinformatik (BIS) untersucht, wie die Integration diverser Quellsysteme in ein Data Warehouse durch Automatisierung beschleunigt werden kann.

Im Zentrum des „Proof of Concept“ (PoC) stand die Überführung manueller Entwicklungsprozesse in eine skalierbare, automatisierte und regelbasierte Erzeugungs- und Beladelogik von Tabellen.

Die WERTGARANTIE Group betreibt ein leistungsstarkes Data Warehouse nach dem Data Vault 2.0 Standard - einem Modellierungsansatz, der Daten flexibel in Geschäftseinheiten, Beziehungen und beschreibende Details unterteilt. Das Data Warehouse hat mit einer Tabellenanzahl im 4-stelligen Bereich bereits eine gewisse Komplexität erreicht. Aktuell erfordert die Einbindung neuer Quellsysteme einen hohen manuellen Aufwand – von der Entwicklung nach Checklisten bis hin zu aufwändigen technischen Tests. In der Praxis führt dies dazu, dass der Zeitbedarf für die Datenintegration teilweise unterschätzt wurde.

Die Lösung: Automatisierte Erzeugung und Beladung von Tabellen

Anstatt jede Tabelle und jeden Ladeprozess einzeln zu programmieren, setzt das Projektteam auf einen regelbasierten Ansatz. Das Ziel ist es, die Infrastruktur so vorzubereiten, dass sich das System nahezu von selbst aufbaut, sobald man ihm die nötigen Informationen über die Datenquelle gibt. Als Testumfeld dient die Datenbank eines fiktiven Unternehmens namens „Willibalds Samenhandel“. Was spielerisch klingt, hatte eine praxisnahe Idee: Die Testdaten enthalten bewusst eingebaute Fehler und Logiklücken, um die Belastbarkeit der Automatisierung unter realitätsnahen Bedingungen zu prüfen.

Technisch nutzt das Projektteam zur Speicherung der Daten eine moderne Cloud-Umgebung namens ,,Azure” von Microsoft. Die automatisierte Datenintegration und -Verarbeitung geschieht mit einem auf Python basierenden Tool namens dbt (data build tool). 

Die aktuelle Aufgabe ist es, das Zielmodell - also die Zusammenhänge von unterschiedlichen Tabellen - Schritt für Schritt zu vervollständigen und zu prüfen: Hält die Automatisierung auch stand, wenn die Daten unsauber oder besonders komplex sind? In den kommenden Wochen liegt der Fokus darauf, alle Daten des Willibald-Datensatzes in das Data Warehouse unter Wahrung eines hohen Automatisierungsgrads zu integrieren und die spezifischen Anforderungen und Problemstellungen der WERTGARANTIE Group hierbei zu berücksichtigen.

Entwicklung eines Proof of Concept zur Data Vault Automatisierung

Projektrelevanz und Ausblick

Durch den Einsatz regelbasierter Algorithmen und den Verzicht auf KI-Tools, konnte sichergestellt werden, dass die Ergebnisse jederzeit logisch nachvollziehbar und exakt reproduzierbar sind. Dieser Ansatz ist für die WGG bedeutsam: Das Unternehmen plant, den Automatisierungsgrad bei der Integration von Quellsystemen zukünftig weiter zu erhöhen.

Der bisherige Projektfortschritt zeigt, dass Automatisierung ein wichtiger Schlüssel ist, um die Entwicklungsgeschwindigkeit massiv zu erhöhen und die langfristige Skalierbarkeit der Datenlandschaft sicherzustellen. Das Projektteam liefert mit dem PoC eine fundierte Entscheidungsgrundlage für den künftigen Einsatz von Automatisierungstools im Entwicklungsprozess des BI Teams der WERTGARANTIE Group.