Keyfacts:
- Data Lineage erhöht Transparenz und Nachvollziehbarkeit von Datenflüssen und verbessert die Datenqualität in der Risikofunktion von Banken.
- Historisch gewachsene IT-Landschaften und heterogene Systemumgebungen erschweren Implementierung und Pflege der Data Lineage.
- Der Trend hin zum Data Mesh verstärkt die Verantwortlichkeiten des Fachbereichs und kann zu erheblichen Mehraufwänden führen.
Risikomanager in der Finanzindustrie stehen vor einer Vielzahl von Herausforderungen, die sich direkt auf ihre Fähigkeit auswirken, Risiken zu identifizieren und zu steuern. Ein bedeutender Teil dieser Herausforderungen hat mit Daten zu tun. In Banken, Versicherungen und Kapitalverwaltungsgesellschaften (KVGen) sind die Anforderungen an die Datenqualität und -transparenz besonders hoch.
Diese Unternehmen müssen sicherstellen, dass ihre Daten korrekt, vollständig und nachvollziehbar sind, um fundierte Geschäftsentscheidungen zu treffen und regulatorische Anforderungen zu erfüllen. Deshalb ist eine klare Data Lineage auch für Risikomanager bedeutsam: Ohne sie sind Verantwortliche heute nicht in der Lage, die notwendige Transparenz und Kontrolle über Daten zu gewährleisten, die in Risikorechnungen verwendet werden. Das kann Ineffizienzen und, unter Umständen, erhebliche Auswirkungen auf die Qualität der Risikokennzahlen zur Folge haben.
Was versteht man unter Data Lineage?
Data Lineage beschreibt die Gesamtheit der Prozesse, mit der ansonsten verborgene Datenflüsse sichtbar gemacht werden. Der Blick von oben macht die Datenflüsse transparent: Zusammenhänge können dadurch systematisiert und schneller erkannt werden.
Zu einer Data Lineage gelangen Finanzunternehmen in drei Schritten: Zunächst müssen Informationen zu den Datenflüssen zwischen den in der Risikofunktion genutzten Systemen gewonnen werden. Diese beschreiben Abhängigkeiten zwischen Datenobjekten. Der Zugang zu den Informationen kann technisch unterstützt, also automatisiert, oder basierend auf fachlichen Informationen erfolgen.
Im zweiten Schritt werden die erkannten Abhängigkeiten in Form von Metadaten gespeichert. Im dritten Schritt werden diese Metadaten für die Endabnehmer nutzbar gemacht, wodurch diese die Datenflüsse besser verstehen und in ihrer täglichen Arbeit nutzen können. Das kann zum Beispiel durch eine Visualisierung des Datenflusses im Datenkatalog erfolgen.
Die konkrete technische Umsetzung variiert in der Praxis stark. Sie kann von einer rein fachlichen, manuellen Dokumentation bis hin zur vollautomatisierten Auswertung der Datenflüsse reichen.
Wieso ist Data Lineage für die Risikofunktion in Banken von Bedeutung?
Data Lineage ist in der Risikofunktion kein Selbstzweck. Eine gut aufgesetzte Data Lineage bringt Licht ins Dunkel historisch gewachsener Datenflüsse. Außerdem bietet die Darstellung der Datenflüsse der Risikofunktion ein erstes Indiz für Abhängigkeiten und mögliche Kausalitäten zwischen verschiedenen Teilen des Datenhaushalts. Damit bietet Data Lineage nicht nur der IT-Abteilung, sondern insbesondere auch dem Fachbereich wertvolle Ansatzpunkte für die effiziente Gestaltung von Datenverarbeitungsprozessen.
Data Lineage zahlt hierbei auf mehreren Ebenen auf das Thema Datenqualität ein. Zum einen werden Transparenz und Nachvollziehbarkeit der Datenflüsse erhöht. Andererseits erlaubt eine Data Lineage die Prüfung von Auffälligkeiten in der Datenqualität entlang der Systeme und Prozesse in der Risikofunktion.
Das ermöglicht eine tiefere Auseinandersetzung mit den verwendeten Daten. Die erzielte Transparenz sowie nachgelagerte Korrekturprozesse und Anpassungen ermöglichen so insgesamt eine Steigerung der Risikodatenqualität.
Außerdem fordert auch der Regulator von Banken eine Auseinandersetzung mit den Themen Transparenz und Nachvollziehbarkeit von Risikodaten. Bereits 2013 hat die Einführung von BCBS 239 die Aufmerksamkeit auf diese Themen gelenkt. Die Umsetzung erweist sich allerdings als herausfordernd, so dass das ursprüngliche Rahmenwerk durch den Regulator stetig konkretisiert und erweitert wird.
Vor welchen Herausforderungen steht die Risikofunktion bei Data Lineage?
Die Implementierung einer Data Lineage bringt in der Risikofunktion erfahrungsgemäß erhebliche Aufwände mit sich. Das liegt insbesondere daran, dass die bestehende Systemarchitektur in der Regel nicht mit dem Ziel geplant wurde, eine Data Lineage abbilden zu können.
Historisch gewachsene, heterogene IT-Landschaften mit einer Vielzahl an Systemen unterschiedlicher Anbieter oder hauseigener Lösungen inklusive der entsprechend benötigten Schnittstellen, wie sie im Risikocontrolling regelmäßig anzufinden sind, erschweren das Nachverfolgen von Datenflüssen.
Während in modernen Architekturen Data Lineage bereits in der Konzeption berücksichtigt wird, spiegeln sich solche Ansätze in der Praxis bestehender Systemlandschaften selten wider. Die für deren Umsetzungen erforderliche idealtypische Architekturen liegen oft nicht vor.
Weder sind die Systeme – die regelmäßig in Eigenentwicklung entstanden sind – so konzipiert, dass Data Lineage einfach umsetzbar ist, noch sind die Komponenten wie Rechenkerne und Datenhaushalte für eine übergreifende Data Lineage konzipiert. Regelmäßig sind deshalb Ergänzungen der IT-Landschaft erforderlich, um eine verlässliche Data Lineage in bestehenden Systemen sicherzustellen.