Unsere Lösungen,
ob Start-Up oder etabliertes Unternehmen

Business Process Management

Java

Testautomatisierung

Agile Methoden

Mobile- und Weblösungen

Business-Intelligence

vivir

IT-Sicherheit

Künstliche Intelligenz

viadee Themen

In unserem Blog finden Sie Fachartikel, Success-Stories, News, Messeberichte und vieles mehr... vor allem aber hoffentlich wertvolle Informationen, die Ihnen in Ihrem konkreten Projekt und in Ihrem Business weiterhelfen. Bei Fragen und Anregungen nehmen Sie gerne Kontakt zu uns auf. Bitte benutzen Sie dazu die Kommentarfunktion unter den Blogbeiträgen.

DSGVO und Data Warehouse – unvereinbar?

06.12.18 08:29

Ein Data Warehouse (DWH) hat den Anspruch, die Historie aller Unternehmensdaten vollständig abzubilden. Da sich nie voraussehen lässt, welche Daten in Zukunft für Auswertungen interessant werden könnten, speichert das Kern-DWH in der Regel die Daten auf der detailliertest-möglichen Ebene. Löschungen von Daten, also eine Verfälschung der Historie, sind in den einschlägigen Methoden zur DWH-Modellierung nicht vorgesehen. Wie passt dies zum „Recht auf Vergessenwerden“, wie es insbesondere die neue EU-Datenschutzgrundverordnung (DSGVO) fordert?

Data Warehouse und Datenschutz gemäß DSGVO - geht das zusammen? Symbolbild.
Über diese Frage habe ich mir Gedanken gemacht und diese in einem Artikel in der Zeitschrift BI-Spektrum“ (Ausgabe 05/2018) veröffentlicht. Mein – noch nicht durch juristische Expertise gestütztes – Fazit lautet, dass den bisherigen öffentlichen Diskussionen zufolge eine vollständige Anonymisierung aller personenbezogenen Daten im Data Warehouse dem Recht auf Vergessenwerden genüge tun würde. Es muss also nichts gelöscht werden! Dennoch sind auch bei der Anonymisierung einige Fallstricke zu beachten.

Im Artikel wird die Anonymisierung auf methodischer Ebene betrachtet, d. h. es werden Lösungsansätze für die beiden verbreitetsten DWH-Modellierungsmethoden vorgestellt: Sternschema und Data Vault. Trotz der Anonymisierung bleiben bei diesen Ansätzen viele wichtige Auswertungsmöglichkeiten erhalten. Zugleich wird im Artikel deutlich, dass angesichts des Risikos der indirekten Identifizierung in jedem Fall gut durchdacht werden sollte, welche Felder im DWH auf welche Weise anonymisiert werden müssen.

Sonderdruck BI Spektrum 05/2018 hier herunterladen


Sie interessieren sich näher für die DSGVO-Konformität Ihres Data Warehouse? Hier können Sie den Artikel als PDF herunterladen. Ich freue mich über Diskussionsbeiträge!


Jetzt Blog abonnieren!
zum Blog
Timm Euler

Timm Euler

Dr. Timm Euler ist Senior-Berater bei der viadee IT-Unternehmensberatung und Leiter des F&E-Bereichs Business Intelligence. Er interessiert sich für alles rund um Big Data, Data Warehousing und Data Mining.

Timm Euler bei Xing