Unsere Lösungen,
ob Start-Up oder etabliertes Unternehmen

Agile Methoden

Business-Intelligence

Business Process Management

Clean Code

Cloud

IT-Sicherheit

Java

Künstliche Intelligenz

Mobile- und Weblösungen

Robotic Process Automation

Testautomatisierung

vivir

viadee Blog

In unserem Blog finden Sie Fachartikel, Success-Stories, News, Messeberichte und vieles mehr... vor allem aber hoffentlich wertvolle Informationen, die Ihnen in Ihrem konkreten Projekt und in Ihrem Business weiterhelfen. Bei Fragen und Anregungen nehmen Sie gerne Kontakt zu uns auf. Bitte benutzen Sie dazu die Kommentarfunktion unter den Blogbeiträgen.

DSGVO und Data Warehouse – unvereinbar?

Donnerstag, 6.12.2018

Ein Data Warehouse (DWH) hat den Anspruch, die Historie aller Unternehmensdaten vollständig abzubilden. Da sich nie voraussehen lässt, welche Daten in Zukunft für Auswertungen interessant werden könnten, speichert das Kern-DWH in der Regel die Daten auf der detailliertest-möglichen Ebene. Löschungen von Daten, also eine Verfälschung der Historie, sind in den einschlägigen Methoden zur DWH-Modellierung nicht vorgesehen. Wie passt dies zum „Recht auf Vergessenwerden“, wie es insbesondere die neue EU-Datenschutzgrundverordnung (DSGVO) fordert?

Data Warehouse und Datenschutz gemäß DSGVO - geht das zusammen? Symbolbild.
Über diese Frage habe ich mir Gedanken gemacht und diese in einem Artikel in der Zeitschrift BI-Spektrum“ (Ausgabe 05/2018) veröffentlicht. Mein – noch nicht durch juristische Expertise gestütztes – Fazit lautet, dass den bisherigen öffentlichen Diskussionen zufolge eine vollständige Anonymisierung aller personenbezogenen Daten im Data Warehouse dem Recht auf Vergessenwerden genüge tun würde. Es muss also nichts gelöscht werden! Dennoch sind auch bei der Anonymisierung einige Fallstricke zu beachten.

Im Artikel wird die Anonymisierung auf methodischer Ebene betrachtet, d. h. es werden Lösungsansätze für die beiden verbreitetsten DWH-Modellierungsmethoden vorgestellt: Sternschema und Data Vault. Trotz der Anonymisierung bleiben bei diesen Ansätzen viele wichtige Auswertungsmöglichkeiten erhalten. Zugleich wird im Artikel deutlich, dass angesichts des Risikos der indirekten Identifizierung in jedem Fall gut durchdacht werden sollte, welche Felder im DWH auf welche Weise anonymisiert werden müssen.

Sonderdruck BI Spektrum 05/2018 hier herunterladen


Sie interessieren sich näher für die DSGVO-Konformität Ihres Data Warehouse? Hier können Sie den Artikel als PDF herunterladen. Ich freue mich über Diskussionsbeiträge!


Jetzt Blog abonnieren!
zum Blog
Timm Euler

Timm Euler

Dr. Timm Euler ist Senior-Berater bei der viadee IT-Unternehmensberatung und Leiter des F&E-Bereichs Business Intelligence. Er interessiert sich für alles rund um Big Data, Data Warehousing und Data Mining.

Timm Euler bei Xing