KI-Projekte brauchen kein Data Warehouse? DSGVO als Chance

Dienstag, 3.3.2020

AdobeStock_202535104_Header-730

In einem Fachartikel geht Senior IT-Berater Tobias Otte auf die Herausforderungen der Datenschutzgrundverordnung (DSGVO) für KI-Projekte ein und beschreibt als möglichen Lösungsansatz eine Konsolidierung mit dem Data Warehouse (DWH).

In vielen Unternehmen sind KI-Projekte nicht zentral gesteuert, sondern gleichzeitig in unterschiedlichen Fachbereichen entstanden. Agil wird nach Use Cases gesucht, das nötige Datenmaterial aus diversen Quellen gesammelt und das Ergebnis verprobt. Das klassische Data Warehouse (DWH) spielt oft nur eine untergeordnete Rolle in diesen schnelllebigen Experimenten. Die Umsetzung der DSGVO-Anforderungen stellt dezentrale KI-Projekte vor große Probleme und führt mitunter zu einem Einbruch der Vorhersagequalität. Eine Konsolidierung mit dem DWH bietet die Chance, die Herausforderungen zu meistern.

Verteilte KI-Initiativen

Die statistische Analyse von Daten sowie maschinelles Lernen sind schon immer Teile von Business Intelligence (BI), doch mit neuer Software, mehr Rechenleistung und vor allem einem größeren Datenschatz hat das Thema unter dem Begriff der Künstlichen Intelligenz stark an Bedeutung gewonnen. Oft ist nicht die IT der Treiber hinter KI-Projekten, sondern es wird unabhängig in den Fachbereichen nach Anwendungsgebieten gesucht, die nötigen Daten aus diversen Quellen gesammelt und in KI-Modelle überführt. Das klassische DWH spielt oft nur eine untergeordnete Rolle in diesen schnelllebigen Experimenten, da Data Scientists lieber auf Rohdaten zurückgreifen und nicht auf Entwicklungen im DWH warten möchten. Verteilte Initiativen sollten nicht grundsätzlich verurteilt werden, da es gute Argumente dafür gibt. Bei zentralen Herausforderungen wie der Einhaltung der Datenschutzgrundverordnung (DSGVO) bietet es sich jedoch an, auf bewährte Lösungen zu setzen. Die sich häufenden Strafen aufgrund von Verstößen gegen die DSGVO zeigen, dass das Thema nicht auf die leichte Schulter genommen werden sollte.

Beispiel Handelskonzern

Als Beispiel für diesen Fachartikel dient ein fiktiver Handelskonzern, in dem sich verschiedene KI-Initiativen innerhalb der Fachbereiche gebildet haben.

Abb1_Beispiel

Einbruch der Vorhersagequalität durch Löschung

Wichtig für die Einhaltung und die Auswirkungen der DSGVO ist die Frage, wie die Daten in den verteilten KI-Initiativen gespeichert und den Modellen zur Verfügung gestellt werden, sobald diese produktiv genutzt werden. Werden die Daten vom KI-Projekt nicht langfristig vorgehalten, sondern bei Bedarf neu aus den Quellsystemen geladen, kann es zu einem plötzlichen Einbruch der Vorhersagequalität kommen, wenn aufgrund der DSGVO im Quellsystem Daten gelöscht wurden, die dem Modell als wichtige Ankerpunkte im Training dienten.
Abb4_Einbruch der Vorhersagequalität durch Löschung
In meinem Fachartikel gehe ich auf die Herausforderungen der DSGVO für KI-Projekte ein und beschreibe eine Konsolidierung mit dem DWH als möglichem Lösungsansatz.

Neugierig geworden? Wir stellen Ihnen den Fachartikel gerne kostenlos als PDF zur Verfügung.

KI-Projekte und Data Warehouse – kostenloses Whitepaper


zurück zur Blogübersicht

Diese Beiträge könnten Sie ebenfalls interessieren

Keinen Beitrag verpassen – viadee Blog abonnieren

Jetzt Blog abonnieren!

Kommentare

Tobias Otte

Tobias Otte

Tobias Otte ist Beratender Manger bei der viadee IT-Unternehmensberatung und Leiter des Kompetenzbereichs Data Science. Seine Schwerpunkte liegen in den Themenfeldern Daten Architekturen und Analytics in der Finanzindustrie.

Tobias Otte bei Xing Tobias Otte auf LinkedIn