Kubeflow @ Provinzial: Aufbau einer modernen Machine Learning und MLOps-Plattform im Versicherungswesen

Donnerstag, 1.6.2023

0_Neural-Networks_MLops_Kubeflow_Provinzial-Versicherung

KI-Methoden und insbesondere Machine Learning-Ansätze können viele Anwendungsfälle in Unternehmen effizienter gestalten – dieses Potenzial identifizierte die Provinzial Holding AG bereits frühzeitig. Der Wunsch, diese neuartigen Verfahren in den produktiven Einsatz zu bringen und in bestehende Produkte zu integrieren, gestaltete sich jedoch anspruchsvoll in seiner Realisierung. Wie hat also ein Unternehmen, welches in seiner Größenordnung den Top-10 Versicherern Deutschlands angehört, es geschafft, seine KI-Initiativen und Methoden konzernweit zu konsolidieren?

Die Provinzial Holding AG

Die Provinzial Holding AG ist das zweitgrößte öffentliche Versicherungsunternehmen in Deutschland und versichert derzeit mehr als fünf Millionen Kunden. Ein Unternehmen mit einer erfolgreichen Geschichte von mehr als 300 Jahren. Um diesen Erfolg sicherzustellen, setzt die Provinzial Holding auf die ständige Erforschung und Erprobung innovativer Methoden und fortschrittlicher Lösungen. So sollen Prozesse kontinuierlich verbessert und weiterentwickelt werden und Synergien aus den Leistungen und Infrastrukturen der 2020 fusionierten Provinzial Rheinland und Provinzial NordWest gewonnen werden.

Machine Learning seit 2018

Schon 2018 entstanden die ersten Bewegungen innerhalb des Unternehmens, mittels Machine Learning-Ansätzen Prozesse zu optimieren und erste Einsatzmöglichkeiten zu identifizieren. Doch auf dem Weg zum produktiven Einsatz wurden einige Probleme identifiziert: die notwendigen Ressourcen und Prozesse, die zur Entwicklung von KIs benötigt werden, unterscheiden sich maßgeblich von denen in der Softwareentwicklung.
 
So benötigen Data Scientists Rechner mit Grafikkarten für das aufwendige Modelltraining, die im Konzern individuell beantragt und bereitgestellt wurden. Da das Teilen dieser Ressourcen nicht möglich war, blieb die teure Hardware außerhalb des Modelltrainings ungenutzt. Es gab auch keine Möglichkeit, mehrere dieser Rechner im Verbund zusammenzuschalten, um besonders aufwendige Modelltrainings durchzuführen. Die Individualität im Bereich Hardware zog sich weiter durch den gesamten Entwicklungszyklus: Tools und Technologien wurden nicht standardisiert, sondern frei je Team eingesetzt. CI/CD Pipelines waren selten im Einsatz und das Deployment eines fertig trainierten Modells war ein manueller und komplizierter Akt. Data Scientists mussten sich oft um "alte" Projekte kümmern und Modelle auf aktualisierten Daten neu trainieren, anstatt sich neuen Projekten widmen zu können.

Gebäude der Provinzial Holding AG in Münster, Bildquelle: Provinzial Holding AG
Bildquelle: Provinzial Holding AG

Die Zusammenarbeit mit der viadee Unternehmensberatung

Es wurde klar, dass eine Konsolidierung der KI-Initiativen und Methoden im Unternehmen erfolgen musste, damit die neue KI-Technologie sich im Konzern durchsetzen und skalieren konnte. Im Juli 2020 beauftragte die Provinzial Holding AG (damals NordWest) daher die viadee Unternehmensberatung mit der Suche nach einer geeigneten KI-Plattform und Best Practices zu helfen. Ein Data Science Berater integrierte sich daraufhin ins Provinzial-Team. Zusammen wurden Anforderungen gesammelt, mit den Data Scientists kommuniziert und Workshops veranstaltet. Nach kurzer Zeit kristallisierte sich eine Lösung heraus: Kubeflow.

Kubeflow als konzernweite Lösung

Kubeflow ist eine Open-Source-Plattform, die auf Kubernetes basiert und Data Scientists hilft, skalierbare ML-Workflows zu erstellen. Kubeflow bietet ein umfassendes Ökosystem, das Unternehmen dabei unterstützt, MLOps zu implementieren und ML-Projekte über den gesamten Lebens- und Entwicklungszyklus hinweg zu verwalten. Diese Disziplin ähnelt DevOps und konzentriert sich auf die Professionalisierung und Operationalisierung von Machine-Learning-Projekten unter Verwendung von Prinzipien, die bereits aus der Softwareentwicklung bekannt und bewährt sind. Dank der Skalierbarkeit von Kubernetes und standardisierter Prozesse und Tools können Data Scientists ihre Effizienz unter Nutzung der Plattform enorm steigern.
 
Bereits vor der Entscheidung für Kubeflow setzte die Provinzial auf eine Openshift-Containerplattform: diese basiert intern ebenfalls auf Kubernetes, womit der Schritt zur Integration von Kubeflow nicht weit war. Mit dieser Integration konnte eine Machine-Learning-Plattform geschaffen werden, die den Data Scientists die effektive und effiziente Arbeit mit den Ressourcen ermöglicht. Dort bietet sich eine breite Palette an Funktionen, die teils selbst geschaffen bzw. integriert wurde:

  • Labeling-Tools für Datensätze
  • low- und no-code-Ansätze zur Erstellung von Pipelines
  • eine umfangreiche Sammlung von wiederverwendbaren Komponenten
  • vorgefertigte Anbindungen an interne Datenquellen

Die Plattform verfügt auch über eine große Anzahl von GPU-, CPU- und Speicher-Ressourcen, die dem Bedarf entsprechend dazugezogen und den Bedürfnissen der Data Scientists gerecht werden.

Der Nutzen von Kubeflow

Seit ihrer Einführung ist die Zahl der aktiven Plattformnutzer und -Nutzerinnen mittlerweile auf über 40 gewachsen. Die Anzahl von bis zu 3.000 im Monat ausgeführten Machine Learning Pipelines und die hohe Nutzerzufriedenheit belegen den Erfolg der Plattform. Dank der Open-Source-Natur von Kubeflow konnte und kann die Plattform auch bei Bedarf an das Anwendungsumfeld des Provinzial Konzerns angepasst werden. Die Provinzial Versicherung hat also weit mehr als nur die technischen Voraussetzungen für die erfolgreiche Nutzung künstlicher Intelligenz geschaffen. Sie hat zu Prozessstandardisierungen und der Konsolidierung bestehender Projekte geführt. Zudem vereinfacht sie die Anwendung von Best-Practices und fördert so den nachvollziehbaren und verantwortungsvollen Umgang mit KI-Systemen.

Ausblick und Fazit

Aufgrund der Erweiterbarkeit von Kubeflow, sowie der wachsenden Anzahl von Nutzenden prognostizieren wir von der viadee, dass Kubeflow sich zu einem Industriestandard für Machine Learning entwickeln und die Datenwissenschaften der Provinzial weiter vorantreiben wird. Lesen Sie auch unseren strategischen Ausblick auf MLops-Plattformen. Wir bedanken uns bei der Provinzial Versicherung für die erfolgreiche Zusammenarbeit und wünschen den Kolleginnen und Kollegen weiterhin viel Erfolg bei der Durchführung spannender KI-Projekte!



zurück zur Blogübersicht

Diese Beiträge könnten Sie ebenfalls interessieren

Keinen Beitrag verpassen – viadee Blog abonnieren

Jetzt Blog abonnieren!

Kommentare

Tobias Goerke

Tobias Goerke

Tobias Goerke ist Berater bei der viadee IT-Unternehmensberatung. Als Data Scientist liegen seine Schwerpunkte in der Einführung künstlich intelligenter Systeme und der Erforschung verschiedener Verfahren des erklärbaren Maschinenlernens.   Tobias Goerke bei LinkedIn