MLOps: Hightech made in Lingen

Dienstag, 8.10.2024

modernste Technologien in industriellen Anlagen

Die Schweizer ROSEN Gruppe nutzt modernste Technologien, um kleinste Risse und Korrosionsschäden in Öl- und Gasleitungen sowie diversen anderen industriellen Anlagen und Strukturen zu erkennen. Gemäß dem Leitmotiv "Spitzentechnologien zum Schutz von Mensch und Umwelt" können Kunden des Pipeline-Inspektions-Weltmarktführers somit seit 1981 ihre Infrastrukturen prädiktiv untersuchen lassen.

Die Grundlage des Geschäftsmodells bildet das Sammeln und Auswerten von Daten mittels autonomer Inspektions- und Messtechnik, die das Unternehmen selbst an seinen weltweiten Standorten entwickelt, herstellt und auch selbst einsetzt.

So konnte das Unternehmen in mehr als 40 Jahren über zwei Millionen Pipeline-Kilometer weltweit hochauflösend abtasten und inspizieren. Die ROSEN Gruppe geht aber noch einen Schritt weiter und verkauft die Rohdaten nicht einfach an die Auftraggeber wie Infrastrukturbetreiber. Die Daten werden von den Datenspezialisten in Lingen auch ausgewertet, analysiert und interpretiert. Mit dieser Strategie stellt der Markt- und Technologieführer in diesem Sektor die datengetriebene Entscheidungsunterstützung und -findung in den Mittelpunkt.

Herausforderung: Die Magie in den Daten sinnvoll nutzen

Bereits früh erkannte die ROSEN Gruppe die Tragweite von künstlicher Intelligenz (KI) und maschinellem Lernen (ML) im Umgang mit den enormen Datenmengen. Moderne Methoden erkennen zum Beispiel automatisiert Muster, Abweichungen und Anomalien, wodurch diese den menschlichen Entscheidungsprozess optimieren können.

Um diesen technologischen Wandel effizient zu nutzen, wurden zunächst organisatorische Änderungen eingeführt. Data-Science-, Entwicklungs- und Produktions-Teams wurden zusammengeführt, um Kommunikationsprobleme und Silobildung zu vermeiden. Dazu wurde die IT-Infrastruktur angepasst und erweitert, um den erhöhten Bedarf an Rechenleistung zu decken. Ein Ziel war zum Beispiel, die Auslastung von kostenintensiven Grafikkarten zu erhöhen. Ein weiteres war es, standardisierte ML-Tools mit klaren Standards zu definieren und auszurollen, wodurch die Kollaboration im Team verbessert und die Modellentwicklung beschleunigt werden sollte.

Die ROSEN ML Plattform

Um die Herausforderungen zu bewältigen, entschied sich die ROSEN Gruppe, die ML-Plattform auf der Grundlage von Kubeflow einzuführen. In enger Zusammenarbeit mit dem Bereich Data Science der viadee IT-Unternehmensberatung wurden

  • die Plattform auf der hauseigenen OpenShift-Container-Plattform bereitgestellt,

  • benötigte Ressourcen eingebunden und ein Customizing durchgeführt,

  • MLOps-Schulungen und Wissenstransfer im Projektbetrieb geleistet,

  • sowie ein Lebenszyklus-Modell für ML-Modelle etabliert und durch Kubeflow unterstützt.

Das Ergebnis?

Es ist ein Self-Service-Modell entstanden, das den Data Scientists der ROSEN Gruppe leistungsfähige Ressourcen wie GPUs im Cloud-Native-Modus zur Verfügung stellt und die Verwendung vereinheitlichter Tools und Standards in geprüften Linux-Umgebungen ermöglicht. Dies führte zu einer höheren Automatisierung und effizienteren Prozessen in den frühen Phasen der Algorithmenentwicklung. Die Vorteile von Kubeflow erstrecken sich über das experimentelle Arbeiten hinaus: Es ermöglicht und fördert die Bereitstellung von ausgereiften ML-Workflows und die Einführung von CI/CD-Prozessen für KI. So kann ein neues ML-Modell vollautomatisiert in die Produktion entlassen werden, sobald neue Daten für das Machine Learning verwendet worden sind. Kubeflow trägt damit zur organisatorischen und technischen Skalierung von Machine Learning bei.

Kubeflow wurde darüber hinaus nahtlos in die bestehende Entwicklungslandschaft der ROSEN Gruppe integriert, wodurch Anbindungen an Git, Azure DevOps und Artifactory möglich wurden. Besonders nützlich für die Teams war die Verfügbarkeit einer beträchtlichen Anzahl von A100-GPUs, die die Trainingsprozesse erheblich beschleunigten. Die positiven Erfahrungen der Data Scientists mit der Plattform lassen sich auf mehrere Faktoren zurückführen, darunter spezifische Unterstützung durch das Plattform-Team, ausführliche Dokumentationen und gemeinsame Standards. Auf dieser Basis konnte die Plattform zügig einen Sog-Effekt entwickeln und schnell aus der Pilotphase herauswachsen. 

Neben den vielen Erfolgen gab es unterwegs auch Herausforderungen zu bewältigen. Das schnelle, internationale Wachstum der Plattform, sowie der Mangel an Fachkräften mit Kenntnissen in Kubernetes und Machine Learning waren anfängliche Hürden. Vor der Beendigung der Pilotphase musste die Infrastruktur an die Anforderungen der ROSEN Gruppe angepasst werden. So erforderte die Anforderung an die Resilienz der Infrastruktur, die Instandhaltung der Plattform und die Umsetzung von Sicherheitsmaßnahmen eine erhöhte Aufmerksamkeit. Hilfreich war dabei das deutliche Commitment zur Open-Source-Strategie des Kubeflow-Projektes. Zudem gestaltete sich die Integration unterschiedlicher Datenquellen komplex. Hier liegt eine wichtige und deutliche Systemgrenze: Kubeflow setzt alle Aspekte der Datenhaltung und des Daten-Managements voraus und erwartet sie in externen Systemen. Es hat keinen „Alleinherrschaftsanspruch“ über andere Elemente der Daten-Wertschöpfung, wie er bei anderen, stark integrierten (Cloud-) Plattformen (besonders für tabellarische Daten) deutlich erkennbar ist. Für ROSEN war diese Systemgrenze aber genau richtig gezogen und der Fokus konnte auf dem MLOps-Aspekt liegen.

Fazit und Ausblick

Wir beglückwünschen die Kolleg:innen der ROSEN Gruppe zu ihrem beeindruckenden Erfolg bei der Einführung einer wegweisenden unternehmensweiten ML-Plattform. Diese innovative Initiative hat nicht nur zu einer Optimierung der Data-Science-Projekte geführt, sondern auch die Gesamteffizienz erheblich gesteigert und die Nutzung von Daten auf ein neues Level gehoben.

In Zukunft soll, in Zusammenarbeit mit dem BPM-Team der viadee IT-Unternehmensberatung, die Integration mit den überspannenden Geschäftsprozessen gestärkt werden: Denn aus den Daten zu lernen, Entscheidungsmodelle anzuwenden, ist für die ROSEN keine Digitalisierung am Rande, sondern das Kerngeschäft. Es ist jetzt schon erkennbar, dass auch dieses Vorhaben von der flexiblen Micro-Service-Architektur der Kubeflow-Plattform profitieren wird.

Mit der Implementierung von Kubeflow legt die ROSEN Gruppe eine solide Basis für künftige Data-Science-Initiativen. Dadurch eröffnen sich dem Unternehmen spannende Möglichkeiten, um im Bereich Forschung, Entwicklung und Implementierung von KI-Algorithmen weiterhin branchenführend zu agieren.

 


Haben wir Ihr Interesse geweckt? Melden Sie sich gerne bei uns.

Jetzt kontaktieren


zurück zur Blogübersicht

Diese Beiträge könnten Sie ebenfalls interessieren

Keinen Beitrag verpassen – viadee Blog abonnieren

Jetzt Blog abonnieren!

Kommentare

Tobias Goerke

Tobias Goerke

Tobias Goerke ist Berater bei der viadee IT-Unternehmensberatung. Als Data Scientist liegen seine Schwerpunkte in der Einführung künstlich intelligenter Systeme und der Erforschung verschiedener Verfahren des erklärbaren Maschinenlernens.   Tobias Goerke bei LinkedIn