Innerhalb einer Workflow-Engine fallen bei laufenden Prozessen viele Protokoll-Daten an: Wann wurde ein Task gestartet? Wie war der Wert einer Prozess-Variablen zu einem bestimmten Zeitpunkt? Wer hat den User-Task bearbeitet?
Der Camunda Kafka Polling Client
Die Protokoll-Daten werden im Fall von Camunda in Tabellen innerhalb der Datenbank geschrieben. Je nach Konfiguration der Workflow Engine können das vergleichsweise viele Datensätze werden. Wenn der Platz in der Datenbank zu kostbar für diese historischen Daten wird, die Daten aber weiterhin verfügbar sein sollen, ist ein Export eine gute Option.
Mit dem Camunda Kafka Polling Client steht ein OpenSource Werkzeug zur Verfügung, welches genau diesen Export durchführen kann. Dabei kann der Export direkt via JDBC aus der Datenbank oder via REST über die Camunda REST API erfolgen. Als Ziel dient dabei Apache Kafka. Von dort können die Daten abgerufen und weiterverarbeitet werden.
Version 1.2
Mit der neuen Version 1.2 des Polling Clients ist es nun auch möglich, neben den bisherigen Ereignis-Typen die Identity-Link-Ereignisse von Tasks zu exportieren: Wem wurde ein User-Task wann zugeordnet? Wann wurde eine Zuordnung wieder entfernt? Wer war wann Owner eines Tasks?
Damit stehen in der aktuellen Version die folgenden Ereignisse zum Export zur Verfügung:
- Prozess Definitionen
- Prozess Start & Ende
- Aktivität Start & Ende
- Prozess-Variablen (Endwerte sowie Zwischenwerte)
- Task Kommentare
- Identity-Links zu Tasks
- Candidate, Assignee, Owner
- Hinzufügen & Entfernen
Die neue Version steht im Maven Central oder direkt als Docker-Image zur Verfügung.
Den Datenschatz nutzbar machen
Neben einem Export zum reinen Entlasten der Datenbank stellen diese Daten eine wertvolle Quelle für Auswertungen und Analysen dar.
viadee Process Warehouse
Mit dem viadee Process Warehouse steht eine Lösung bereit, welche diese Daten aus Kafka abruft und in Elasticsearch ablegt. Auf dieser Datenbasis können die Prozesse dann visuell dargestellt und Kennzahlen im Prozess visualisiert werden. Dabei kann es sich um einfache Durchlaufzeiten handeln, aber auch die Visualisierung von Kennzahlen auf Basis von Prozessvariablen ist möglich.
BPMN.ai
Neben einer visuellen Darstellung kann dieser Datenschatz mit BPMN.ai zum Trainieren von Machine Learning-Modellen eingesetzt werden. Dies kann dabei helfen, neue Erkenntnisse und Zusammenhänge in den eigenen Prozessen zu entdecken, oder bei einer Dunkelverarbeitung zu Transparenz und mehr Qualität beitragen.
Bei einer Integration ist es möglich, einzelne Entscheidungen im Prozess an das Modell auszulagern. Durch die automatische Entscheidung einfacher Szenarien bleibt dann mehr Zeit für eine manuelle Bearbeitung der komplexen Entscheidungen.
zurück zur Blogübersicht