Beschaffungskontrolle – Extrahieren und Vergleichen von Rechnungspositionen mit NLP-Verfahren

Montag, 4.1.2021

Beschaffungskontrolle_header

Die Beschaffung von Produkten und Dienstleistungen spielt eine wichtige Rolle im Unternehmensalltag, jedoch ist die damit verbundene manuelle Rechnungsprüfung sehr zeitaufwendig und fehleranfällig. Darüber hinaus sorgen Maverick Buying-Einkäufe für erhebliche Unsicherheit. Maverick Buying beschreibt den Einkauf von Gütern außerhalb standardisierter Beschaffungswege und somit vorbei an der Einkaufsabteilung. Dieses verursacht Zusatzkosten, beispielsweise durch nicht genutzte Preisvorteile aus Rahmenverträgen und erhöhte Lieferkosten. Können automatisierte Verfahren gefunden werden, um wieder mehr Kontrolle über die Beschaffung von Produkten und Dienstleistungen zu erhalten und somit Bedarfe zu bündeln?

Wir haben einen Ansatz entwickelt, um Rechnungspositionen – die Auflistung von eingekauften Produkten und Dienstleistungen - aus den entsprechenden Dokumenten zu extrahieren. Zudem ist die Lösung in der Lage, Rechnungen von unterschiedlichen Lieferanten hinsichtlich der eingekauften Produkte und Dienstleistungen miteinander zu vergleichen. Hierdurch können schnell und einfach ähnliche Transaktionen aus der Vergangenheit gefunden werden. Auch Maverick Buying Einkäufe können sich als verwandte Rechnungen zu standardisierten Beschaffungsaktivitäten zuordnen lassen: „Achtung – hierzu hätten wir einen günstigeren Rahmenvertrag gehabt.

 

Wozu ist das nützlich?

Zum einen ist der implementierte Ansatz hilfreich, um einen Überblick über die nicht strukturierten Daten zu erhalten. Rechnungen können sich im Aufbau und Aussehen stark unterscheiden und enthalten teils Werbung. Unser Ansatz reduziert die Menge an Daten auf die Rechnungspositionen. Er ist dabei unabhängig vom Rechnungsersteller und kann demnach auf jede Rechnung mit jedem Layout ausgeführt werden – ohne Templates für einzelne Lieferanten.

Zum anderen hilft das Artefakt ähnliche Rechnungen aus vergangenen Transaktionen zu finden. Dies kann Unternehmen erlauben, ihre Bedürfnisse besser zu bündeln, um Skaleneffekte zu erzielen. Zudem sind die Informationen hilfreich, um Produkte und Dienstleistungen bei den Lieferanten zu beschaffen, welche die besten Preise und Konditionen anbieten.

 

Wie funktioniert das?

Rechnungen liegen meist in digitaler oder gescannter Form vor und können daher mithilfe von unterschiedlichen Verfahren in ein maschinenlesbares Format transformiert werden. In diesem Fall wird ein Named Entity Recognition (NER) Prozess verwendet, welcher die Rechnungen einliest. Diese Daten können schließlich verwendet werden, um bestimmte Informationen aus den Dokumenten zu extrahieren. Beispielsweise ist es möglich, mithilfe von Machine Learning das Rechnungsdatum, die Rechnungsnummer und die Bruttosumme in den Dokumenten zu identifizieren. Die Erkennung der Rechnungspositionen ist besonders anspruchsvoll.

Wir verwenden ein Klassifizierungsmodell, um Rechnungszeilen zu kategorisieren. So ist es möglich zu erkennen, ob es sich bei einer Rechnungszeile um eine Rechnungsposition, einen Tabellenkopf für Rechnungspositionen oder um eine sonstige Zeile handelt. Mehrere Ansätze wirken zusammen, um die gefundenen Rechnungspositionen zu teilen. Meist werden Rechnungspositionen in Tabellenform dargestellt und enthalten Informationen zu

  • der Positionsnummer,
  • Beschreibung der Produkte und Dienstleistungen,
  • Anzahl der eingekauften Produkte und Dienstleistungen,
  • Einzelpreise und Gesamtpreise.

Diese Unterteilung wird daher ebenfalls in dem vorgeschlagenen Ansatz verwendet.

Nachdem die Rechnungspositionen extrahiert wurden, können Rechnungen (und Einzelpositionen) verschiedener Lieferanten hinsichtlich der eingekauften Produkte und Dienstleistungen miteinander verglichen werden. Mithilfe eines Language Modells und einer Dimensionsreduktion werden die Beschreibungen der Rechnungen analysiert. Somit können automatisiert ähnliche Einkäufe aus der Vergangenheit aufgedeckt werden: Sie liegen dann in der Visualisierung nahe beieinander.

Das Schöne daran: Der Ansatz wurde mit einer Kombination aus Fachwissen und Machine-Learning entwickelt, sodass er auf Rechnungen mit unterschiedlichen Layout-Varianten angewendet werden kann. Bisher arbeiten viele Input-Management- und Dokumenten-Management-Systeme noch auf Basis von Vorlagen, in denen Sachbearbeiter:innen pro Lieferant die gewünschten Informationen vorab markieren (und bei Layout-Änderungen anpassen) müssen.

Auch bereits entwickelte KI-Verfahren stoßen immer noch an ihre Grenzen, Tabellenstrukturen, wie die Rechnungspositionen, in Dokumenten zu finden. Der vorgeschlagene Ansatz liefert zuverlässig schnell zugängliche Rechnungspositionen sowie mögliche verwandte Rechnungen, welche im Anschluss genauer untersucht werden können.

 

Wie sieht das Ergebnis aus?

Die extrahierten Rechnungspositionen werden in Tabellenform wiedergegeben, so wie sie auch meist in den jeweiligen Dokumenten angezeigt werden. Es werden dabei Informationen zu Positionsnummern, Beschreibungen, Anzahl, Einzelpreis und Gesamtpreis dargestellt. Dies gewährleistet einen guten Überblick über die eingekauften Produkte und Dienstleistungen in einem gewünschten Zeitraum und kann als Basis für die Planung von zukünftigen Bedarfen dienen.

Der nachfolgende Graph hebt sachlich ähnliche Rechnungen hervor. Dieses Ergebnis wird durch den Vergleich der Rechnungen erzielt und ist unter anderem hilfreich, um Maverick Buying Einkäufe in Unternehmen zu finden: Hierzu muss lediglich nach standardisierten Einkäufen und deren nächsten Nachbarn gesucht werden. Zudem kann dieses Ergebnis für eine intelligente Lieferantenauswahl verwendet werden.
Lieferantenauswahl

Preise und Konditionen von Lieferanten, welche ähnliche Produkte und Dienstleistungen anbieten, können schneller miteinander verglichen werden.

 

Wie kann es eingesetzt werden?

Bereits in der Vergangenheit hat die viadee Ansätze entwickelt, um Rechnungsdaten automatisiert in einem SAP-System zu speichern und Anomalien in Rechnungen zu finden.

Findet die Invoice Intelligence aber auf dem Detailniveau einzelner Rechnungspositionen statt, kann sie mehr als ein Automatisierungswerkzeug werden. Sie kann die Initiative übernehmen: „Liebes Controlling, Artikel X kaufen wir bei 5 Lieferanten zu unterschiedlichen Preisen, bei einem nur in kleinen Mengen – schauen wir mal genauer hin?


Dieser Artikel ist aus der Master-Thesis von Sina Nordlohne (2020) an der Wirtschaftsinformatik der WWU Münster (Prof. Heike Trautmann) entstanden.


zurück zur Blogübersicht

Diese Beiträge könnten Sie ebenfalls interessieren

Keinen Beitrag verpassen – viadee Blog abonnieren

Jetzt Blog abonnieren!

Kommentare

Dr. Frank Köhne

Dr. Frank Köhne

Dr. Frank Köhne ist Beratender Manager bei viadee IT-Unternehmensberatung, Co-Leiter des F&E-Bereiches Data Science und zuständig für Hochschulkooperationen im Raum Münster. Er engagiert sich im Programm-Komitee für den NAVIGATE-Kongress.

Frank Köhne bei Xing  Frank Köhne auf Twitter  Frank Köhne auf LinkedIn