Ein Beispiel: Eine Supermarktkette beschließt, eine Werbeaktion für 500g Hähnchenbrust durchzuführen. Diese Aktion hat erhebliche Auswirkungen auf die Verkaufszahlen bestimmter anderer Produkte. In unserem Beispiel sank der Absatz von Rinderschnitzel und verschiedenen Putenprodukten im Zeitraum der Aktion um mehr als 20%. Viele dieser Zusammenhänge werden aktuell nicht im Vorfeld erkannt. Wenn die Auswirkung einer Aktion auf andere Produkte frühzeitig erkennbar wäre, könnte die Bedarfsplanung so angepasst werden, dass während dem Aktionszeitraum mehr von den Produkten mit höherer Nachfrage und weniger von den Produkten mit geringerer Nachfrage bestellt werden.
Ziel von dieser Anwendung ist es also die Nachfrage nach Produkten unter Berücksichtigung von Werbeaktionen zu prognostizieren. Als Ergebnis können die Bestände von Produkten angepasst und der Ausschuss (und damit Kosten) reduziert werden. Die ML-Anwendung läuft vollautomatisiert und ist in der Lage,
(i) ML-Modelle mit Daten zu trainieren,
(ii) wertvolle Erkenntnisse zu liefern und
(iii) ML-Modelle zu monitoren und kontinuierlich die Modellperformance zu überwachen.
Die Input-Daten für diesen Anwendungsfall sind Verkaufstransaktionen einer Produktkategorie, z.B. Fleischprodukte, mehrerer Jahre eines Einzelhändlers, mit Supermärkten in verschiedenen Regionen. Die Daten enthalten auch Informationen darüber, ob das Produkt in einem bestimmten Zeitraum promotet wurde. Die Ergebnisse können in der Applikation von zwei verschiedenen Nutzerrollen verwendet werden: (i) dem Bedarfsplaner (operative Ergebnisse) und (ii) dem Business-Analysten (ML-Analysen). Die operativen Ergebnisse liefern Erkenntnisse über signifikante Auswirkungen von Aktionsprodukten auf den Absatz anderer Produkte. Mit diesen Erkenntnissen können die Bestände in den Supermärkten entsprechend angepasst werden und z. B. schnell verderbliche Lebensmittel, für die ein Absatzrückgang zu erwarten ist, in geringeren Mengen bestellt werden. Das Ergebnis der ML-Analyse umfasst ML-Modelle, Performanceparameter und Evaluierungsergebnisse im Zeitverlauf. Diese Erkenntnisse bieten die Möglichkeit, die Performance von ML-Modellen anhand täglich eingehender Verkaufstransaktionsdaten zu bewerten und Modelle neu zu trainieren, wenn die Performance abnimmt.
Die Methodik umfasst die Erstellung von ML-Modellen, um Erkenntnisse über die Kannibalisierungseffekte zu erhalten und die Entwicklung von Workflows, um den Lebenszyklus, das Monitoring und die Evaluierung von ML-Modellen zu ermöglichen. Essenziell für die Entwicklung ist dabei die A1 Digital ML Plattform powered by BigML. Die Plattform übernimmt die komplexen Tasks um die besten Parameter für ML-Modelle zu finden und kümmert sich um die Ausführung komplizierter Workflows. Dadurch ist es möglich, die Workflows und deren Ausführung vollständig zu automatisieren.
Zu den ML-Modellen, die bei dieser Anwendung zum Einsatz kommen, gehören Regressionen, Assoziationserkennung und Anomalie Detektoren. Regressionsmodelle werden zur Vorhersage der erwarteten Verkäufe für Produkte verwendet, um zu analysieren und abzuschätzen, ob die tatsächlichen Verkäufe von Produkten, die nicht beworben werden, aufgrund von Werbeaktionen gesunken oder gestiegen sind.
Die Assoziationserkennung findet 'signifikante' Assoziationen, oder sogenannte Assoziationsregeln, zwischen Aktions- und Nicht-Aktionsartikeln. Unser Hauptziel ist es, die negativen Auswirkungen von Werbeaktionen zu identifizieren, d. h., wenn ein Rückgang der Verkaufszahlen um mehr als 20 % zu erwarten ist. Abbildung 1 zeigt zum Beispiel die gewonnenen Assoziationen für jene Produktpaare für die ein erheblicher Umsatzrückgang zu erwarten ist. Das Aktionsprodukt mit id = 89 hat einen massiven Einfluss auf das Produkt mit der Kennung id=141. Ebenso wirkt sich die Aktion auf das Produkt mit id=145 signifikant negativ auf den Absatz der Produkte mit id=44 und id=62 aus und so weiter.
Die Ergebnisse der Assoziationserkennung werden in prozentuelle Umsatzrückgänge umgerechnet, d.h. sie zeigen, wie der Umsatz für bestimmte Produkte im Aktionszeitraum zurückgehen wird. Diese Ergebnisse können verwendet werden, um im Voraus geplante Aktionen zu analysieren und Bestellungen betroffener Produkte im Voraus anzupassen. Dies ist umso wichtiger, wenn die Produkte schnell verderben, z. B. Lebensmittel und Getränke. Es ist zum Beispiel zu erwarten, dass das Aktionsprodukt PRODUKT-45 den Verkauf der Produkte PRODUKT-98, PRODUKT-53, PRODUKT-144 usw. negativ beeinflusst. Es ist also ratsam während des Aktionszeitraums von PRODUKT-45 weniger von diesen Produkten zu bestellen, um Kosten zu sparen und Abfall zu reduzieren.
Neben der Erkennung von Assoziationen ist es auch wichtig zu analysieren wie gut diese Assoziationsregeln täglich funktionieren und ständig aus den neuen eingehenden Transaktionsdaten zu lernen. Dazu werden Anomalie Detektoren verwendet, die ein leistungsfähiges Werkzeug sind, um die Zuverlässigkeit von Assoziationsregeln zu messen. Jedes Mal wenn Assoziationsregeln erstellt werden, wir auch ein Anomalie Detektorgeneriert.
Nachdem berechnet wurde wie groß der Anteil anormaler Datenpunkte in den tagesaktuellen Transaktionsdaten ist, kann eingeschätzt werden, wie sehr sich die neuen Daten zu jenem aus dem Trainingsdatensatz unterscheiden, welcher für die Erstellung der Assoziationsregeln verwendet wurden, wie in Abbildung 2 zu sehen ist. Dies liefert für ML-Analysten notwendige Informationen darüber, wann die Assoziationsregeln aktualisiert werden müssen. Ein hoher Anomalie-Score über einen bestimmten Zeitraum hinweg bedeutet, dass die Assoziationsregeln nicht mehr zu den neuen Verkaufstransaktionen passen, weil sich das Kundenverhalten in der Zwischenzeit geändert hat. Wenn die Assoziationsregeln aktualisiert werden, ist eine Testphase erforderlich, in der die neuen Regeln evaluiert werden und überprüft wird, ob sie mit den neuen Verkaufstransaktionsdaten besser funktionieren als die bestehenden Regeln.
Die Berechnung von Anomalie-Scores ist nicht der einzige Ansatz, um zu messen, wie gut die Assoziationserkennung funktioniert. Wenn die Modelle in Verwendung sind, können die täglichen Verkaufstransaktionsdaten mit den vorhergesagten Verkaufszahlen verglichen werden und so die Fehlerrate berechnet werden. Daher zeigen die Fehlerraten zusammen mit den Anomalie-Scores, wann neue Assoziationsregeln unter Verwendung der neuesten verfügbaren Verkaufstransaktionsdaten erstellt werden sollten. Abbildung 4 zeigt z. B. die Übersicht der Performancezweier Modellen zur Assoziationserkennung: "In Use" (dieses Modell ist gerade im Einsatz) und "In Testing" (dieses Modell wird evaluiert und soll gegebenenfalls das Modell „In Use“ ersetzen).
Dieser Anwendungsfall ist ein gutes Beispiel dafür, wie Machine Learning einen Überblick darüber verschaffen kann, welchen Einfluss Werbekampagnen auf die Verkäufe anderer Produkte im Einzelhandel haben. Machine Learning hilft dabei, die negativen Auswirkungen dieser Kampagnen zu erkennen und zu bekämpfen, den Bestand proaktiv und reaktiv anzupassen und die Verschwendung von Produkten zu reduzieren, um die Kosten eines Einzelhändlers zu senken.