Machine Learning: Fachliche Basics und Einsatz bei Marketing Automation, E-Commerce und Produktinformationen

Artificial Intelligence, Machine Learning und Deep Learning sind Begriffe, die aktuell inflationär benutzt werden, wenn es um die Digitalisierung geht. Dieser Artikel soll einen kurzen Überblick zu dieser Thematik geben.

Darüber hinaus wird betrachtet, wie Machine Learning bei Marketing Automation, E-Commerce und Produktinformationsmanagement (PIM) unterstützend eingesetzt werden kann.

Ein paar Begriffe

Schauen wir uns doch zunächst einmal an, was hinter den jeweiligen „Buzzwords“ eigentlich steckt:

Artificial Intelligence (AI)

Hierunter versteht man ein Teilgebiet der Informatik, welches sich mit der Automatisierung intelligenten Verhaltens und dem Maschinenlernen befasst. Dabei unterscheidet man zwischen der angewandten AI, welche uns auch im Rahmen dieses Artikels schwerpunktmäßig beschäftigen wird, und der allgemeinen AI.

Im Rahmen der angewandten AI werden im Regelfall konkrete Probleme und Use Cases mit Hilfe von Machine Learning angegangen.

Parallel hierzu ist die allgemeine AI zu nennen, welche stärker auf Grundlagenforschung fokussiert ist und sich vor allem mit Systemen beschäftigt, welche ganz allgemein „intelligent“ agieren können – also eher vergleichbar mit dem menschlichen Gehirn. Diese Form der AI werden wir hier nicht näher betrachten.

Machine Learning (ML)

Machine Learning ist ein Oberbegriff für die „künstliche“ Generierung von Wissen aus Erfahrung – einem Teilbereich der Artificial Intelligence. Man unterscheidet hierbei grundsätzlich das überwachte und das unüberwachte Lernen.

Überwachtes Lernen

Beim überwachten Lernen wird ein System (beispielsweise basierend auf vorhandenen Daten) trainiert. Dieser Trainingsprozess wird im Regelfall durch einen Menschen überwacht. Sobald das so entstehende Modell hinreichend genau arbeitet, kann es beispielsweise genutzt werden, um Zukunftsprognosen zu erstellen.

Ein Beispiel: Basierend auf bestehenden Online-Trackingdaten kann durch AI prognostiziert werden, ob und zu welchem Preis ein aktueller User eines Webshops einen Artikel kaufen wird. Dies kann dann eine Basis für Dynamic Pricing sein.

Unüberwachtes Lernen

Im Gegensatz zum überwachten Lernen, kommt das unüberwachte Lernen ohne expliziten Trainingsprozess aus. Diese Art des Machine Learnings kommt vor allem dann zum Einsatz, wenn es darum geht, Muster und Strukturen in bestehenden (unstrukturierten) Daten zu erkennen.

Ein Beispiel: Das Erkennen von Strukturen in vorhandenen Produktinformationen, die nicht unbedingt für uns Menschen sichtbar sind. Die Analyse von vorhandenen Daten – scheinbar ohne direkten Zusammenhang – mit Hilfe von Machine Learning kann hier neue Einblicke ergeben, so können zum Beispiel Produkte unterschiedlichster Kategorien geclustert werden, um dieses Cluster dann gezielt in speziellen Kundensegmenten zu bewerben, oder für Predictive Marketing zu nutzen.

Gelabelte und ungelabelte Daten

Daten sind ganz entscheidend, wenn es um Machine Learning geht. Im Regelfall benötigen Sie so viele Datensätze wie möglich, um Ihren Maschine Learning Algorithmus zu trainieren, zu testen und im Produktionsbetrieb permanent zu optimieren. Neben der Datenquantität ist aber auch die Datenqualität entscheidend. Nach wie vor ist es eine Aufgabe von Menschen, zu entscheiden, welche Attribute von Datensätzen in welcher Form für das Machine Learning genutzt werden – dies hat einen entscheidenden Einfluss auf die Qualität der Ergebnisse.

Gelabelte Daten haben Zielattribute, welche beim überwachten Lernen zu Trainings-, Validierungs- und Testzwecken genutzt werden können. Anders ausgedrückt: Die Daten bestehen aus Eingabewerten x und Ausgabewerten y (= Labels).

Beispiel aus dem Bereich Produktinformation/E-Commerce:

x1 = Preis des Produkts

x2 = Größe des Produkts

x3 = Gewicht des Produkts

y = Bestellvolumen (Label)

Dieses Beispiel ist stark vereinfacht. Zudem stellt sich in der Praxis oft die Herausforderung, geeignete und relevante Attribute zu finden, die für den jeweiligen Zweck des Machine Learnings geeignet sind. Hier ist es entscheidend, dass unterschiedliche Fachkompetenzen eng kooperieren (z.B. Produktmanager und Datenanalysten).

Bei ungelabelten Daten fehlt das Label „y“. Sie werden oft beim unüberwachten Lernen eingesetzt.

Details zum Einsatz von gelabelten und ungelabelten Daten betrachten wir in den nächsten Abschnitten.

Unterschiedliche Varianten des Machine Learning

Schauen wir uns zunächst einmal verschiedene Beispiele an, um einige grundsätzliche Varianten des Machine Learning (oder Deep Learning) zu betrachten.

Regression

Hierbei geht es typischerweise um Herausforderungen im Bereich „überwachtes Lernen“. Basierend auf vorhandenen, gelabelten Daten, soll AI helfen, Aussagen für die Zukunft zu treffen.

Hierbei kommen normalerweise gelabelte Daten zum Einsatz. Kommen wir auf die Daten aus dem vorherigen Abschnitt zurück.

x1 = Preis des Produkts

x2 = Größe des Produkts

x3 = Gewicht des Produkts

y = Bestellvolumen (Label)

Basierend auf den Eingabewerten x1 bis x3 soll hierbei das Bestellvolumen y ermittelt werden. Historische, gelabelte Daten stehen zur Verfügung, die für das Training genutzt werden. Das Ziel dieses Trainings ist nun, eine „Formel“ zu finden, die möglichst genau das Bestellvolumen auf Basis künftiger Werte x1 bis x3 vorhersagen kann.

Dies kann durch lineare, oder häufiger – wie in der folgenden Grafik gezeigt – durch nicht lineare Regression geschehen. Einfacher gesagt, es wird eine „Kurve“ gesucht, die bestmöglich die Werte der Trainingsdaten abbildet.

Klassifizierung

Nicht immer geht es darum, mit maschinellem Lernen einen Zahlenwert zu ermitteln. Oft ist auch eine Klassifizierung das Ziel: Beispielsweise vorherzusagen, ob ein bestimmter Zustand eintreten wird oder nicht. Auch hier wird im Regelfall mit gelabelten Daten gearbeitet.

Ein Beispiel aus dem Bereich E-Commerce:

x1 = Dauer der Session

x2 = Anzahl der Seitenbesuche

y = Bestellung wird abgebrochen: wahr/falsch (Label)

Clustering

Clustering ist ein typisches Beispiel für unüberwachtes Lernen. Dabei ist das Ziel, unstrukturierte Daten durch eine bestimmte Anzahl von Clustern zu strukturieren – dies können zum Beispiel Produktsegmente oder Kundentypen sein, die durch AI automatisiert ermittelt werden sollen.

Die Grafik zeigt ein Beispiel, in dem Kundengruppen auf Basis von Bestellvolumen und Alter generiert werden, um diese beispielsweise in Gruppen durch personalisierten Content gezielt anzusprechen.

Im echten Leben sind diese Daten meist wesentlich komplexer als im hier gezeigten Beispiel.

Einsatz von Machine Learning bei Marketing Automation, E-Commerce und Produktinformationsmanagement

Nachdem die in den vorigen Abschnitten gezeigten Beispiele einen ersten Überblick zu typischen Varianten des Machine Learnings gezeigt haben, wollen wir nun einmal betrachten, welche Potentiale diese Technologie in Bezug auf Marketing Automation, E-Commerce und Produktinformationsmanagement bietet.

Die ganze Welt spricht von „Big Data“ – ein weiteres Buzzword in diesem Zusammenhang. Aber ein klarer Trend ist, dass in Unternehmen lokale Datensilos aufgelöst werden – zugunsten einer ganzheitlichen, fachlich und örtlich übergreifenden Analyse und Nutzung der Daten. Eine große Herausforderung hierbei ist, „Big Data“ in „Intelligent Data“ zu verwandeln, so dass diese auch wirklich genutzt werden können.

Im Rahmen solcher Use Cases spielen Daten aus unterschiedlichsten Bereichen eine Rolle. Und klar ist, dass Datenbestände aus Produktmanagement, Marketing, Sales, Warenwirtschaft und Finanzwesen hier immer ganzheitlicher betrachtet werden müssen. Nur so kann z.B. Marketing Automation wirklich erfolgreich sein.

Um genau diese Ziele zu erreichen, kann Machine Learing helfen. Jedoch stehen die meisten Unternehmen hier noch ganz am Anfang.

Es gibt dabei zahlreiche Anwendungsmöglichkeiten von AI im Bereich Marketing – vielfach eng vernetzt mit PIM und E-Commerce. Hier nur einige Beispiele:

Conversational Interfaces (Chat Bots oder Voice Interfaces)
Analytics
Targeting
Predictive Marketing
Recommender Systems (individuelle Empfehlungen)
Dynamic Pricing

All diese Anwendungen haben einen gemeinsamen Nenner: Die weitgehend digitale und personalisierte Customer Journey. Und gerade hier ist intelligente Nutzung und Erhebung von Daten essenziell.

Machine Learning ist kein Selbstzweck

Last-but-not-least: Machine Learning ist weder “plug-and-play” noch ein Selbstzweck. Vielmehr kann es eine mächtige Technologie sein, die aber Ihre Potentiale nur entfalten kann, wenn sie zum jeweiligen Business Case passt. Stellen Sie sich daher folgende Fragen:

Welches Ziel wird verfolgt, und welchen Mehrwert bringt AI/ML zur Erreichung dieser Ziele?
Soll ein „menschlicher“ Prozess durch Nutzung von AI ersetzt werden? Oder geht es vielmehr darum, einen momentan bereits automatisierten (weitgehend anonymen) Prozess durch AI „menschlicher“ und individueller zu gestalten?
Wie stehen die Nutzer (Konsumenten/Kunden) zu künstlicher Intelligenz? Könnte es Vorbehalte geben, beispielsweise in Bezug auf Datenschutzrisiken?
Welche rechtlichen und/oder ethischen Rahmenbedingungen gibt es?
Welche Daten sind bereits im Unternehmen vorhanden, und wie können diese für initiales Machine Learning eingesetzt werden?
Welche Daten werden während des Einsatzes der Anwendung laufend erhoben, und wie können diese für Machine Learning im laufenden Betrieb eingesetzt werden?
Welche Ressourcen stehen im Unternehmen im Bereich Data Science und Machine Learning bereit? Die aktuell genutzte „angewandte AI“ ist kein Selbstläufer, sondern erfordert Wartung, Pflege und insbesondere Risikomanagement durch Menschen

Fazit: Machine Learning kann dabei helfen, einen Business Case zu unterstützen, wenn sowohl wirtschaftliche, fachliche und technologische Fragestellungen berücksichtigt werden.

Autor:

Roland Bühler gründete 2017, nach leitenden Tätigkeiten bei Agenturen und Systemdienstleistern, die rb omnichannel GmbH. Das Unternehmen ist fokussiert auf Beratung und Projektmanagement im Bereich Marketingtechnologie. Er verfügt über Erfahrung in der Leitung komplexer und internationaler Projekte für Kunden in den Branchen Industrie, Automotive, Handel, FMCG, Werbung, Druck und Medien. Tätigkeiten für Analystenhäuser runden sein Profil ab. Roland Bühler ist unter anderem in den Bereichen Scrum, PRINCE2 (Agile), ITIL, Data Science, Machine Learning und Datenschutz zertifiziert.