Training für ein schlaues IoT: Künstliche Intelligenz braucht erstklassige Daten

Datensätze sind Kraftfutter für KI und maschinelles Lernen. Hochwertige Ergebnisse können aber nur aus gut gepflegten, qualitativen Daten resultieren.

Das Internet der Dinge ist ein digitaler Schmelzofen von gewaltiger Dimension. Bis 2022 werden vermutlich mehr als 50 Milliarden Devices an das IoT (Internet of Things) angeschlossen sein. Nach Ansicht der Analysten von Juniper Research soll allmählich die Skalierungsphase kommen. Sie vermuten in einer Studie aus dem Jahr 2018, dass die Gesamtzahl der an das IoT angeschlossenen Sensoren und Geräte bis 2022 auf mehr als 50 Milliarden ansteigen wird, gegenüber geschätzten 21 Milliarden im Jahr 2018. Ein Ökosystem also, in dem Datenmengen entstehen, die insbesondere für KI und maschinelles Lernen reines Kraftfutter sind – stets vorausgesetzt, dass die zugrundeliegenden Daten, und insbesondere auch die Geschäftspartnerdaten, gut gepflegt und von hoher Qualität sind.

Wer meint, dass Künstliche Intelligenz (KI) und Machine Learning (ML) hierzulande noch eine Weile Zukunftsmusik sein werden, der irrt: Laut einer Befragung des Digitalverbands Bitkom greifen bereits 12 Prozent der deutschen Unternehmen im Umfeld von Industrie 4.0 auf intelligente Algorithmen zurück. Unsere hauseigene Trendstudie unterstreicht diese allgemeine Entwicklung für den Bereich Kundendatenmanagement – ein Segment, in dem sich der Einsatz von KI- und ML-basierten Lösungen innerhalb nur eines Jahres um 50 Prozent erhöht hat.

Ein branchenübergreifendes Einsatzszenario von intelligenten Systemen sind Sprachassistenten und Chatbots. Hier werden Unmengen an strukturierten und unstrukturierten Daten aus Dokumenten sowie Audio- und Videodateien ausgewertet, um zum Beispiel virtuelle Beratungen oder auch personalisierte Informations- und Bildungsangebote zu realisieren.

Fakt ist: Die Palette der denkbaren KI-Einsatzfelder ist schier unbegrenzt und reicht vom Smart Home über KI-basierte Software in der medizinischen Diagnostik bis hin zur ML-gestützten Optimierung für Rohstoffversorgung und Personaleinsatzplanung. Zudem prognostizieren die Marktforscher der Information Service Group (ISG), dass KI und ML spürbar günstiger werden. Parallel zu dieser Entwicklung sagen sie in ihrem jährlichen Anbietervergleich voraus, „dass der Markt in rasantem Tempo an Reife gewinnt.“

KI als treibende Kraft im Internet der Dinge

Vor diesem Hintergrund zeichnet sich immer deutlicher ab, wie eng das Internet der Dinge (IoT) – und mit ihm die weitere Entwicklung der Industrie 4.0 mit der fortschreitenden Verbreitung von KI und ML verzahnt sind. Das massive Datenaufkommen, das aus der Steuerung und Interaktion von Milliarden von Routern, Gateways, Sensoren, Zählern, Ausgabegeräten, Fertigungselementen und sonstigen Modulen entsteht, muss beherrschbar bleiben. Die Prozesse, die hierzu erforderlich sind, werden zusehends automatisiert und intelligent erfolgen – genau an dieser Stelle greifen KI und ML.

Smarte Technologien wie ML und Deep Learning werden somit der Schlüssel sein, wenn es darum geht, das Big-Data-Aufkommen aus dem IoT zu filtern, Muster zu erkennen und relevante Daten schnell auszuwerten. Die hieraus resultierenden Analysen werden dabei helfen, IoT-Produkte besser zu verstehen und ihre Steuerung entsprechend zu optimieren.

Dadurch wird das Befehligen von IoT-Elementen nicht nur deutlich effizienter. Mehr noch: Durch die smarte Kopplung von KI, ML und IoT werden Unternehmen zu datengesteuerten und prozessorientierten Organisationen, die bestens für die Anforderungen der Digitalisierung gerüstet sind. Die Prognose, dass der Einsatz von KI dem Netzwerk der Dinge exponentiell auf die Sprünge helfen wird, erscheint vor diesem Hintergrund ausgesprochen realistisch.

Hohe Datenqualität ist bester Schutz vor schlechten KI-Ergebnissen

Bei aller Euphorie rund um das Potenzial intelligenter Algorithmen dürfen wir unter keinen Umständen die Risiken aus den Augen verlieren. Je intelligenter eine KI wird, umso weniger werden wir in der Lage sein, ihre Entscheidungen nachvollziehen zu können. Es wirken schon heute so viele Kennzahlen, Datenpunkte und Variablen an jeder einzelnen Berechnung mit, dass ein menschliches Gehirn diese – zumindest auf die Schnelle – nicht mehr begreifen kann.

Was bleibt uns also? Wir müssen den Empfehlungen und Entscheidungen Künstlicher Intelligenzen vertrauen. Eine Feststellung, die keinesfalls fatalistisch interpretiert werden soll. Vielmehr müssen wir im Vorfeld sicherstellen, dass die Ergebnisse der KI- und ML-Analysen exakt und aussagekräftig sind.

Das A und O ist natürlich eine sorgsame und genaue Programmierung von Algorithmen. Steht die Software, so kommt ein weiterer, entscheidender Faktor ins Rennen um fehlerfreie KI- und ML-Prozesse: gute Trainingsdaten. So ist es beispielsweise unverzichtbar, dass Unternehmen ihre Geschäftspartnerdaten, die in die Programmierung von KI einfließen sollen, gewissenhaft pflegen. Ansonsten laufen sie Gefahr, dass die intelligenten Systeme falsch lernen und damit nicht nachvollziehbare oder sogar diskriminierende Ergebnisse liefern.

Dabei stellen Geschäftspartnerdaten, also insbesondere Kunden- und Interessentendaten, eine Datenkategorie dar, die im industriellen IoT- (IIoT) Umfeld oft vernachlässigt, wenn nicht sogar gänzlich vergessen wird. Dabei handelt es sich um eine mindestens ebenso wichtige Kategorie wie Sensor- oder Maschinendaten. Was insbesondere dann deutlich wird, wenn wir uns etwa dem Thema Mass Customization bis hin zur „Losgröße gleich eins“ zuwenden: kein Produkt gleicht dem anderen und ist dabei bereits in der Fertigung an den späteren Käufer gekoppelt, beispielsweise in der Automobilindustrie.

Mass Customization oder auch kundenindividuelle Massenproduktion in der Fahrzeugindustrie führt zu einer hohen Anzahl möglicher Varianten für einzelne Fahrzeuge. Die daraus resultierende Komplexität in der Entwicklung, aber auch der Planung und Steuerung der Produktion und des gesamten Unternehmens, ist eine besondere Herausforderung für die Unternehmensführung und das Controlling. Und sehr eng an Geschäftspartnerdaten geknüpft.

Doch es ist nahezu unerheblich, von welcher Branche die Rede ist, unabhängig von ihrer Beschaffenheit, ihren Quellen und ihren Einsatzbereichen ist eines allen Kategorien und insbesondere den Geschäftspartnerdaten gemeinsam: ihre Qualität ist essenziell. Sie sind der Dreh- und Angelpunkt innerhalb des Beziehungsgeflechts eines Unternehmens, insbesondere vor dem Hintergrund von KI und ML: Eine Künstliche Intelligenz, deren Analysen sich auf die Pflege und die Kommunikation mit Geschäftspartnern auswirken, braucht Daten von angemessener Qualität.

Verteilte Daten für KI-Training in „Ground Truth“ konsolidieren

Es kann nicht oft genug betont werden, dass KI in der Fertigung nicht nur anhand von Maschinendaten, sondern auch von und mit Geschäftspartnerdaten lernt. Nur so ist es möglich, IoT-Elemente und -Geräte den Bedürfnissen der Nutzer anzupassen.

Es steht vielleicht nicht direkt die komplette Produktion still, wenn Daten falsch sind; für die Erreichung übergreifender Produktions- und Geschäftsziele sind Prozessbrüche aufgrund einer mangelhaften Datenqualität, und hier insbesondere der Geschäftspartnerdaten, allerdings auch nicht zielführend. Deshalb gilt auch hier das GIGO-Prinzip.

Was Informatiker einst scherzhaft als Garbage In-/Garbage Out betitelten, spiegelt eine bestechend einfache Wahrheit wider: Wenn an einem Ende minderwertiges Material in ein System hineingegeben wird, dann ist am anderen Ende nicht mit der Ausgabe von Juwelen zu rechnen.

Für Künstliche Intelligenz im IoT-Umfeld bedeutet das: Unternehmen müssen für ein adäquates KI-Training erst ihre Daten unternehmensweit bereinigen, anreichern und konsolidieren. Eine besondere Herausforderung, denn liegen doch gerade Geschäftspartnerdaten oft im Unternehmen verstreut und verteilt vor. Die Systeme, auf denen relevante Daten zu finden sind, reichen von CRM-Tools über Ticketing- und ERP-Lösungen bis hin zu Call-Center-Anwendungen.

So nutzen 63 Prozent der Unternehmen gleich mehrere abteilungsbezogene Lösungen zur Verwaltung ihrer Kundendaten. Damit ist es ihnen kaum möglich, die in den unterschiedlichen Systemen verwalteten Daten zusammenzuführen und für das KI- oder ML-System verfügbar zu machen.

Dem Dilemma verteilter und nicht harmonisierter Datenbestände können Unternehmen begegnen, indem sie wirklich alle über einen Geschäftspartner verfügbaren Informationen – also Stammdaten und Bewegungsdaten (Transaktions- und Interaktionsdaten) – zusammenführen. Dazu benötigen Unternehmen den sogenannten „Ground Truth“, eine Lösungs- und Prozessmethodik, die ein verlässliches Gesamtbild aller Daten und damit der Wirklichkeit gibt. Mit dieser „grundlegenden Datenwahrheit“ als hochwertiger Datenbasis können KI und ML erst richtig lernen, ihren vollen Nutzen entfalten und sich somit das Vertrauen ihrer Anwender verdienen.

Autor: Simone Braun

Bitte beachten Sie

Die Beiträge in der Rubrik "Trends und Innovationen" sind Inhalte unseres Medienpartners Vogel Communications Group GmbH & Co. KG. Sie spiegeln nicht unbedingt die Meinung von DATEV wider.

Vogel Communications Group

Training für ein schlaues IoT: Künstliche Intelligenz braucht erstklassige Daten

KI als treibende Kraft im Internet der Dinge

Hohe Datenqualität ist bester Schutz vor schlechten KI-Ergebnissen

Verteilte Daten für KI-Training in „Ground Truth“ konsolidieren

Bitte beachten Sie

Meistgelesene Artikel

„Wir haben gar keine andere Wahl“

Omas Häuschen im Visier des Fiskus

Job-Ticket statt Lohnerhöhung

Aktuelle Meldungen im Fokus

Komplett digital im Rechnungswesen

Eilmeldung: Quasi-Fristverlängerung für die Offenlegung der Jahresabschlüsse 2022 verkündet!