KANBrief 4/19
Im Zuge der voranschreitenden Digitalisierung stellt die Verarbeitung wachsender Datenmengen produzierende Unternehmen vor große Herausforderungen. Durch maschinelles Lernen als Teilbereich der künstlichen Intelligenz kann aus Daten wertvolles Wissen generiert werden. In der industriellen Anwendung kann dies unter der Bezeichnung Industrial Data Science zukünftig einen wichtigen Wettbewerbsvorteil bedeuten.
Unter dem Leitbild „Industrie 4.0“ ist die Digitalisierung der industriellen Produktion in den vergangenen Jahren stark vorangeschritten. Die zunehmende Vernetzung von (Produktions-)Prozessen führt dabei zu immer größeren Datenmengen. Diese enthalten wertvolles Wissen, z.B. zur Prozessoptimierung, welches jedoch mit herkömmlichen Methoden nicht mehr extrahiert werden kann.
Um das Innovationspotential dennoch zu erschließen, kommen innovative Technologien der künstlichen Intelligenz (KI) zum Einsatz. Die KI nutzt Methoden der Mathematik und Informatik, um Lösungen für konkrete Anwendungsprobleme zu entwickeln, z.B. für Produktionsoptimierung, Qualitätsmanagement oder Automatisierung. In diesen Anwendungsgebieten kommt der Querschnittstechnologie des maschinellen Lernens eine besondere Bedeutung zu. Als Schnittstelle von Informatik, Mathematik und Statistik nutzt sie Algorithmen, um aus den Daten zu „lernen“ und daraus allgemeingültiges Wissen zu generieren.
Die Anwendung von maschinellem Lernen in der industriellen Produktion bezeichnet man als Industrial Data Science (IDS, Industrielle Datenwissenschaft). Die IDS kombiniert Methoden der Informatik, Mathematik und Statistik mit domänenspezifischem Expertenwissen der Produktion (Bauer, N.; Stankiewicz, L.; Jastrow, M.; Horn, D.; Teubner, J.; Kersting, K.; Deuse, J.; Weihs, C.: Industrial Data Science. Developing a Qualification Concept for Machine Learning in Industrial Production: European Conference on Data Analysis (ECDA) 2018). Dieser interdisziplinäre Ansatz ermöglicht innovative Lösungen für bestehende Problemstellungen sowie die Unterstützung von Entscheidungsprozessen. Die Zielstellungen von IDS-Anwendungen können beschreibend („Was ist passiert?“), erklärend („Warum ist es passiert?“), prädiktiv („Was wird passieren?“) oder präskriptiv („Was ist zu tun?“) sein. Mit jeder dieser Stufen steigt die Komplexität der Anwendung, gleichzeitig wächst jedoch auch der Informationsgehalt.
Für die Durchführung von praktischen IDS-Projekten haben sich drei Erfolgsfaktoren herausgestellt:
Interdisziplinäre Zusammensetzung von Projektteams:
Datenwissenschaftler verfügen über fundierte Kenntnisse in Datenverarbeitung und -management und maschinellem Lernen. Domänenexperten haben ein weitreichendes technisches Verständnis und kennen ihre Produkte und Prozesse gut. Beide Gruppen sind für erfolgreiche Projekte unerlässlich, sprechen aber nicht immer die gleiche Sprache. Der Citizen Data Scientist, ein interdisziplinär ausgebildeter Fachexperte, kann als Vermittler helfen, diese Barrieren in der Kommunikation zu überwinden.
Strukturierte Vorgehensweise für Projekte: Das CRISP-DM-Modell (Cross Industry Standard Process Model for Data Mining) hat sich hierfür in zahlreichen industriellen Projekten als Standard etabliert (Chapman, P.; Clinton, J.; Kerber, R.; Khabaz, T.; Reinartz, T.; Shearer, C.; Wirth, R.: CRISP-DM 1.0. Step-by-step data mining guide,
SPSS Inc.; 2000). Das Modell gliedert Projekte in sechs Phasen, die nacheinander und bei Bedarf iterativ durchlaufen werden: (1) Geschäfts- und Prozessverständnis aufbauen, (2) Daten verstehen und interpretieren, (3) Datenqualität bewerten und Daten aufbereiten, (4) Algorithmen auswählen und Modelle bilden, (5) Modelle bewerten, (6) Ergebnisse dokumentieren und Lösungen umsetzen.
Datenreifegrad: Dieser sollte stets im Bezug zum Projektziel bewertet werden. Mit steigendem Automatisierungs- und Autonomiegrad der angestrebten Lösung steigen auch die Anforderungen an die Datenerfassung und -qualität. Vorstudien und Potentialanalysen lassen sich meist schon mit einem geringeren Datenreifegrad, ggf. mit höherem manuellem Aufwand, realisieren. Die Datenreife sollte daher nicht als Hindernis, sondern deren Verbesserung als Potential für zukünftige Projekte angesehen werden.
Die künstliche Intelligenz bietet bei zahlreichen produkt-, prozess- und systembezogenen Anwendungen große Potentiale zur Optimierung wichtiger Produktionskennzahlen. Ihr Einsatzbereich ist jedoch nicht auf die Produktion beschränkt, sondern branchenunabhängig. Künstliche Intelligenz kann auch Geschäftsprozesse optimieren und so zu einem Unternehmensvorteil werden. Es gilt daher vor allem, die sinnvollen Einsatzmöglichkeiten zu ermitteln und zu nutzen.
Univ.-Prof. Dr.-Ing. Jochen Deuse
jochen.deuse@ips.tu-dortmund.de
M. Sc. Jacqueline Schmitt
jacqueline.schmitt@ips.tu-dortmund.de