KANBrief 4/19
Industrial Data Science
On désigne par le terme d’Industrial Data Science (IDS – Science industrielle des données) l’application de l’apprentissage automatique dans la production industrielle. L’IDS combine des méthodes de l’informatique, des mathématiques et des statistiques avec des connaissances d’experts dans des domaines spécifiques de la production1. Cette approche interdisciplinaire permet de trouver des solutions innovantes à des problèmes existants, et fournit une aide pour les processus décisionnels. Les objectifs des applications de l’IDS peuvent être descriptifs (« Que s’est-il passé ? »), explicatifs (« Pourquoi est-ce arrivé ? »), prédictifs (« Qu’est-ce qui va se passer ? ») ou prescriptifs (« Que faut-il faire ? »). La complexité de l’application augmente avec chacune de ces phases, mais son niveau d’information croît également.
Les facteurs de réussite
Trois facteurs de réussite ont été identifiés pour la mise en œuvre de projets d’IDS dans la pratique :
La composition interdisciplinaire des équipes de projet : Les scientifiques des données possèdent de solides connaissances dans le traitement et la gestion des données et dans l’apprentissage automatique. Les experts en domaine ont une vaste compréhension de la technique et connaissaient parfaitement leurs produits et processus. Ces deux groupes sont indispensables pour la réussite d’un projet, mais ils ne parlent pas toujours la même langue. Le Citizen Data Scientist, expert de formation interdisciplinaire, peut intervenir comme intermédiaire et aider ainsi à surmonter ces obstacles de communication.
Une approche structurée pour les projets : Le modèle CRISP-DM (Cross Industry Standard Process Model for Data Mining) s’est ici imposé comme standard dans de nombreux projets industriels2. Le modèle comporte six phases qui se déroulent successivement et, si nécessaire, de manière itérative : (1) compréhension des objectifs industriels et des processus, (2) compréhension et interprétation des données, (3) évaluation de la qualité des données et préparation des données, (4) sélection des algorithmes et élaboration des modèles, (5) évaluation des modèles, (6) documentation des résultats et mise en œuvre des solutions.
Le degré de maturité des données : Il doit toujours être évalué par rapport à l’objectif du projet. Plus le degré d’automatisation et d’autonomie de la solution recherchée augmente, plus les exigences auxquelles devront répondre la capture et la qualité des données seront élevées. Il est généralement possible de réaliser des études préliminaires et des analyses de potentiel avec un degré de maturité des données plus faible, éventuellement avec un travail manuel plus important. La maturité des données ne doit donc pas être considérée comme un obstacle, mais son amélioration doit être vue comme offrant un potentiel pour de futurs projets.
Dans de nombreuses applications relatives aux produits, aux processus et aux systèmes, l’intelligence artificielle offre un grand potentiel d’optimisation de chiffres clés importants de la production. Son utilisation n’est toutefois pas limitée au domaine de la production. L’intelligence artificielle peut aussi optimiser des processus commerciaux et devenir ainsi un atout pour l’entreprise. Il est donc essentiel de définir et de mettre à profit les domaines dans lesquels elle peut être judicieusement utilisée.
Univ.-Prof. Dr.-Ing. Jochen Deuse
jochen.deuse@ips.tu-dortmund.de
M. Sc. Jacqueline Schmitt
jacqueline.schmitt@ips.tu-dortmund.de
1 Bauer, N.; Stankiewicz, L.; Jastrow, M.; Horn, D.; Teubner, J.; Kersting,
K.; Deuse, J.; Weihs, C.: Industrial Data Science. Developing a Qualification Concept for Machine Learning in Industrial Production: European Conference on Data Analysis (ECDA) 2018.
2 Chapman, P.; Clinton, J.; Kerber, R.; Khabaz, T.; Reinartz, T.; Shearer, C.; Wirth, R.: CRISP-DM 1.0. Step-by-step data mining guide,
SPSS Inc. (2000).