A l’ère de la donnée, la transformation digitale des entreprises s’accompagne d’un engouement autour du big data en général et des data scientist en particulier, sans oublier l’intelligence artificielle qui passe un cap majeur ces derniers mois…

L’analyse de la donnée collectée et le big data n’en sont qu’à leurs débuts et, contrairement à ce que l’on pourrait penser, le principal défi est loin d’être uniquement technique.

Produire de la valeur à partir des données ne peut pas être uniquement du ressort de l’IT. En effet, l’IT n’est pas forcément la mieux placée pour savoir où se situe la pertinence dans les données, tandis que les utilisateurs, quant à eux, n’ont pas forcément les compétences requises pour comprendre les subtilités techniques de la collecte, du stockage et de l’analyse des données.

De même que les méthodes « DevOps » apportent plus d’agilité et d’efficacité, des approches de type ‘’MLOps’’ et « DataOps » commencent à émerger pour :

  • Rendre la donnée accessible au plus grand nombre,
  • Aller plus loin dans l’analyse et le management de la donnée,
  • Permettre encore plus d’innovations pertinentes.

Le machine learning (ML), forme d’intelligence artificielle (IA), est axé sur la création de systèmes qui optimisent ou améliorent leurs performances, en fonction des données qu’ils traitent.

Il s’agit d’une technologie qui apprend grâce à l’expérience et non pas par le biais d’un programme informatique immuable. Les performances évoluent constamment et chaque nouvelle donnée vient enrichir ce flux. L’analyse de données et les statistiques permettent, entre autres, de réaliser des prédictions ou des insights (autrement dit des tendances).

Aujourd’hui, des algorithmes de Machine Learning s’invitent dans tous les domaines pour fluidifier et optimiser l’expérience utilisateur, nous commençons seulement à avoir une idée de ses capacités et sommes encore loin d’exploiter tout son potentiel.

En d’autres termes, les indicateurs créés par la data science vont se révéler précieux pour les dirigeants qui s’appuieront sur ces modèles de prédiction pour anticiper l’avenir. C’est particulièrement pertinent dans un secteur d’activité très concurrentiel où chaque prise de décision est essentielle pour la pérennité d’une entreprise ou d’un groupe.

On parle aujourd’hui de projets data, lorsque l’amélioration des performances d’une activité est notamment liée à la pertinence de la data et à son analyse en continu.

C’est ainsi qu’est né, à l’instar du DevOps, le MLOps ou le DataOps.

Qu’est-ce que le MLOps ?

Les équipes DevOps se concentrent sur la fourniture continue de logiciels et l’automatisation de l’intégration, des tests et du déploiement de code indépendamment de la gestion des données et de leur analyse (CICD). Le DevOps permet de créer un cercle vertueux. Les mises à jour fréquentes préviennent des petites erreurs, les équipes IT, ingénierie et qualité sont motivées pour travailler ensemble dans la même direction et sont donc plus efficaces. Le processus de prise de décision s’en trouve accéléré.

En s’inspirant du succès du DevOps, le MLOps s’appuie sur la collaboration avec les équipes DevOps, pour prendre en charge l’intégration continue, ainsi que le déploiement rapide et reproductible des jeux de modèles Machine Learning. Il aide ainsi les utilisateurs métier à faire émerger plus rapidement de précieuses informations exploitables de leurs données. Le MLOps implique également une surveillance et un réentraînement continuels des modèles en production afin de s’assurer qu’ils fonctionnent de manière optimale à mesure que les données changent au fil du temps (dérive des données) pour générer de la valeur métier.

Les équipes DataOps (Data Operations) s’intéressent à la gestion des pipelines de données et à l’automatisation des processus afin de réduire le temps que prend une analyse de données.

Le MLOps permet de relever les défis

La création de modèle de Machine Learning prend du temps avec un risque important d’une obsolescence de celui-ci avant même son déploiement. C’est donc potentiellement du temps et de l’argent perdu dans des projets de Data avec des modèles qui ne seront jamais déployés.

L’intérêt d’un modèle de Machine Learning est de créer de la valeur à condition qu’il soit mis en production.

En accélérant la mise en production des modèles, le MLOps peut contribuer à relever ce défi de taille.

 

Différente entre MLOps et Business Intelligence

Il ne faut pas confondre Machine Learning et « business intelligence » ou BI. Pour chacun des 2, il s’agit d’analyser les données pour aider à la décision. Alors que le machine Learning est prédictif, la BI s’attache à bien comprendre le passé et le présent avec une analyse descriptive, en collectant les données brutes et en les classant dans une base de données structurée autrement baptisée « entrepôt de données ». Une fois organisées, les données sont présentées sous la forme d’un tableau de bord synthétique. C’est à partir de celui-ci que l’expert va pouvoir, par exemple, vérifier quels sont les projets qui ont connu du succès et analyser leurs données.

Et si la data science a actuellement le vent en poupe grâce à sa capacité à identifier des insights en vue d’une optimisation prédictive, elle pourrait perdre de la pertinence si elle ne s’appuyait pas également sur les données et les analyses propres au BI.

Les outils Microsoft

Azure Machine Learning

Azure Machine Learning est un service cloud permettant d’accélérer la mise en production des modèles de Machine Learning. Les data scientists et les ingénieurs peuvent l’utiliser dans leurs flux de travail quotidiens.

Il est possible de créer un modèle dans Azure Machine Learning ou d’utiliser un modèle conçu à partir d’une plateforme open source comme PyTorch, TensorFlow ou scikit-learn.

Voici quelques-unes des fonctionnalités clés permettant le MLOps :

  • Intégration de git
  • Intégration de MLflow
  • Planification des pipelines Machine Learning
  • Intégration d’Azure Event Grid pour les déclencheurs personnalisés
  • Facilité d’utilisation avec des outils CI/CD comme GitHub Actions et Azure DevOps

Par ailleurs, Azure Machine Learning comprend des fonctionnalités de monitoring des modèles et d’audit :

  • Artefacts de tâches, par exemple instantanés de code, journaux et autres sorties
  • Traçabilité entre les tâches et les ressources, notamment les conteneurs, les données et les ressources de calcul

Microsoft PowerBI

Microsoft Power BI est une solution d’analyse de données. Il permet de créer des visualisations de données pertinentes, en se connectant à la source de données, avec une interface suffisamment simple pour que les utilisateurs finaux puissent :

  • Utiliser des modèles de données pour créer des tableaux de bord avec plusieurs sources de données
  • Connecter des requêtes, des modèles de données, des rapports Excel, intégrer des règles
  • Collecter, consolider les sources de données, analyser, visualiser, publier
  • Partager des données métier Excel de façon innovante

Cela permet une analyse multidimensionnelle rapide sur de grands volumes d’informations, qu’elles soient stockées dans un entrepôt de données ou un autre système de stockage.

L’utilisation de Power BI est flexible et dépend de la fonctionnalité ou du service de Power BI souhaités. Par exemple,

  • Power BI Desktop pour créer des rapports statistiques pour votre équipe
  • Service Power BI pour visualiser l’évolution d’un stock dans un tableau de bord en temps réel
  • Rapport paginé de documents à partir d’un jeu de données

L’outil de pipeline de déploiement, quant à lui, permet de tester votre contenu avant de le publier.

En conclusion

L’agilité a permis (et permet encore) le développement d’applications au plus près des besoins des utilisateurs grâce au rapprochement et à l’alignement des équipes produit et des équipes de développement avec pour objectif de briser les silos et d’éviter l’effet tunnel.

Malgré l’essor de la méthodologie Agile, il a fallu décloisonner les équipes de développement et les équipes opérationnelles pour faciliter la mise en production, c’est la naissance de DevOps.

Le DevOps est l’application des méthodes agiles à l’ensemble du cycle de vie d’une application, incluant l’automatisation des processus et l’étroite collaboration entre les équipes de développement et les opérations pour livrer plus rapidement des logiciels plus performants.

La pratique DevOps a, en quelque sorte, été adaptée au traitement des données et plus précisément au Machine Learning, donnant naissance au MLOps qui consiste à mettre l’IA au cœur de l’application en production.

Ne ratez plus aucune actualité avec la newsletter mensuelle de SoftFluent

Newsletter SoftFluent