Ici archive

Les analystes marketing s’appuient sur les données depuis longtemps pour gérer leurs campagnes, étudier les comportements clients ou proposer des services de fidélisation.

Mais plusieurs changements majeurs, sociétaux et technologiques les amènent à repenser leur stratégie et adapter leur organisation. En effet, la crise du COVID a fait prendre conscience aux entreprises de la nécessité de s’adapter très vite à de nouveaux usages (digitalisation des échanges, développement du e-commerce, changement brutal des habitudes de consommation, renforcement de l’influence des média sociaux…) pour capter une nouvelle clientèle et fidéliser l’historique.

Cela a contribué au développement rapide de nouvelles solutions à même de capter les tendances (digital consumer intelligence) ou de toucher la bonne cible au bon moment, sur le bon canal, avec le bon produit (programmatic advertising).

La difficulté grandissante est de capter le bon moment, de plus en plus volatile et fortement dépendant du canal ; encore complexifié par l’émergence perpétuelle de nouvelles technologies (Web 3.0, métavers) auxquelles il faut s’adapter.

L’analyse statistique ne suffit plus. Le succès des opérations marketing repose sur la rapidité d’exécution, voire l’anticipation et la prédiction des comportements d’achats avec un recours de plus en plus massif à l’intelligence artificielle – et pourtant, selon un baromètre mené par le cabinet Accenture en 2022, seules 12% des entreprises ont atteint un niveau de maturité suffisant sur l’IA pour accélérer leur croissance, alors que 60% n’en sont qu’à un stade expérimental. (source : IT for Business)

Quels sont les obstacles ?

De prime abord, la première complexité est de comprendre comment utiliser ces nouvelles technologies dans le riche écosystème du marketeur : identifier les nouveaux usages, leur associer le bon levier – “à quoi peut me servir Chat GPT ?” “Comment intégrer de l’IA prédictive sur les comportements d’achats ?” – et les mettre en œuvre.

Une analyse plus approfondie amène souvent au même constat : avant d’être “IA ready”, êtes-vous “data ready” ?

Renforcer les fondements stratégiques de la data

En effet, utiliser des composants innovants comme l’intelligence artificielle nécessite au préalable de maîtriser le cycle de vie de ses données : de l’acquisition (de plus en plus en temps réel), la mise en qualité (data quality management), l’identification et la cartographie des données utilisables ou nécessaires (data cataloging), à l’exposition et la mise à disposition industrialisée de ces données pour des solutions consommatrices internes ou tierces (analyse de sentiment, gestion de campagnes, real-time advertising…).

Comment gérer plus de 100 activités marketing en temps réel ?

C’est tout simplement impossible. Les approches traditionnelles ne sont plus suffisantes. Les campagnes devant être de plus en plus personnalisées (à l’individu, au canal, produit ou marché…) et le temps propice à la conversion en acte d’achat de plus en plus cours, il est indispensable de réagir en quasi-temps réel, voire de devancer l’acte d’achat par des campagnes innovantes.

Sur ces usages avancés, l’intelligence artificielle peut être utilisée pour automatiser la génération de campagnes ultra-personnalisées ayant un impact significatif sur le taux de conversion.

Nos retours d’expériences et connaissance des leviers technologiques à mettre en œuvre nous amène à évaluer et accompagner la transformation data marketing de nos clients sur quatre domaines clés :

  • Campaign intelligence : pour améliorer votre taux de conversion ;
  • E-boutique intelligence : pour améliorer votre CPA (cost per action) ;
  • Product intelligence : pour améliorer votre CSAT, NPS et réduire le churn ;
  • Consumer intelligence : pour optimiser votre CLV.

Vous souhaitez comprendre votre état de maturité et opter pour la bonne stratégie Data Marketing ? Rencontrez notre expert qui vous aidera à établir une démarche appropriée pour gérer vos données, identifier les cas d’usages prioritaires et réussir l’intégration de solutions d’intelligence artificielle.

Rédigé par Tanasit Mahakittikun, Responsable Data Marketing au sein de notre département Data Driven

Quels que soient leurs tailles et domaines d’activités, quasiment toutes les entreprises ont placé l’utilisation de la donnée au cœur de leur stratégie. Pourtant, très peu d’entre elles ont réussi à faire le lien entre la définition d’une stratégie “Data-Driven” théorique et sa mise en application concrète sur le terrain.

Dans un précédent article (accessible via ce lien), nous avions décrit les freins à l’épanouissement des usages de la donnée dans les organisations et mis en évidence que ces derniers étaient principalement d’ordre culturel. Cet état de fait, aux côtés de nos différents retours d’expérience, ont forgé notre conviction qu’il est nécessaire d’intégrer une démarche inclusive dans la mise en place de projets Data.

Pour ce faire, nous avons développé un framework particulièrement performant pour satisfaire cette inclusivité : le Data Thinking. S’inspirant du Design Thinking – méthodologie présentée dans la section suivante, le Data Thinking est détaillé dans cet article, notamment son principe, ses objectifs, ses avantages, ses méthodologies et ses outils.

Qu’est-ce que le Design Thinking ?

Le Design Thinking est une méthode de gestion de l’innovation développée par Rolf Faste dans les années 1980. Il place l’utilisateur au centre des réflexions – selon une approche “user-centric” –, qui sont menées par des équipes représentant la diversité des disciplines mobilisées par la problématique étudiée.

Suivant une succession d’étapes et d’ateliers, l’objectif est d’aboutir rapidement à un prototype reflétant la priorisation des idées générées collectivement. Les principaux ingrédients du Design Thinking sont : l’empathie, la créativité, la co-création, l’itération, le prototypage, le bon sens et surtout l’intelligence collective.

Qu’est-ce que le Data Thinking ?

Le Data Thinking repose sur de jeunes notions. Le terme apparait pour la première fois en 2013 dans un ouvrage de Mario Faria et Rogrio Panigassi. Son ambition est de conjuguer la valorisation des données et les réflexions sur l’expérience utilisateur portées par le Design Thinking. Cette méthodologie se déploie dans un cadre Data holistique – c’est-à-dire à multi-dimensions et échelles.

Nous l’avons évoqué, les valeurs du Design Thinking sont particulièrement pertinentes pour adresser les freins culturels à l’adoption à échelle de la Data. De fait, le Data Thinking permet de co-construire des trajectoires créatives intégrant de nouvelles technologies et/ou de nouveaux usages s’appuyant sur les données et l’intelligence collective.

Selon une approche globale (métier, organisationnelle et technique), elle met les consommateurs et problématiques business au cœur de la Data pour accélérer la valorisation des données (à l’appui de la gouvernance de la donnée, de la business intelligence, de la data science…).

Les objectifs du Data Thinking

Le Data Thinking peut se décliner en une série d’objectifs couvrant les dimensions qu’il recouvre :

  • Identifier les processus business pouvant bénéficier d’une valorisation des données et renforcer ainsi l’empreinte fonctionnelle des solutions envisagées s’appuyant sur des leviers techniques ;
  • Détecter et qualifier les périmètres de données exploitables (accessibilité, représentativité, fiabilité, complétude…) ;
  • Anticiper et adresser les éventuels freins techniques sur la collecte et le traitement des données, et l’éventuelle phase de modélisation ;
  • Explorer les assets Data pour préciser d’éventuelles intuitions business ;
  • Définir dès le début d’un projet les KPIs qui permettront de valider l’approche et mesurer l’impact associé ;
  • Décrire les décisions et actions qui peuvent être menées consécutivement dans le prolongement de la démarche ;
  • Faciliter et planifier le cycle de vie des projets, depuis la phase initiale d’idéation et de cadrage (s’appuyant sur le Data Thinking) jusqu’à l’exploitation durable de produits.

Comme précédemment évoqué, il faut insister ici sur l’importance d’adopter une approche holistique, au-delà des seuls aspects techniques et fonctionnels. Les enjeux du business, des données, des technologies et des algorithmes y seront discutés, aux côtés des enjeux de stratégie et de leadership, des compétences et des rôles, de la culture et des méthodes de travail, des modèles opérationnels et des processus associés (coordination, communication, interfaces, etc.), des gestions de communautés…

C’est l’écosystème qu’il faut considérer dans son ensemble pour garantir des fondations solides aux projets qui émergeront de cette démarche.

Les avantages du Data Thinking

Voici une liste non-exhaustive des principaux bénéfices notables du Data Thinking :

  • Contribue à la définition d’une vision globale et éventuellement d’une roadmap ;
  • Améliore la satisfaction des utilisateurs de données et de l’utilisateur final ;
  • Réunit les parties prenantes, leurs compétences et les composantes d’un projet Data dès les prémices de projets ;
  • Concrétise rapidement les projets, permettant de tester les résultats et obtenir des feedbacks dans des délais courts ;
  • Sécurise la démarche à moindres risques (investissement sur des temps courts) via une approche  systématique et standardisée pour couvrir un maximum de problématiques et réduire les angles morts ;
  • Couvre tant des enjeux qualitatifs, notamment via le processus d’idéation stimulant l’innovation, que quantitatifs grâce à des chiffrages viabilisant les perspectives ;
  • Met en place une logique d’amélioration continue pour l’exploitation des données d’une entreprise grâce à la capitalisation de ses précédentes tentatives à un niveau transversal ;
  • Crée des données “intelligentes” et “intelligibles” en combinant les enrichissements qu’apportent la machine avec l’entendement humain.

Ensemble réunis, ces éléments contribuent au renforcement de l’adoption de la culture Data au sein des organisations et favorise la réussite des projets de valorisation de données.

La méthodologie et les outils du Data Thinking

Notre méthodologie de Data Thinking s’appuie sur sept étapes qui ont naturellement des points communs avec celles du Design Thinking. Elles prennent la forme d’une succession d’ateliers accueillant les représentants de toutes les parties prenantes, selon l’ordre suivant :

Comprendre

Il s’agit de comprendre le contexte business dans lequel s’inscrit la démarche. Comment ? En collectant les retours des parties prenantes, en réalisant des ateliers d’analyses (espoirs et craintes, carte des intervenants, cartes de l’empathie des personaes, recherche et parcours utilisateur) ou en vulgarisant le rôle et les usages de la Data auprès des participants non-techniciens. L’objectif est d’aligner la compréhension des problématiques métiers envisagées avec de nouvelles perspectives et des leviers Data activables dans l’absolu.

Observer

Les différentes ressources disponibles voire non-disponibles mais nécessaires sont explorées au cours de cette phase. Pour les données par exemple, cela peut prendre la forme d’un atelier de cartographie ou d’une étude des solutions clé-en-main disponibles sur le marché. Les éléments contextuels découlant de la phase « Comprendre » et « Observer » alimentent la Carte Environnement.

Idéer

Cette étape est critique : l’objectif est de « brainstormer » pour produire des idées à l’aide de techniques d’idéations inspirées de l’existant, de l’état de l’art, de l’expertise des « Data practitioners » et de notre accompagnement.

Prioriser

Il s’agit de faciliter le processus de priorisation de la solution en s’appuyant sur des critères de désirabilité, faisabilité et viabilité. Pour cela, notre Matrice de Priorisation permet d’identifier visuellement les opportunités à privilégier selon ces critères.

Définir

Une fois la solution identifiée, il faut définir les briques qui la constitueront. Par exemple, il est possible de réaliser un proto-data model représentant les données exploitées au long des traitements et le lineage correspondant. Il est également nécessaire d’identifier les KPIs qui permettront de mesurer le succès de la démarche et suivre les résultats (procéder si nécessaire à une analyse de coût bénéfice). Tous les composants sont référencés dans le template de Fiche d’Identité Solution.

Prototyper

Grâce à la précision des constituants de la solution, il s’agit de créer un prototype de celle-ci pour décrire explicitement à quoi correspondrait un MVP. La question des interfaces est particulièrement importante dans cette démarche (tableau de bord, data viz…). L’implémentation du prototype se fait dans une démarche lean et peut être complétée d’un story board.

Tester

En s’appuyant sur le prototype, il s’agit de simuler l’exploitation de la solution devant conduire à des prises de décisions et actions s’inscrivant dans des scénarios. Cette étape consiste aussi à projeter l’exploitation des KPIs et le pilotage de la solution. Les tests sont réalisés avec les parties prenantes cibles pour qu’elles puissent s’approprier la solution et formuler des retours. Le livrable type est un portefeuille de scénarios d’usages et une grille de retours des testeurs.

Pour garantir le succès de ce parcours pragmatique et prolifique, nous avons mis en place des outils standardisés permettant de structurer qualitativement et accélérer efficacement son déroulement. Notre méthodologie est adaptable à tout contexte, et selon les particularités de l’écosystème concerné il est possible de réduire comme d’augmenter tout ou partie du programme. Par exemple, les étapes de prototypage et de testing peuvent être omises dans la démarche de Data Thinking pour être plutôt envisagées dans une démarche en aval, au sein d’une méthodologie Lean Data dans le cadre d’un PoC.

Intégrer le Data Thinking dans une démarche globale

Puisqu’elle permet d’identifier de nouvelles opportunités de valorisation de données, au sein d’une démarche inclusive, cette méthodologie doit s’inscrire dans une dynamique macroscopique décrivant le cycle de vie des projets ou produits, ainsi que la gestion globale de ces assets au niveau de l’organisation. L’adoption à l’échelle d’une culture Data et de ses artefacts n’en est que renforcée.

Le Data Thinking permet de formaliser et prioriser des opportunités ; il faut ensuite les convertir en produits. Il est important d’aborder cette phase avec de la rigueur et des éléments structurants, en mettant en place une démarche de Product Thinking par exemple. Cette séquence sera elle-même suivie d’une phase d’industrialisation répondant aux enjeux opérationnels (DevOps, DataOps, MLOps…).

Une vision translationnelle garantit donc le succès des projets Data ; c’est l’une des valeurs constituant le cœur de l’accompagnement que Saegus propose à ses clients. À ce titre, cette démarche s’applique parfaitement au contexte du Data Marketing, ce qui nous a permis de formaliser une offre dédiée à ses enjeux.

Vous souhaitez en savoir plus ?

Rédigé par Clément Moutard, Manager au sein de notre département Data Driven

Saegus a l’honneur d’annoncer en ce début d’année 2023 un nouveau partenariat avec l’un des principaux acteurs du cloud : Google Cloud.

Martin Alteirac, Responsable des offres Intelligence artificielle chez Saegus, nous présente les coulisses de la mise en place de ce partenariat et les nouvelles perspectives qu’il offre à Saegus et ses clients.

Pourquoi conclure un partenariat avec Google Cloud aujourd’hui ?

Ce partenariat avec Google Cloud acte la montée en compétences, entamée il y a plusieurs années déjà, de nos équipes sur les technologies Google Cloud. Nos data engineers, data scientists et data analysts accompagnent au quotidien nos clients sur les technologies Google Cloud. Il était donc naturel pour nous de chercher à concrétiser nos expertises technologiques par un partenariat.

Comment se matérialise ce partenariat ?

Nous allons amplifier la dynamique de certification de nos équipes : notre objectif est évidemment de continuer à faire monter en compétences les plus experts d’entre eux sur les technologies les plus pointues mais aussi d’augmenter la part de nos équipes formées aux produits Google Cloud, pour accroître nos capacités à répondre aux besoins de nos clients et ceux de Google.

Nous adaptons également notre portefeuille d’offres à l’environnement Google Cloud pour permettre aux clients de Google de profiter de nos expertises techniques (modernisation de stacks technologiques data, gouvernance des données ou intelligence artificielle) et de notre expérience en gestion de projets plus stratégiques comme l’optimisation des opérations, la monétisation des données ou le data marketing.

Quelles sont les perspectives à plus long terme ?

Notre objectif à long terme est d’aider nos clients à concilier deux tendances de fond qui peuvent sembler contradictoires au premier abord :

  • L’accélération des usages de l’IA, comme en témoigne l’intérêt grandissant des entreprises pour l’IA générative (ChatGPT…) ou les avancées régulières et significatives dans le domaine de l’informatique quantique ;
  • L’urgence écologique qui nous presse à engager la transformation des entreprises vers un modèle plus durable et nous oblige collectivement à nous poser la question de l’empreinte écologique de ces technologies.

Nous sommes persuadés que le cloud est un outil indispensable pour concilier l’augmentation de la consommation de technologies tout en optimisant l’empreinte écologique des entreprises, notamment celles s’étant engagées dans un plan de mesure et réduction de leurs émissions de gaz à effet de serre.

En tant qu’acteur de référence sur la data, ce partenariat avec Google Cloud acte de notre capacité à accompagner un nombre grandissant d’entreprises à relever leurs défis d’aujourd’hui et de demain.

Vous souhaitez en savoir plus sur notre capacité à accompagner vos projets stratégiques sur Google Cloud ?

Rédigé par Martin Alteirac, Responsable Intelligence artificielle au sein de notre département Data Driven

Des champs d’application bien différenciés

Les mots “corrélation” et “causalité” sont souvent utilisés de manière égale, bien qu’ils aient des significations très différentes.

  • La corrélation indique une relation : deux variables sont corrélées lorsqu’elles affichent une tendance à la hausse ou à la baisse.
    Exemple : la consommation de mozzarella est corrélée au nombre de doctorats en ingénierie civile, mais l’un n’est sûrement pas la cause de l’autre. 
  • La causalité caractérise un lien de cause à effet. La cause est en partie responsable de l’effet et l’effet dépend en partie de la cause.
    Exemple : une nourriture trop sucrée peut être une des causes de surpoids. 

La corrélation étant une interprétation statistique déjà largement décrite, nous nous attacherons ici à partager quelques champs d’application de l’analyse de causalité, et plus particulièrement le mécanisme d’inférence causale

L’inférence causale est un processus visant à tirer une conclusion entre le lien de causalité et les conditions d’occurrence d’un effet. 

La méthode “logique” pour décrire ce processus est simple :  

  • Il s’agit dans un premier temps d’identifier le “champ des possibles”, c’est-à-dire les variables descriptives liées aux causes potentielles ; 
  • Dans un second temps, de comprendre l’influence de ces causes sur la variable d’effet (ou variable target), et plus exactement le lien de causalité à partir des conditions d’occurrence d’un effet ; 
  • Une fois ce lien établit, il est alors possible d’utiliser cette connaissance pour réaliser des analyses prescriptives

Note : rappel des niveaux de maturité  

  1. Aucune analyse : on parle ici des entreprises n’ayant pas de processus analytique en place ; 
  1. Analyse descriptive : nous permet de savoir ce qu’il s’est passé en rassemblant et visualisant les données historiques ; 
  1. Analyse de diagnostic : identifie les modèles et dépendances dans les données disponibles, c’est-à-dire explique pourquoi quelque chose s’est produit ; 
  1. Analyse prédictive : crée des prévisions probables de ce qui se passera dans le futur, en utilisant des techniques de Machine Learning pour exploiter de gros volumes de données ; 
  1. Analyse prescriptive : fournit des options d’optimisation, une aide à la décision et des informations sur la manière d’obtenir le résultat souhaité. 

Initialement les principaux champs d’application de l’inférence causale étaient scientifiques : économie, médecine, biologie, génétique, sciences sociales… Aujourd’hui, son usage se généralise pour toucher des secteurs divers comme l’industrie du jeu, le retail ou l’e-commerce, ou plus généralement les applications liées aux “jumeaux numériques” (Digital Twin) dont l’objet est de créer des simulations numériques de phénomènes complexes.

Les limites d’une démarche expérimentale

L’analyse de causalité est un domaine qui se prête particulièrement bien à l’expérimentation, dans une approche purement scientifique. 

  • Le phénomène étudié est d’abord reproduit dans plusieurs environnements dans des conditions identiques ; 
  • L’analyste/scientifique modifie ensuite dans l’un des environnements une ou plusieurs variables pour comprendre leur influence sur l’effet recherché (la variable target). 

Néanmoins, il existe en pratique de nombreuses situations où ce scénario n’est pas applicable : 

  • Si les expériences sont contraires à l’éthique (exemple : vous ne pouvez pas faire fumer un enfant pour tester si la cigarette peut être une cause de cancer infantile) ; 
  • Si la cause ne dépend pas de vous (exemple : un concurrent lance un produit et vous souhaitez mesurer son effet sur vos ventes) ; 
  • Si la réalisation de l’expérience est trop coûteuse 
  • Si le phénomène à observer est trop complexe. 

Lorsque l’expérience n’est pas envisageable, l’utilisation de la donnée est un recours indispensable – elle permet de simuler des phénomènes complexes, facilement scalables, et de manière bien moins coûteuse (ressources humaines, logistique, temps d’étude…) qu’une expérimentation plus classique. 

Note : les deux approches peuvent être combinées pour maximiser la fiabilité des résultats, et éprouver la robustesse des modèles data-driven. 

Comment implémenter un moteur d’inférence causale ?

Plusieurs méthodes scientifiques permettent de construire les relations de causalité à partir de données historiques. La plus connue est celle de « PC » (Peter & Clark), qui est basée sur un algorithme de contraintes.

L’objectif est de construire initialement un graphe entièrement connecté (modélisant toutes les relations théoriques entre les variables) et d’utiliser des tests d’indépendance conditionnelle pour simplifier le graphe causal jusqu’à ce qu’il soit cohérent avec les données observées.   

Note : Dans cette approche, l’absence de liaison entre les 2 nœuds du graphe présente également une information précieuse – il est important de déterminer que deux variables n’ont pas de lien de causalité. 

La méthode consiste à rationaliser les résultats d’exploration pour répondre à des questions spécifiques (cibler l’effet à observer). Les informations causales extraites des données brutes sont modélisées sous la forme d’un “diagramme causal”, c’est-à-dire un graphe orienté qui affiche les relations causales entre les variables du modèle. Un diagramme causal comprend un ensemble de variables (ou nœuds). Chaque nœud est relié par une flèche à un ou plusieurs autres nœuds sur lesquels il exerce une influence causale ; un niveau de probabilité de cette influence y est associé. 

Le parcours du graphe entre deux nœuds suivant des flèches causales est un “chemin”. 

Pour les phénomènes complexes, nous recommandons fortement d’utiliser des bases de données graphes, qui permettent de faciliter la modélisation, les calculs et les parcours de graphe. 

Les outils ?

Les librairies de CI (Causal Inference) connaissent une évolution rapide avec de plus en plus de librairies disponibles et une meilleure intégration dans les systèmes d’information « data-driven ».  

Ci-dessous, une liste non-exhaustive des outils que nous recommandons : 

  • Dowhy, une librairie de CI récemment publiée par notre partenaire Microsoft 
  • Causal ML 
  • CausalNex 
  • EconML 
  • causalImpact

Base de données graphe fréquemment utilisée : 

  • Neo4j 
  • Cosmos DB avec l’API Gremlin 

Pour aller plus loin

Attention à l’industrialisation ! 

Comme souvent dans les projets d’intelligence artificielle, il y a un monde entre l’expérimentation sur un sous-ensemble et la capacité à l’automatiser et le rendre scalable sur des données réelles, qui plus est lorsque le phénomène est complexe (ex. Digital Twin pour l’industrie 4.0). 

Notre recommandation est d’intégrer à l’équipe un ingénieur MLOps dès les phases amont pour éviter de se retrouver in fine avec une expérimentation prometteuse mais non-scalable.

L’interprétabilité des algorithmes d’IA : un usage en plein essor  

L’application de l’IA à des usages règlementés (manipulation de données personnelles, octroi de crédits, fraudes…) nécessite un certain niveau de transparence dans la manière dont l’algorithme produit un résultat. 

La transparence et la traçabilité des modèles est un nouveau champ d’application pour les moteurs d’inférence causale. 

Nos experts ont créés à cet effet l’offre “Reliable ML“ : n’hésitez pas à nous contacter pour en savoir plus. 

Rédigé par Alexander Mikheev, Lead Tech Engineer au sein de notre département Data Driven

La sortie de crise Covid, combinée à la guerre en Ukraine a généré une inflation massive, amplifiée par la reprise économique, une relance budgétaire massive, des pénuries sur certaines matières premières et une tension sur le marché énergétique.

Cette inflation, estimée à 6,5% en France depuis un an, est compliquée à objectiver et mesurer tant elle touche de manière inégale les pays et secteurs. Les entreprises sont confrontées à une difficulté majeure : comment acheter au prix juste dans un contexte d’inflation généralisé ? Comment anticiper les effets de cette inflation sur l’activité des mois à venir ?

Martin Alteirac, Responsable Data for Sustainability chez Saegus, nous explique comment les directions procurement peuvent contribuer, en exploitant mieux leurs données, à minimiser les impacts de l’inflation sur la performance de leur entreprise.

Quelles données les entreprises peuvent-elles utiliser pour objectiver l’inflation ?

Les directions achats ont la chance de disposer pour la plupart d’une source de données critique : leur ERP (Enterprise Resource Planning). L’ERP stocke l’historique de la donnée nécessaire pour déterminer ce qu’une entreprise achète, à qui et où elle l’achète, et évidemment à quel prix. L’exercice n’est pas évident pour les entreprises, qui exercent souvent une activité globale dont les fournisseurs sont répartis dans le monde entier.

Cette première étape permet de construire une cartographie macroscopique des achats de l’entreprise et lister les principales catégories de produits, ou matières premières, ainsi que leur provenance. Cette étape est importante car elle permet d’identifier les types de données nécessaires pour mesurer l’impact de l’inflation dans ces pays. Elle permet également d’identifier les principaux marchés (combinaison d’une catégorie de produit et d’un pays de provenance) intéressants à vigiler.

Pour préciser la mesurer de l’inflation, il est intéressant de déterminer si d’autres sources de données peuvent être récupérées – par exemple, si l’entreprise stocke les offres de prix de ses fournisseurs avant même que les commandes soient passées.

Enfin, il est intéressant de mesurer l’impact potentiel de l’inflation sur les prix payés sur un marché en particulier. Si une partie de l’évolution des prix de vente est liée à des facteurs attribuables à l’inflation (évolution du coût des matières premières, coût du travail, coût de l’énergie…), ce n’est jamais le seul driver – l’équilibre de l’offre et la demande ou une situation concurrentielle sont par exemple des facteurs d’influence essentiels. Il est donc fondamental de réserver ce type d’exercice à des marchés au sein desquels l’évolution du prix payé est principalement liée à celui du coût de production (présence de la concurrence, équilibre entre l’offre été la demande, marges stables).

Une fois ces données internes collectées, il faut donc collecter des données économiques permettant la mesure de l’inflation ?

C’est effectivement l’étape suivante. En fonction du secteur d’activité de l’entreprise concernée, il faut identifier un ou plusieurs fournisseurs de données permettant de consulter en temps réel les données relatives à l’évolution des drivers de coûts dans les pays concernés.

Par exemple, si vous achetez du câble de cuivre en Indonésie, vous pouvez identifier les principaux indices ayant un impact sur son coût de fabrication dans le pays étudié : les salaires dans l’industrie, le coût de l’énergie, le coût du cuivre…

Les fournisseurs proposent en général des modèles de coûts associant ces indices unitaires pour reconstituer un modèle représentant l’évolution théorique des coûts de production, produit par produit.

Une fois ces données récoltées, il est alors possible de comparer l’évolution des prix payés à l’évolution du modèle de coût associé, donc d’objectiver l’impact réel de l’inflation dans l’évolution des prix proposée par le fournisseur. Ce type d’indice étant aussi disponible sous forme de forecasts, il est possible de réaliser des projections sur les prochains mois voire les prochaines années, même si le contexte actuel pousse à la prudence.

Ce type de mécanisme permet ensuite d’estimer l’évolution du prix d’achat d’un produit en fonction de l’évolution attendue de ses principaux drivers de coûts, tout en donnant une marge d’erreur sur cette prédiction.

Concrètement, par quel type d’outil ce type de démarche peut-il se matérialiser ?

La première étape constitue à vérifier que l’entreprise dispose de données suffisamment précises pour réaliser ce type d’étude. Cette étape permet en général de fixer un premier périmètre à adresser : une ou plusieurs familles de produits ayant une origine géographique claire.

Une fois que cette première étape est franchie, on construit une matrice associant à chaque couple (produit/provenance) un modèle de coût. Ce modèle est constitué d’une liste d’indices, auxquels sont associés un poids. Une fois que cette matrice est constituée, l’évolution des prix peut être comparée à l’évolution du modèle de coût associé. Il est alors possible d’identifier parmi les fournisseurs :

  • Ceux qui surperforment : dont l’évolution des prix est inférieure à celle de l’inflation théorique liée à l’augmentation de leurs coûts ;
  • Ceux qui sous-performent : dont l’évolution des prix est plus importante que l’inflation.

On va également être capable de produire des prévisions d’évolution des prix des produits en se basant sur les prédictions d’évolution des coûts de production de ces produits.

Il y a ensuite deux manières d’exploiter cette donnée :

  • La première est de l’injecter dans les systèmes d’information existants de l’entreprise. Si vous vous apprêtez à analyser les offres de prix de vos fournisseurs, il est intéressant de disposer d’une estimation du prix cible qui permet automatiquement d’évaluer la pertinence du prix proposé ;
  • La seconde est de développer des tableaux de bord interactifs analysant ce type de données de manière à la fois macro et micro, sur plusieurs types de produits et dans plusieurs pays. Il est ainsi possible de naviguer au sein des données pour faire des analyses à la carte.

L’intérêt de cette seconde approche est d’accéder à une information détaillée utilisable en phase de négociation financière. Si l’un de vos fournisseurs cherche à justifier l’augmentation d’un de ses prix par l’augmentation du coût de l’énergie ou d’une matière première à un certain pourcentage, il vous sera possible d’accéder en quelques clics à une information fiable permettant, le cas échéant, de contrer ses arguments si les hausses annoncées ne sont pas réelles ou si leur impact sur le coût de production est marginal.

Vous souhaitez découvrir comment la data peut outiller votre fonction achat ? Contactez nos expert·e·s.

Rédigé par Martin Alteirac, Responsable Data for Sustainability au sein de notre département Data Driven

Alors que la crise COVID perturbe encore l’économie mondiale, notamment en Chine qui continue à imposer régulièrement des confinements, la crise ukrainienne a déclenché une forte tension et envolée des prix sur les marchés de l’énergie. Dans un même temps, la lutte contre le réchauffement climatique devient une préoccupation majeure de la société, comme l’illustre la multiplication des règlementations sur le sujet.

Un secteur est particulièrement touché car souvent électro-intensif : l’industrie. Pour les industriels, disposer d’une énergie fiable et bon marché est une impérieuse nécessité. Dans un contexte où la disponibilité du parc nucléaire français est mise à mal par des problématiques de maintenance, le prix élevé de l’énergie et risque de pénurie fait peser sur lui une menace importante.

Martin Alteirac, Responsable Data for Sustainability chez Saegus, nous explique comment les industriels peuvent adopter une démarche data driven pour optimiser leur consommation énergétique, réduire leurs émissions de gaz à effet de serre et in fine assurer leur performance économique.

Quel est l’impact de la crise énergétique en cours sur l’industrie ?

Son impact est massif car cette crise, liée à la baisse de l’offre dans un contexte de reprise mondiale de la demande, a pour effet d’augmenter les prix de l’énergie et faire peser sur les entreprises le risque de coupures.

Tout d’abord, il faut se rendre compte que les prix de gros sur les marchés de l’électricité ont été multipliés par 10 entre le premier trimestre 2019 et le dernier trimestre 2022. Évidemment, il est probable que cette hausse massive ne soit qu’un pic à passer, mais les analystes prédisent que les prix de l’énergie resteront durablement à des niveaux élevés : il est probable que le monde post COVID soit un monde ou l’énergie restera près de quatre fois plus chère qu’elle ne l’était auparavant.

Pour l’industrie, un chiffre suffit à mesurer l’impact de cette hausse : pour un industriel dont l’énergie constituait 20% du coût de production avant la crise, cette même énergie représentera demain 50% de son coût de production, engendrant une augmentation de 60% de celui-ci.

Ensuite, sur la disponibilité : alors que les premières températures négatives sont annoncées et que le gouvernement annonce que des plans de délestage (de coupures) sont à l’étude, il est évident que la hausse des prix ne permettra même pas de garantir la disponibilité de l’énergie. C’est une contrainte insurmontable pour un pan de l’industrie qui a besoin de fonctionner en continu pour des raisons de process industriel (aciérie, verrerie…) ou de contraintes en matière de respect de la chaine du froid (industrie agroalimentaire et pharmaceutique).

Pour faire face à ces deux difficultés, la sobriété énergétique est une réponse efficace car elle permet de limiter le risque de pénurie et l’impact économique de cette hausse des tarifs.

Pourquoi sobriété énergétique et décarbonation sont-ils souvent abordés de concert ?

La première raison est mathématique : l’énergie représente (en moyenne) plus de 50% de l’empreinte carbone de l’industrie. Optimiser sa consommation énergétique est donc un moyen très efficace de diminuer son empreinte carbone. L’impact d’une démarche de réduction de consommation énergétique sur l’empreinte carbone dépend néanmoins du mix énergétique de l’industrie concernée.

Son impact est maximal lorsque l’énergie utilisée est majoritairement d’origine fossile : gaz évidemment, mais aussi pétrole même si celui-ci se fait (heureusement) de plus en plus rare. Lorsque l’énergie utilisée est majoritairement électrique, l’impact dépendra alors de l’intensité carbone de l’électricité. Sur cet aspect des disparités importantes existent au niveau mondial et européen.

En France sur les 12 derniers mois, l’intensité carbone était de 117g de CO2 par kwh d’électricité, que l’on peut comparer à quelques autres pays :

  • L’Allemagne : 513g/kwh
  • La Pologne : 875g/kwh
  • La Suède : 21g/kwh
  • Les États Unis : 522g/kwh
  • La Chine : 766g/kwh

En fonction de l’énergie utilisée et de la localisation de la production, l’impact d’une réduction de la consommation énergétique sur l’empreinte carbone sera donc à quantifier précisément.

Une autre raison poussant les entreprises à mutualiser ce type d’initiatives tient à l’autre inflation, règlementaire cette fois, qui demande aux industriels des efforts sur leur consommation énergétique mais également sur leurs émissions de gaz à effet de serre.

La stratégie nationale bas carbone prévoit une diminution des émissions de gaz à effet de serre de près de 35% à l’horizon 2030, ce qui nécessite de réduire tous les ans ces émissions de 3,5%.

Enfin, la dernière raison qui pousse fréquemment à travailler ces sujets de concert tient aux dispositifs de financement permettant d’optimiser le retour sur investissement de projets d’optimisation de la consommation énergétique industrielle. Des fonds sont mis à disposition par l’État dans le cadre du plan France Relance pour décarboner l’industrie, fond qui sert souvent à financer des projets de réduction de la consommation énergétique.

Comment la data peut-elle permettre de réduire sa consommation énergétique et ses émissions de gaz à effet de serre ?

Mesurer la consommation énergétique d’un site industriel avec la finesse nécessaire pour identifier des pistes d’optimisation concrètes et activables n’est pas aisé. Une grande partie des équipements industriels ne sont pas encore connectés voire ne produisent aucune donnée. Il faut donc commencer par identifier les données disponibles et mettre en place ou moderniser les systèmes de récupération, stockage et valorisation de ces données.

Ce dispositif de mesure permet d’abord d’objectiver le point de départ. Une fois cette étape franchie, il devient alors possible d’identifier les postes et les types de production les plus consommateurs. Deux types d’actions peuvent être mises en place :

  • Modernisation ou remplacement de certains équipements du process de production ;
  • Optimisation du process de production : une modification de la stratégie d’ordonnancement ou du réglage du process.

Plus largement, une mesure granulaire en temps réel permettra d’intégrer le critère énergétique, voire le critère carbone, dans l’organisation des opérations.

Enfin, ce dispositif de mesure est essentiel pour mesurer l’impact réel des actions mises en place en permettant de comparer rapidement la réalité des économies réalisées par rapport à celles espérées. Cette mesure est essentielle pour mettre en place une amélioration continue de la performance énergétique, dynamique indispensable pour atteindre chaque année l’objectif de 3,5% d’économies d’énergie fixé par les pouvoirs publics.

Vous souhaitez découvrir comment la data peut vous permettre de mesurer et réduire votre consommation énergétique et vos émissions de gaz à effet de serre ?

Visionnez notre dernier webinar sur le sujet :

Rédigé par Martin Alteirac, Responsable Data for Sustainability au sein de notre département Data Driven

La recherche de valeur, le but ultime

Nouveau paradigme pour les architectures de données, le Data Mesh bouscule les modèles inventés et mis en œuvre ces dernières années qui reposent sur une approche fédératrice et centralisée des données.

Cette recherche de centralisation a pour objectif de casser les silos et stocker dans un espace commun les données pour en tirer un maximum de valeur et permettre de croiser des informations issues de différents domaines métiers. Elle a ainsi conduit à la création de Data Warehouses ou plus récemment de Data Lakes afin de rassembler les données de l’entreprise au sein d’une structure unifiée.

Le Data Mesh introduit une nouvelle approche et une rupture avec le modèle de centralisation, en tirant parti des silos et en s’appuyant sur une organisation distribuée en réponse aux enjeux Data à l’échelle de l’entreprise.

Dans la mise en place d’une stratégie Data-Driven, les freins majeurs rencontrés par les entreprises pour passer à l’échelle sont souvent liés à une maturité Data hétérogène et à une organisation complexifiant les échanges. La recherche de centralisation au sein d’une architecture de type Data Warehouse ou Data Lake devient alors un goulet d’étranglement.

Le Data Mesh répond aux problématiques courantes liées à ces architectures, à savoir :

  • Le manque de connaissance métier au sein des équipes IT qui gèrent les données, ce qui entrainent parfois des incompréhensions et souvent des échanges multiples avec les équipes métiers, ralentissant fortement les processus ;
  • Un manque de flexibilité des plateformes de données centralisées qui conduit parfois à des solutions technologiques complexes ne pouvant répondre parfaitement à l’ensemble des spécificités ;
  • Une complexité et une latence forte dans la gestion des flux de données, chaque demande métiers nécessitant l’intégration des données dans l’architecture centralisée, rigidifiant cette dernière afin de répercuter les changements à tous les niveaux de la chaine de traitement.

La réponse ordinaire de centraliser pour mieux traiter n’est finalement pas la meilleure solution. Le Data Mesh apporte une nouvelle approche : ne pas lutter contre les silos mais s’appuyer dessus pour en tirer parti. Le but n’est pas de revenir à une vision complètement décentralisée mais d’adopter une approche fédérée pour conserver la maitrise du patrimoine informationnel de l’entreprise.

Le Data Mesh en quelques mots

Le Data Mesh repose donc sur une approche décentralisée ou distribuée équivalente à l’approche microservices dans l’architecture logicielle.

La notion de Data Mesh a été évoqué pour la première fois par Zhamak Dehghani (Monolithic Data Lake to a distributed Data Mesh) et a évolué pour devenir un concept établi. Il a fait l’objet d’une publication de référence en début d’année (Data Mesh, O’Reilly).

Logical architecture of Data Mesh Approach (martinfowler.com)

Le Data Mesh ne se résume pas à un concept technique ni à l’implémentation de briques technologiques. Il couvre l’étendue du spectre du Data Management et ses composantes, à savoir : organisation, compétences, méthodologies, gouvernance, architecture… Le Data Mesh se compose d’ensembles d’éléments appelés domaines de données. L’interconnexion de ces domaines formant ainsi le maillage (mesh) permet de donner une vision d’ensemble des informations métiers.

La notion de passage à l’échelle est un élément central et fournit un cadre de réponse aux freins pouvant être rencontrés. Par son approche globale, le Data Mesh constitue donc une approche adaptée pour répondre aux besoins de la stratégie Data-Driven :

  • Les réponses aux demandes de changement doivent être rapides : les modèles de données doivent pouvoir être modifiés rapidement et s’adapter aux besoins d’évolutions ;
  • Le nombre de producteurs de données est en évolution constante : nouvelles applications, nouvelles API…
  • Le nombre de consommateurs de données est en augmentation constante : nouvelles initiatives Data, nouveaux besoins métiers, augmentation des usages IA…

Le Data Mesh repose ainsi sur quatre grands piliers : Domaine, Produit, Plateforme et Gouvernance.

Les quatre piliers du Data Mesh
  • Data Domain : la connaissance est distribuée dans les différents domaines de données (dérivé du Domain Driven Design (DDD) d’Eric Evans). Les métiers, responsables des domaines, sont autonomes et responsables du pilotage de leurs initiatives Data ;
  • Data as a product : la donnée est gérée au sein des domaines comme un produit (Data Product). Avec le Data Mesh, les données deviennent le produit. Il revient à chaque domaine de données de mettre à disposition des produits tenant compte de leurs utilisateurs, leurs caractéristiques spécifiques et leur roadmap de développement. Ces produits sont fournis sous un format standardisé pour être utilisés à travers l’organisation ;
  • Self-service Data Infrastructure as a Platform : une infrastructure self-service est mise en place pour gérer ces Data Products. Le Data Mesh nécessite la gestion d’une plateforme interopérable pour l’ensemble des domaines de données. Cette mutualisation vise à permettre aux différents domaines de provisionner des ressources techniques à la demande pour la création des Data Products. L’objectif recherché est de rationaliser le socle technique et les technologies utilisées à travers l’organisation ;
  • Federated Data Governance : une gouvernance fédérée autour de la donnée est mise en œuvre : la gouvernance des données porte de nombreux enjeux et particulièrement l’interopérabilité entre les domaines. La gouvernance permet de gérer les normes réglementaires et de sécurité de l’information, ainsi que le dictionnaire des données. Les domaines ont pour responsabilité de documenter les données et produits mis à disposition. La gouvernance est donc pilotée de manière hybride avec des responsabilités distribuées et fédérées.

Le Data Mesh redistribue les rôles et responsabilités au sein des entreprises

Le Data Mesh intègre en son sein aussi bien les sujets d’architecture, d’organisation, de méthodologie et de gouvernance dans un but commun : intégrer les composantes et acteurs de l’entreprise sur les enjeux de valorisation des données en tant qu’actif stratégique. Il repose sur une organisation Data distribuée et fédérée et nécessite l’implication de l’ensemble de l’organisation avec un sponsoring fort de la Direction et des directions métiers et fonctionnelles (y compris IT).

Pour les métiers, l’approche Data Mesh leur permet d’acquérir autonomie, agilité et responsabilité dans la création de leurs produits Data, la gestion de leur cycle de vie et la gouvernance des données.

Pour la DSI, sa transformation opérée ces dernières années en tant que fournisseur de services IT se renforceavec la responsabilitéde fournir et opérer une plateforme modulaire, interopérable permettant la mise à disposition d’assets communs. Dans cet approche les solutions cloud et de virtualisation des données constituent des approches d’architecture particulièrement adaptées au Data Mesh. La DSI joue donc un rôle essentiel en étant garant de la modernisation, l’agilisation du SI et de l’apport des innovations technologiques (apportées notamment par les solutions Cloud).

Pour le Data Office, il joue un rôle central d’animation, d’acculturation et de fédération des initiatives Data. Il accompagne la démarche de mutualisation des données, la coordination des actions et la mise en oeuvre de la gouvernance. Le Data Office est donc la tour de contrôle de la fonction Data transverse de l’entreprise et en charge du maintien de la cohérence globale.

Le Data Mesh, une rupture fédératrice

Le Data Mesh apporte une rupture totale avec le dogme Data-Centric qui a porté les réflexions d’architecture et d’organisation Data ces dernières années, mais à laquelle les entreprises se heurtent avec l’explosion des données et les limites en termes de création de valeur et de passage à l’échelle.

Le Data Mesh apporte une approche globale au service de l’entreprise Data-Driven, contrairement aux approches purement technologiques. L’agilité dans la création de produits Data et leur mutualisation donne l’opportunité de raccourcir le time-to-market pour les métiers et leur permet de répondre plus rapidement aux exigences internes ou du marché.

Le Data Mesh réunit donc les éléments nécessaires pour une stratégie Data-Driven réussie :

  • Une approche globale (méthodologie, technologie, architecture…) ;
  • Une répartition et une gestion des compétences Data dans les différents Data domaines ;
  • Une plus grande autonomie des métiers pour la gestion et la valorisation de leurs données.

L’ensemble de ces éléments réunit autour des quatre piliers du Data Mesh :

  • Une organisation en Data Domain métiers ;
  • La création de Data Products ;
  • La mise en place d’une plateforme technologique fédérée ;
  • Une gouvernance des données distribuée et fédérée.

Ils font écho à l’approche de Saegus et sa proposition de valeur sur la modernisation de plateforme de données sur l’ensemble de ces composantes techniques, méthodologiques et organisationnelles. N’hésitez pas à nous contacter pour en savoir plus.

Rédigé par Julien Ayral, Directeur Data Driven

En dehors de quelques start-ups ou spécialistes de la tech, les usages de l’intelligence artificielle se sont développés de façon moins spectaculaire que ce qui était attendu il y a quelques années. On constate une prise de conscience générale sur le fait que l’intelligence artificielle n’est pas une solution magique : l’investissement est relativement couteux pour un ROI qui n’est pas toujours au rendez-vous. Transformer une entreprise Data Driven tient plus en sa capacité à disposer de données fiables (mise en qualité), partagées (gouvernance et catalogue) et utilisées par le plus grand nombre (accessibilité et acculturation) que de sa capacité à réaliser des expérimentations de Deep Learning ou Machine Learning.

Faut-il toujours croire au développement de l’intelligence artificielle dans les entreprises ?

Oui, bien sûr. Bien utilisée, l’intelligence artificielle est un accélérateur puissant pour résoudre des problématiques complexes ou générer plus d’efficacité. Toutefois, l’offre existante sur le marché n’est pas toujours lisible : faut-il aller sur des outils packagés avec des modèles pré-entrainés, choisir du sur-mesure ou utiliser des plateformes de développement dédiées aux Data Scientists comme Dataiku ? Les entreprises hésitent aussi bien sur les solutions à retenir que sur les organisations à mettre en place.

Existe-t-il des freins spécifiques à l’intelligence artificielle ?

Le point prioritaire reste la mise à disposition des données : elles doivent être accessibles, qualitatives et représentatives des phénomènes étudiés. Ce prérequis étant franchi, il reste deux autres problèmes à résoudre qui sont souvent sous-estimés :

  • L’automatisation et l’industrialisation : ou comment sortir du cadre de l’expérimentation pour mettre les services d’intelligence artificielle en production. Il convient de s’inspirer du DevOps et du Software Engineering en mettant en place un cadre MLOps et une chaîne d’intégration continue. Sans ces piliers, il est inenvisageable de faire de l’intelligence artificielle un pilier de croissance des entreprises ;
  • L’intelligence artificielle de confiance : dès lors que la finalité est opérée dans un cadre règlementaire ou éthique (RH par exemple), il est indispensable de « superviser » les modèles d’intelligence artificielle afin de les rendre transparents (mise en évidence du poids des variables dans la décision de l’algorithme). La bonne pratique à adopter – qui est notre conviction – est d’aller encore plus loin en ne se limitant pas à l’explicabilité du modèle. Il est nécessaire de superviser l’ensemble de la chaîne, notamment la représentativité des jeux d’entraînements (un algorithme qui apprend sur un jeu de données comportant des biais aura tendance à les reproduire).

Trouver les bons leviers pour maximiser l’apport de l’intelligence artificielle

La mission que s’est donnée Saegus est simple : « maximiser l’impact de l’intelligence artificielle dans les entreprises ». Comment ? À l’appui de supports :

  • Méthodologiques : la difficulté n’est pas de trouver des cas d’usages, mais de trouver les bons. Pour cela, nos équipes identifient les « Deep Use Cases » ayant un impact mesurable sur les fonctions de l’entreprise : opérations (Supply Chain, logistique, Demand Forecasting), procurement, ressources humaines, Sustainability… ;
  • Technologique : nos équipes apportent une prise de recul nécessaire pour recommander les bonnes solutions à leurs clients en fonction du contexte, de la maturité et de la constitution des équipes, ainsi que de leur écosystème technique ;
  • Organisationnel : en fonction de la taille de la culture et du modèle d’entreprise (centralisé ou décentralisé, répartition des activités entre les équipes core et les domaines métiers), nos experts aident les entreprises à structurer et agiliser leurs équipes Data Science : acculturation, montée en compétences, modèles de gouvernance, collaboration et interactions entre les équipes Business et IT… ;
  • Et d’accélérateur concrets : guides pratiques, démonstrateurs, supports de formations et kits prêts à l’emploi – comme notre Starter Kit MLOPS.

Vous souhaitez en savoir plus ou être accompagnés par notre équipe Data ?

Rédigé par Alexander Mikheev, Manager Data Driven

Signes du dérèglement climatique, les conflits géopolitiques, catastrophes naturelles ou encore les difficultés d’approvisionnement de certaines denrées se multiplient. Ils semblent malheureusement nécessaire à la prise de conscience mondiale sur l’impact environnemental de nos activités, en tant que société et individu. En conséquence, les comportements évoluent : si nous sommes de plus en plus nombreux à ajuster nos comportements, ce changement de mentalité doit désormais s’appliquer à l’échelle de l’entreprise.

Cependant, réduire l’empreinte carbone d’une entreprise grâce à une meilleure gestion de sa consommation énergétique ou une optimisation de ses processus métiers n’est pas aussi simple qu’éteindre ses lumières, trier ses déchets ou limiter l’utilisation de sa voiture.

En conséquence, des réglementations sont mises en place pour aider les entreprises à mieux comprendre et maitriser leurs activités et faciliter le pilotage et l’optimisation de leur empreinte carbone. Depuis 2017, un grand nombre d’entreprises a pour obligation de communiquer sur leur performance RSE (responsabilité sociétale des entreprises), à l’appui d’un reporting extra-financier (remplaçant le rapport RSE).

Cette mesure n’est obligatoire que pour les entreprises de plus de 500 salariés et dont le chiffre d’affaires est supérieur à 40 millions d’euros pour les entreprises cotées en bourse ou 100 millions d’euros pour celles qui ne le sont pas. Toutefois, de nombreuses entreprises qui n’atteignent pas ces seuils font preuve d’initiative pour montrer l’image positive d’un groupe conscient et responsable auprès de ses clients et fournisseurs.

On ne peut que saluer ces initiatives : la conscience écologique doit être au cœur des stratégies des entreprises. Parce que les réglementations évoluent aussi vite que se dérègle le climat, ces mesures seront sans aucun doute appliquées à l’ensemble des entreprises dans les années à venir.

Comment la réglementation va-t-elle évoluer ?

Dès 2024, la CSRD – Corporate Sustainability Reporting Directive (remplaçant l’actuelle NFRD – Non Financial Reporting Directive) imposera la mise en place de nouveaux reporting extra-financiers. On estime qu’environ cinq fois plus d’entreprises seront concernées par cette nouvelle réglementation (par exemple les sociétés de plus de 250 salariés ou toutes les sociétés cotées en bourse).

Les entreprises doivent se préparer dès maintenant : c’est là que la Data entre en jeu. Afin de s’y préparer au mieux, les entreprises n’auront pas d’autres choix que de s’appuyer sur la donnée pour justifier leur conformité face au CSRD. On parle de Data Sustainability.

La Data Sustainability, un réel challenge pour les entreprises

Les lois se durcissent. Elles exigent la mise à disposition d’informations extra-financières, nécessitant plus de transparence dans le reporting et donc dans les données à identifier, collecter, préparer et diffuser. Là est la contradiction de ce système : diminuer l’empreinte carbone des entreprises tout en augmentant sa culture digitale et Data pour pouvoir y faire face.

L’hétérogénéité de la provenance des données, leur raffinement ou leur niveau de qualité est un casse-tête pour les entreprises. Cette complexité est associée à de grands challenges sous-jacents :

  • Le challenge réputationnel pour garantir des collaborations saines et durables auprès des fournisseurs, partenaires et clients, ainsi que des organismes de financement pour assurer les dépenses et la croissance de l’entreprise ;
  • Le challenge culturel de transformation de l’entreprise vers une stratégie digitale centrée sur la Data impliquant de nouvelles organisations pour répondre aux enjeux environnementaux de demain ;
  • Le challenge technologique d’implémentation de plateformes Data décentralisées en tirant parti d’une conception orientée produits, facilitant l’agilité dans la gestion, la maintenance et l’évolution des données.

Pour répondre à ces différents challenges, la mise en place d’une gestion robuste de la donnée est nécessaire. Elle doit être basée sur les 5 piliers de la gouvernance des données.

Les processus Data

Afin de garantir une maitrise des données tout au long de leur cycle de vie, il est indispensable de lancer des chantiers de cartographie des processus Data intégrant les sources internes et externes, des systèmes producteurs de données jusqu’aux systèmes consommateurs (dans l’exemple que nous prenons, jusqu’à l’utilisation des données dans les reportings extra-financiers).

La maitrise des processus Data garantit la traçabilité de la donnée, permet la mise en lumière d’éventuelles causes de non-qualité ou identifie les étapes de collectes manuelles en vue d’une industrialisation technologique.

L’organisation Data

La mise en place d’une organisation Data implique des rôles standardisés et partagés à l’ensemble de l’entreprise. À chaque rôle est affectée une fiche de poste caractérisée et reconnue en tant que position légitime par le management et les ressources humaines. Ces nouveaux rôles doivent être pilotés et accompagnés par un Data Office garant des instances de gouvernance pour assurer la cohérence et vision Data du groupe.

Cette organisation a pour objectif de faciliter les échanges entre les parties prenantes Data et garantir une collaboration étroite entre les domaines fonctionnels et la DSI coordonnée par le Data Office. Elle est indispensable à la mise sous contrôle du patrimoine de données.

La connaissance du patrimoine de données

Le patrimoine de données doit être intelligible et accessible à tous les collaborateurs de l’entreprise. Il assure la véracité et l’intégrité des données transmises lors des exercices extra-financiers. Il se décompose principalement en deux activités : le glossaire des données dans le lequel on retrouve un certain nombre d’attributs permettant de qualifier les objets métiers (définition, responsable, règle de gestion, etc). Il permet de définir un langage commun. Le dictionnaire des données, quant à lui, répertorie la localisation physique des données, les traitements associés et le type de collecte indispensable à la conception des processus Data.

Le catalogue de données apporte de nombreux bénéfices pour la capitalisation du patrimoine. Il a pour rôle d’améliorer la transparence des informations liées à la collecte des données de reporting et, dans notre contexte, prouver la traçabilité en cas d’audit.

La qualité des données

Les équipes Data sont responsables de la formation des collaborateurs aux grand principes de la qualité, aux dimensions suivies ou aux techniques de saisies de la Data. Ils sont indispensables à l’application des processus de qualité intégrant des plans d’actions correctifs et préventifs.

L’implémentation des plans de remédiation repose sur des processus de suivi itératifs à l’appui de tableaux de bord ou outils de gestion de la qualité. L’amélioration de la qualité des données passe par l’implémentation d’outils et de contrôles, mais surtout par la sensibilisation des équipes.

L’augmentation de la quantité, la diversité et la complexité des données des entreprises – dans notre cadre extra-financier où de nombreuses données sont collectées en provenance d’OTI (Organisme Tiers Indépendant) – rendent indispensable la mise en place d’une gestion rigoureuse de la qualité.

L’accessibilité des données

L’accessibilité des données se caractérise comme suit : d’une part elle requiert la définition d’un modèle documenté et partagé d’exploitation des données (Data Operating Model) ; d’autre part elle nécessite la mise à disposition de données qualifiées, dont l’intégrité et la disponibilité est assurée par des systèmes de gestion de la donnée adaptée et une mise en gouvernance robuste.

Le Data Operating Model, couplé à une infrastructure bien pensée, est essentiel dans l’équilibre de la gouvernance de données et favorise l’implémentation de nouveaux usages.

Les équipes de notre département Data vous accompagnent dans l’élaboration de stratégies liées à la Data Sustainability grâce à ses expertises techniques et méthodologiques. L’objectif : vous apporter des solutions Data clés en main répondant à des usages métiers spécifiques comme l’élaboration des reportings extra-financiers ou la mise sous gouvernance des données liées aux stratégies RSE.

Vous souhaitez en savoir plus ou être accompagnés par notre équipe Data for Sustainability ?

Rédigé par Martin Éliard, Manager Data Driven

Pour une entreprise du CAC40 présente dans 68 pays comptant 170 000 collaborateur·rice·s, nous avons créé et développé une app centralisant l’ensemble des métiers de la finance au sein de cette entreprise multinationale : pour chacun d’entre eux sont listées les offres d’emploi, compétences et formations correspondantes. Elle présente également le parcours professionnel et les évolutions de carrière au sein du groupe.

Toutefois, cette app était figée et non-administrable par les collaborateur·rice·s IT en interne. Il a donc été rapidement nécessaire de créer une seconde app – un back-office – afin qu’ils·elles puissent gérer la base de données et modifier le contenu de la première (ajouter de nouveaux métiers, compléter les compétences et formations…).

Comment avons-nous abordé et travaillé sur ce projet ? Quels en ont été les enseignements ? Éric Bauman, développeur à la Factory chez Saegus, vous raconte.

Un défi technique

Le back-office a été pensé comme une app à part entière. La base de données est commune entre les deux applications. La première application étant internationale, le back-office devait donc être pensé en plusieurs langues – nous l’avons pour l’instant développé en français et anglais, l’objectif étant d’ajouter de nouvelles langues dans le futur. Cela entraîne un défi technique : penser différemment la base de données. Pour chaque langue, nous avons créé une table distincte pour les métiers, compétences et formations.

La maquette du back-office, designée par l’équipe de la Factory, était assez complexe à développer : il y avait beaucoup d’éléments très customisés, rendant leur intégration complexe. Par exemple, les listes déroulantes ont un style par défaut qui n’est pas modifiable ; il nous a donc fallu recréer une liste déroulante à la main, ce qui prend forcément plus de temps. Ce type de problème s’est posé sur plusieurs fonctionnalités de l’application.

Dans cette application, le menu permet de naviguer parmi tous les types de données que les administrateur·rice·s peuvent ajouter, modifier ou supprimer :

  • Les univers (“universes”), qui sont des sous-domaines de la finance ;
  • Les métiers (“jobs”) ;
  • Les compétences (“skills”) ;
  • Les formations (“trainings”) ;
  • Les évolutions de carrière (“career paths”).

Par exemple, pour modifier un univers, l’utilisateur·rice arrive à partir du menu sur un écran permettant de sélectionner un univers existant ou d’en ajouter un nouveau. Dans les deux cas, un formulaire contenant tous les attributs d’un univers s’affiche, permettant de le personnaliser en modifiant chaque champ. Cette fonctionnalité est la même pour tous les types de données.

Les métiers ont pour particularité d’être reliés aux formations, compétences et profils inspirants : des onglets permettent de naviguer parmi ces attributs et de les lier au métier sélectionné.

Nous avons utilisé Angular pour le front, en framework JavaScript ; Node.js et NestJS pour le backend ; et PostgreSQL pour la base de données. L’app est hébergée sur Azure.

Une app née de la collaboration

Au sein d’un projet de cette envergure, la relation avec le client est essentielle. Nous avons organisé plusieurs ateliers pour bien comprendre les besoins (parcours utilisateur, interactions) et avoir une image d’ensemble de l’interface à créer. Dans ce cadre, le client est un véritable collaborateur du projet ; les daily meetings et méthodes agiles, permettant d’avancer par itérations, sont clés pour pouvoir échanger. C’est aussi un moment au cours duquel le client peut tester les features une à une, permettant d’ajuster l’app au fur et à mesure. Sinon, le test unitaire est une bonne pratique : les lignes de test sont enregistrées et rejouées à l’ajout de chaque nouvelle fonctionnalité, automatisant les tests. Il convient de noter que cela demande du développement supplémentaire, mais fait gagner du temps à terme.

Il est essentiel que les designers et développeur·se·s travaillent en collaboration. Pour ce projet, pendant la création de la maquette, nous avons beaucoup échangé sur la faisabilité technique du front imaginé.

Après une livraison de la première version, nous avons fait des changements mineurs sur la base du retour client. Comme nous l’avons vu, l’app est pensée pour que l’on puisse y ajouter des langues supplémentaires à l’avenir, ce qui devra être fait par un·e développeur·se.

Conclusion

La gestion de projet et celle d’équipe se sont rencontrées au cours de ce projet. Une mission de cette envergure demande de la rigueur et du cadrage, ainsi qu’une collaboration régulière entre toutes les parties prenantes (client, métiers, designers). Nous sommes fier·ère·s de ce projet qui est une belle réussite.

Vous souhaitez vous aussi être accompagné·e·s par nos équipes de la Factory ? Contactez-nous !

Rédigé par Éric Bauman, Développeur à la Factory