Menu Fermer

Données internes : Une source de valeur à portée de main…

Le premier article de cette série vous a aidé à développer une vue d’ensemble de la valorisation des données ? Il a retenu votre attention sur l’intérêt de cette voie pour le développement de votre activité ?

Notre second article vous a convaincu que le contexte RGPD/LPD est le moment idéal pour mettre la valorisation des données à l’épreuve du terrain, à moindre frais et quelle que soit la taille de votre organisation ?

Alors vous êtes parés pour la lecture de ce nouvel article, qui amorce une montée en puissance dans les possibles applications de la valorisation des données, tout en restant focalisé sur les données internes de l’organisation. …Et vous l’aurez deviné : les données externes nous attendent bien sûr un peu plus loin sur le chemin !


Cet article est le troisième de notre série consacrée à la valorisation des données.


Une progression naturelle

A moins que vous n’ayez de gros moyens et une foi inébranlable dans la valorisation des données, vous aurez vraisemblablement commencé par un galop d’essai. C’est en tout cas notre hypothèse à ce stade, et le cheminement que nous avons suivi à travers l’article précédent.

Vous voici donc fort d’un premier retour d’expérience et d’acquis concrets :

  • Vous avez testé des éléments de méthodologie, des outils et techniques.
  • Vous possédez une cartographie d’une partie des données de votre organisation, et peut-être déjà d’outils et procédures de maintenance de cette cartographie.
  • Vous avez mis en place un début de gouvernance des données.
  • Vous avez probablement commencé à prendre la mesure du niveau de maturité d’une partie de votre organisation, à l’égard de la gestion et de la valorisation des données. Peut-être avez-vous déjà une idée claire des changements culturels et organisationnels qui vont devoir être menés à bien progressivement.

Vous souhaitez maintenant passer à une initiative plus conséquente ? Dans le cadre de cette nouvelle itération, les acquis évoqués plus haut pourront alors être réutilisés, modifiés ou remplacés, selon les besoins. La gouvernance pourra par exemple être repensée dans sa forme, étendue plus largement dans l’organisation, présentée différemment pour une meilleure adoption, etc.

Une attention particulière devra être prêtée à la définition du périmètre des données à valoriser. Nous avons déjà parlé de l’importance de cet élément. Mais dans le contexte présent, il déterminera en quelque sorte la taille de l’incrément par rapport à l’itération précédente, et donc le chemin à parcourir pour faire évoluer les acquis. Plus grand sera l’écart, plus délicate sera la réussite de l’initiative.

Quels critères peuvent être pris en compte pour la définition du périmètre ?

  • Tout d’abord le besoin initial ! Hors de question de chercher à valoriser pour valoriser. Pensez business analyse : C’est d’abord ce besoin qui cadrera la définition du périmètre. Même si vous avez l’intention d’adopter une démarche exploratoire dans votre initiative de valorisation des données, vous avez forcément des raisons assez précises de le faire. Par exemple :
    • Est-ce pour monter en compétences dans la valorisation des données ? Alors il vaut peut-être mieux vous tourner vers des études de cas précis et juste suffisants.
    • Est-ce pour découvrir des leviers de croissance ? Dans ce cas il est nécessaire de préciser votre besoin : Cherchez-vous des indicateurs stratégiques ? Si oui lesquels ? Avez-vous besoin d’élargir votre base de prospection ? Souhaitez-vous profiler votre concurrence ? Etc.
  • Parallèlement, il faut songer que plus le périmètre des données à traiter sera similaire à celui de l’itération précédente, plus simple sera l’exploitation et l’évolution des acquis. Parmi les critères de similitude à considérer, citons :
    • Les données en commun.
    • La taille des périmètres.
    • La structure des ensembles de données contenus dans ces périmètres.
    • Les types de données.
    • Les traitements effectués sur les données.
    • Les parties prenantes liées à ces traitements.

Le périmètre idéal serait par exemple un ensemble de données qui :

  • réponde à un besoin prioritaire de valorisation,
  • étende raisonnablement l’ensemble utilisé à l’itération précédente, ou qui, sans contenir cet ensemble précédent, lui soit similaire sur le maximum de critères énoncés ci-dessus.

En panne d’inspiration ?

Voyons deux exemples dans lesquels vous vous reconnaîtrez peut-être ou qui pourront en tout cas nourrir vos propres réflexions.

TPE/PME dans l’industrie de précision

Vous concevez et produisez des pièces de précision pour matériel médical. Votre entreprise compte une vingtaine d’employés. Vous avez réalisé en 2018 votre mise en conformité LPD/RGPD (félicitations pour votre proactivité !), et dans le prolongement de cette adaptation, vous avez mené à bien une première initiative de valorisation des données sur un périmètre restreint autour de vos données clients.

Ceci vous a permis de découvrir une corrélation entre l’adoption de vos produits par certains clients particulièrement influents dans le business du matériel médical, et le volume de commandes ultérieures réalisé par d’autres entreprises apparemment plus suiveuses. Vous avez ainsi pu ajuster votre stratégie commerciale en conséquence et mettre en place un ensemble de rapports permettant de suivre les indicateurs de performance relatifs à ce changement.

Vous voulez à présent mettre à profit cette expérience mais votre priorité se porte actuellement sur les ressources humaines : L’embauche est en tension dans votre secteur et le turn-over trop important dans votre entreprise. Vous souhaitez si possible identifier des leviers d’actions qui permettraient de remédier à cette situation. Votre périmètre d’étude porte sur les données concernant les ressources humaines de l’entreprise ainsi que sur les traitements de ces données et les acteurs de ces traitements. Comme nous l’avons dit plus haut, la distance entre ce périmètre et le précédent, sur lequel vous avez acquis de l’expérience, est un bon indicateur sur le chemin à parcourir et ses implications :

Critère de comparaisonPérimètre précédentPérimètre envisagéEvaluation de la similitude
Nature des données (sémantique)

Clients et leurs caractéristiques pertinentes (taille, leadership).

Historique d'achats par client, incluant les produits, les volumes et les montants des achats.

Historique des relations commerciales.

Employés de l'entreprise et leurs caractéristiques (formation, parcours, recrutement, date d'embauche et départ éventuelle, forme du départ, etc).

Historique d'événements pertinents : changements de rémunération, formation, entretiens, évaluations, etc.

Les données ne sont pas les mêmes. Elles sont totalement disjointes.

Elles présentent néanmoins une assez forte similitude puisqu'elles portent dans les deux cas sur une personne morale ou physique, quelques caractéristiques de cette personne, et plusieurs historiques la concernant.

Fait notable, le nouveau périmètre envisagé touche des personnes physiques et nécessitera donc une évaluation précise du risque juridique.

Structure et type des données

Données simples (textes, dates et nombres) stockées en tables peu nombreuses.

Quelques interdépendances.

Données simples (textes, dates et nombres) stockées en tables peu nombreuses.

Quelques interdépendances.

Similitude forte. Vraisemblablement les mêmes modalités de stockage et accès.
Traitements sur les données.

Ajout, modification, suppressions de clients.

Ajout, modification, annulation d'achats.

Consultation en lecture seule pour la création de différents rapports simples.

Sauvegardes périodiques et restaurations en cas d'incident.

Ajout, modification, suppressions d'employés.

Ajout, modification, suppression d'un événement.

Consultation en lecture seule pour la création de différents rapports simples.

Sauvegardes périodiques et restaurations en cas d'incident.

Similitude forte.
Parties prenantes

Direction.

Service commercial.

Service IT.

Direction.

Service RH.

Service IT.

Ici l'écart entre les deux périmètres dépendra beaucoup de l'organisation de l'entreprise et des différences ou similitudes qui peuvent exister entre les services RH et commercial.

A noter que même si le service IT est impliqué dans les deux cas, il est tout à fait possible que les deux initiatives soient perçues différemment, dans la mesure où la nouvelle va porter sur les données des employés eux-mêmes. Un effort sera donc peut-être à envisager sur la culture de l'entreprise et la gouvernance des données.

Taille des périmètres

Un historique de 9600 achats sur 15 ans pour un ensemble de 200 clients différents.

Une dizaine de membres du personnel actuel est susceptible d'intervenir directement sur ces données.

180 employés cumulés sur les 15 dernières années, incluant les salariés actuels, et pour chacun, un historique de 8 événements en moyenne.

Une dizaine de membres du personnel actuel est susceptible d'intervenir directement sur ces données.

Les tailles sont du même ordre de grandeur. Pas de différence significative ici.

Nous avons ici la comparaison entre le périmètre de la valorisation qui a été menée à bien précédemment sur les données clients, et celui de l’initiative envisagée à présent sur des données RH. Qu’en déduire?

  • Dans la mesure où le degré de similitude entre ces deux périmètres est assez élevé, les acquis de l’expérience précédente constituent un atout certain pour la réussite de la nouvelle initiative.
  • Quelques différences sont apparues néanmoins:
    • Risque juridique à évaluer.
    • Sensibilité culturelle à prendre en compte.
    • Intégration de nouveaux membres du personnel (RH) dans la gouvernance des données et l’ouverture culturelle de l’entreprise au pilotage par la donnée (data-driven decision making).

En conclusion, il y a donc bien un écart à combler, ce qui est assez logique dans tout changement, mais celui-ci semble raisonnablement modéré à ce stade, et une nouvelle montée en compétence enrichissante se dessine à l’issue de cette initiative.

Hôtellerie et restauration

Varions les plaisirs et considérons un autre cas à présent…

Vous êtes impliqué dans la gestion d’un hôtel de 120 chambres au cœur de Genève, comportant également plusieurs salles de restaurant pour un total de 200 couverts.

Vous avez mené à bien une première initiative de valorisation des données clients, en tirant partie de la cartographie réalisée lors de la mise en conformité LPD/RGPD de votre établissement. La solution à laquelle vous avez abouti permet désormais de :

  • Visualiser les statistiques de fréquentation de votre hôtel.
  • Appliquer des filtres et groupements pertinents pour paramétrer ces visualisations, tels que les dates, types de chambres, durée de séjour, tarifs, âges, langue, zone d’origine géographique, critère de choix de l’hôtel, heures d’arrivée et départ, etc.
  • Rechercher des tendances dans l’historique de fréquentation (analyse descriptive et prédictive).
  • Effectuer des simulations en faisant varier plusieurs paramètres tels que les tarifs, heures d’arrivées et départ, etc. Nous parlons ici d’analyse prescriptive, pour laquelle vous avez commencé à intégrer quelques éléments d’intelligence artificielle.

Fort de cette expérience, et convaincu que la valorisation des données constitue un axe de développement important pour votre entreprise, vous souhaitez désormais vous pencher sur votre activité de restauration, en perte de vitesse sur ces trois dernières années, sans raison évidente ni changement interne qui aurait pu l’expliquer sur cette période.

En reprenant la cartographie de vos traitements des données personnelles, vous réalisez que le réseau Wi-Fi que vous avez fait installer et évoluer depuis 2013 pour vos clients est une piste intéressante. Il inclut notamment un pare-feu qui permet de dater et comptabiliser les occurrences de certaines expressions textuelles, sans atteinte à la vie privée des usagers…

Votre restaurant ne propose pas de menu végétarien et votre pare-feu enregistre avec régularité dans l’activité de vos clients un pic de recherche de restaurants végétariens à l’heure du repas… Qu’en déduire à votre avis ?

C’est entendu, vous tenez une piste : à vous de jouer !

Vous n’y croyez toujours pas ? Et pourtant !…

Il peut naturellement arriver que les données présentes en interne ne suffisent pas à répondre au besoin à traiter. On peut se trouver face à des problèmes de qualité insurmontables, ou tout simplement avoir besoin de données qui n’ont jamais été prévues dans les collectes et traitements réalisés jusqu’ici par l’entreprise.

Dans ces situations, la tentation est grande de se tourner rapidement vers des sources de données externes pour combler ces lacunes, mais patience : nous y viendrons dans notre prochain article !

Plus sérieusement, il ne faut pas oublier que le recours aux données externes peut être source de :

  • Dépendances : La source peut connaître des pannes ou cesser tout simplement d’exister ; le format des données ou les modalités techniques d’accès peuvent évoluer de manière imposée, plus ou moins rapide, fréquente et complexe.
  • Risques juridiques : Evolution des lois en matière de pays d’hébergement, droits sur les données, etc.
  • Dépenses peu maîtrisées : Non seulement comme conséquence des points évoqués ci-dessus, mais également parce que les fournisseurs peuvent tout simplement choisir d’augmenter leurs tarifs s’ils sont en position de le faire.

A moins que votre besoin ne nécessite vraiment ce type de recours, vous aurez donc peut-être intérêt à envisager d’abord des solutions internes. Mais quelles voies explorer ?

  • Commençons par le plus évident : Votre périmètre de départ peut-il être étendu ? Les données dont vous avez besoin pourraient-elles se trouver par exemple isolées dans un autre silo que vous n’avez pas exploré ? Ne seraient-elles pas déjà disponibles dans les logs obscurs d’un vieux système ronronnant au fond d’un placard ? Oui, c’est bien du vécu !
  • Les données manquantes ne pourraient-elles pas être déduites à partir d’autres que vous possédez déjà ?
    • Déduction par “simple” calcul : Distances à vol d’oiseau à partir de coordonnées GPS par exemple.
    • Déduction par inférence métier : Une consultation des experts métier impliqués dans votre projet pourrait ici résoudre votre problème à moindre coût. Ils connaissent par exemple les normes qui régissent leur domaine. Exemples : Dans un inventaire, les fabricants de matériels connectés peuvent être identifiés à partir de l’adresse physique de ces matériels. Dans un autre registre, des matériaux de construction peuvent être déduit à partir de la date de réalisation et de la connaissance des normes en vigueur à cette époque.
    • Déduction par inférence statistique : Il peut s’agir par exemple d’établir des tendances ou des causes probables à partir d’échantillons présents. On est ici à la limite entre production de données complémentaires et valorisation des données, mais cela n’a rien d’étonnant : la valeur produite à partir de données peut naturellement se présenter elle-même sous la forme de données, qui à leur tour recèlent un potentiel de valorisation. Et inversement, toute production de données est une production de valeur potentielle…
  • Enfin il ne faut pas négliger la possibilité de mettre en place un nouveau moyen de collecte de données afin de combler les vides. Quelques pistes auxquelles songer :
    • Ajout de champs de saisies appropriés.
    • Captage logiciel de données d’utilisation (sites Internet, applications mobiles, etc).
    • Mise en place d’appareils de mesure, comptage, etc : Le coût de ce type de matériel a baissé de manière phénoménale ces dernières années tandis que progressaient à des rythmes comparables leur fiabilité, interopérabilité, performances, miniaturisation et baisse de consommation électrique. Si votre budget est limité, mais pas votre créativité, c’est une aubaine à ne pas ignorer. Et si vous ne connaissez pas déjà ce domaine, nous vous invitons à jeter un œil du côté de l’Internet des objets (IoT) ou encore des écosystèmes Arduino et Raspberry Pi par exemple : Les TPE et PME du domaine industriel ont ici matière à réflexion…

Conclusion

Vous le voyez, il est bel et bien possible la plupart du temps, et quel que soit le profil de votre entreprise, de trouver des données internes à valoriser. C’est une approche qui présente les avantages de :

  • s’inscrire naturellement dans une montée en compétences sur la valorisation des données,
  • demander un investissement modéré,
  • vous assurer la maîtrise complète des solutions élaborées.

Bien entendu, les données externes ont leur intérêt également, et ce sera précisément l’objet du prochain article de cette série.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *