Approches data centric, créez votre pierre de rosette des SI !

Rosetta Stone

Le vocabulaire lié aux métiers des systèmes d’information d’entreprise est riche en acronymes ou expressions de toutes sortes. Que penser de celle-ci : data centric?

Bien souvent, de nouveaux mots-clés apparaissent, par effet de mode ou par l’impulsion de nouvelles technologies. Mais ils ne font que recouvrir d’anciens concepts liés au besoin de maîtriser la complexité des SI. Bien que désignant des solutions utiles, ils ne sont pas non plus la solution ultime. En fournissant une nouvelle voie, ils proposent juste un nouveau point de vue. Finalement, tout l’enjeu dans les SI est de bien poser les problèmes avec l’ensemble des parties prenantes. Il faut pouvoir réconcilier des perspectives différentes, pour tenter de répondre aux trois questions essentielles de la création de valeur. A quoi ça sert, pour qui, que suffit-il ?

L’approche systémique est particulièrement bien adaptée pour aborder ces questions, ainsi que le pilotage multicritère. Il ne s’agit pas à proprement parler de pilotage de la complexité, ou de pilotage de l’incertitude, on frôlerait l’oxymore. Il s’agit de réduire et de s’adapter à l’une et à l’autre, en créant l’organisation capable d’ajuster ses intentions et ses actions en continu aux retours d’un écosystème en mouvement permanent.

Est-ce que l’approche data centric le permettrait ? Oui mais… en disposant d’une véritable « pierre de rosette » des SI. Le point de vue développé dans cet article est qu’une telle pierre de rosette peut exister. Il s’agirait d’un réseau d’ontologies formelles pour décrire les données et les règles métiers de l’organisation. C’est non seulement possible mais aussi nettement moins compliqué que perçu par le plus grand nombre. Toutefois, cela reste à construire et à adapter.

Concevoir un SI : un art protéiforme et complexe ?

divergence

(source image flickr/jariceiii/, CC BY 2.0)

Les systèmes d’information sont des objets complexes qui nécessitent pour les concevoir, développer, maintenir et exploiter, la mise en relation de nombreuses ressources. La dimension des ressources humaines n’est pas la moindre. Il faut faire dialoguer et interagir des parties prenantes aux enjeux parfois contraires. Cela, en suivant des démarches diverses pour arriver à un but commun.

Il n’y a pas forcément d’unité d’approches dans la construction. C’est un art protéiforme que celui de créer un Système d’Information durable et évolutif qui répond réellement à son objectif premier. Celui de fournir à une organisation un moyen efficace de gérer toute l’information qu’elle puisse produire ou acquérir afin de supporter ses activités non seulement au quotidien, mais également dans la définition et le déploiement de sa stratégie, tout en supportant les changements de trajectoire. Le système doit-être aussi robuste que flexible, pour fournir une sorte de cockpit pour diriger l’organisation, et les roues, ou les ailes, pour la faire fonctionner et se déplacer.

Une organisation est clairement un concept de groupe social, d’individus en interaction, ayant des intérêts divers, parfois divergents, mais se regroupant, « s’organisant » autour d’un but commun. Pour réussir à organiser les interactions du groupe de façon à préserver l’unité et la cohésion autour de ce but, l’information est un actif stratégique, pas seulement en temps de guerre. Pour réaliser dans un groupe n’importe quelle activité au quotidien, nous avons d’abord besoin d’être d’accord sur le but et ensuite de communiquer, d’échanger des informations, d’en créer, d’en collecter, d’en exploiter, pour y arriver. Tout système outillé qui facilite cela est le bienvenu, de la note papier au message qui arrive rapidement dans la boîte mail ou l’alerte sur le portable, ou les données qui s’affichent dans un formulaire, ou tout support numérique.

Les bons outils dépendent d’un bon usage

Useless (@locate366, cc by SA 2.0)

Seulement, aucun outil ne devine tout seul à quoi il sert, pas plus un algorithme d’intelligence artificielle qu’un autre. Les humains conçoivent des outils pour faire des tâches prédéterminées et leur intérêt dépend totalement de la tâche pour laquelle ils ont été conçus. Un marteau n’est pas un pinceau, un fusil n’est pas un crayon. De plus, une information n’est utile que si elle est fiable et pertinente par rapport à l’usage qu’on veut en faire, et dès lors que nous avons suffisamment d’expertise du contexte pour en tirer de la connaissance pour action.

Si vous avez des outils inadaptés au regard des tâches à réaliser et des informations non fiables, vous avez in fine un mauvais système d’information. La plupart sont mauvais par construction parce qu’ils ont été construits en silos, avec des briques de solutions peu interopérables, et sans squelette, muscles et fibres nerveuses pour faire la jonction entre le but de l’organisation (autrement dit ses finalités stratégiques) et ses mouvements. C’est à dire ses actions et l’ajustement des actions en cours d’exécution, en fonction des retours d’information du terrain.

Si on considère que l’organisation s’incarne en un « corps social », qui aurait une sorte d’esprit (ses intentions) et une sorte de corps (les ressources et capacités qui lui permettent d‘opérer des actions), on peut se risquer à faire un parallèle avec le corps humain.

Mais dans un corps humain, il y a rarement autant de dichotomie entre l’intention et l’action – du moins pour la plupart des mouvements ordinaires.

Le SI vu comme le cervelet du corps social

De nombreuses observations suggèrent que le cervelet nous aide à ajuster notre motricité aux changements corporels liés à la croissance, au handicap, aux variations de poids ou à l’âge. Il règle la sortie motrice en réponse aux exigences spécifiques à chaque nouvelle tâche. […]. Il est considéré que lorsque l’on apprend à marcher, parler ou jouer d’un instrument de musique, l’information détaillée et nécessaire au contrôle est stockée dans le cervelet d’où elle peut être rappelée par les commandes à partir du cortex cérébral

société américaine des Neurosciences

Dans le corps humain, le cervelet, « relié au cerveau par un pont de fibres nerveuses, est le centre de l’équilibre et de la coordination des mouvements, dont il ajuste la durée, l’amplitude et la succession en fonction des informations reçues au sujet de l’action en cours d’exécution ».

Ce n’est pas le cervelet qui décide des mouvements, mais c’est grâce à lui qu’ils seront coordonnés, organisés, ajustés. Nous pourrions considérer le Système d’Information comme une sorte de cervelet de l’organisation. Établir le parallèle est tentant, car le SI d’une organisation est ce qui lui sert à stocker l’information nécessaire aux décisions et aux opérations, à les collecter, les transmettre, les intégrer, les analyser, pour ajuster ses mouvements.

Sans se risquer à débattre ici des rapports entre l’intention et l’action et leurs liens de causalité, on peut souligner le rôle du réseau de communication des neurones, maillage parcouru de messages rapides d’informations chimiques et électriques. Ce réseau nous sert à tout, pour la mémoire et l’attention, afin de nourrir le raisonnement rapidement, pour l’intention et pour coordonner et ajuster l’action en fonction des informations reçues lors de l’exécution.

Ajuster l’action nécessite un métamodèle centralisateur du SI

Réconcilier les vues (photo Alexandre Andre cc-by-sa-2.0)

En poursuivant le parallèle établi entre le SI et le cervelet, alors le cerveau de l’organisation, la structure de gouvernance, ne peut régler le système pour l’adapter qu’à condition d’avoir les fuseaux neuromusculaires, les jeux de neurones particuliers, les organes sensoriels spécialisés pour faire transiter la bonne perception et le contrôle en retour du mouvement précis nécessaire.

Comment créer cela, en représentant tous les composants de l’organisation (ressources et capacités) dans le SI? Tout en faisant transiter les bonnes informations aux bons moments aux bons endroits, pour avoir des boucles de rétroaction ?

Il faut définir et concevoir une représentation du SI qui soit un métamodèle du corps social qu’est l’organisation, capable de réconcilier en un point central – une structure de coordination incarnée en une plateforme de type « data hub » – l’ensemble des informations en provenance des différentes perspectives du SI (par activités : SI RH, SI marketing, SI logistique, etc.) et capable de comprendre instantanément « de quoi on parle » (sur quoi portent l’information et le sens de cette dernière). Ce métamodèle est « l’intelligence » qui manque à la structure afin de pouvoir interpréter les données brutes, les transformer en connaissance et renvoyer la bonne information aux membres pour ajuster le mouvement dans l’action en cours d’exécution.

Quelle vue centrale choisir ?

Il y a eu beaucoup de voies, guidées par des méthodes ou des outils, depuis des années, pour proposer des modélisations et des représentations du SI qui ont tenté d’aboutir à une vue holistique de ce dernier. Cela pour inscrire sa construction dans un cadre d’architecture d’entreprise et prendre les décisions d’évolution en fonction des buts de l’organisation et non en fonction de besoins court-terme d’une activité en particulier.

De l’art de trouver la bonne perspective pour casser les Silob

(source Peter Miller CC BY-NC-ND 2.0)

Sans une vue holistique du SI, une organisation peut s’enliser dans ce que d’aucuns désignent par SILOB (Silo of Business). En effet, on aboutit à des divisions organisationnelles ou des sous-systèmes d’information qui ne veulent pas ou ne savent pas communiquer entre eux.

La dualité intention/action, à traduire ici pour l’organisation en stratégie/réalisation, existe en dehors de tout système informatique, en dehors même du numérique. Parce qu’il existe des silos humains, des failles de communication, des intérêts contraires, des héritages techniques et culturels, il va exister des silos numériques qui se traduisent en applications non interopérables, en bases de données ayant des difficultés de traduction de l’une à l’autre, parce qu’ayant des schémas différents pour les mêmes entités. Avec les silob, on perd le sens de l’information au regard du but de l’organisation, pour ne plus s’intéresser qu’à ses contraintes de structures organisationnelles et on vient à découper le SI entre systèmes mal coordonnés entre eux.

On ne peut « casser » les silos qu’en prenant du recul et en cherchant davantage à voir le but que le chemin où on est engagé, comme on doit trouver un panorama en hauteur pour trouver la voie de sortie dans des vallées encaissées ou des forêts touffues.

Ce recul ne peut pas être que l’affaire de solutions techniques. Dans un espace géographique physique, on peut envoyer des éclaireurs pour trouver un point de vue, une perspective, qui permette d’englober le paysage d’un seul coup d’œil et savoir où aller. Mais quelle perspective adopter dans les SI ?

Les ERP et l’approche process-centric

Adaptable (source David Matthew Parker, cc-by2.0)

Les approches « x-centric », qui proposent un angle de vue global du SI ne manquent pas, depuis des années. Le problème n’est pas nouveau. Il est juste de plus en plus difficile à résoudre. Car avec les changements de paradigme, certaines approches vantées un temps finissent par créer elles-mêmes des silos. Surtout quand lesdites approches prennent l’angle des solutions, avant celui du but. Prenons les ERP, à qui on doit essentiellement l’approche « process-centric » dans les SI.

L’avantage des ERP, c’est de proposer des modules applicatifs coordonnés autour d’une base de données centrale et des workflow, des automatisations de processus, permettant de faire circuler plus rapidement les flux d’information d’une entité à une autre en suivant des règles métiers.

A priori, l’ERP est une approche idéale pour casser des silos d’entités organisationnelles communiquant mal entre elles. Néanmoins c’est oublier un peu vite qu’une solution ERP est celle d’un éditeur. Ce dernier va proposer sa représentation des organisations et de leurs activités. De plus, il faut considérer le poids des changements organisationnels induits. Le rôle de mobiliser les parties prenantes pour s’adapter aux nouveaux processus incombe à l’organisation.

La promesse des ERP est double. D’une part, elle est de fournir les meilleures pratiques pour des processus relativement standardisés. D’autre part, elle est de fournir le moyen de partager rapidement des informations fiables entre plusieurs activités.

Le modèle économique des éditeurs d’ERP ne leur permet naturellement pas de prendre en compte toutes les spécificités des processus de chaque organisation. En particulier quand ces processus sont nettement différenciés. Pour obtenir un avantage concurrentiel durable, on peut revenir aux bases déjà énoncées par Michael Porter.

Les limites de l’ERP process-centric

Sans commentaire

On va s’intéresser à deux grandes catégories d’avantages concurrentiels, d’un côté, la différenciation, de l’autre la maîtrise des coûts. Certes un ERP, solution du marché, donc accessible à toute entreprise, peut apporter un avantage temporaire sur le second plan. En raison de la réduction des temps de cycle de processus. Du moins, si l’organisation s’adapte à la solution. Ce n’est cependant pas la solution ERP qui va se substituer à l’organisation pour créer une rupture innovatrice durable.

D’autre part, le modèle des ERP introduit des contraintes structurelles au niveau de l’information manipulée par l’entreprise et de la façon dont l’information circule. Ses schémas de représentation et le squelette du workflow sont structurants. Cela peut bien fonctionner pour des activités répétitives et normées. Ce n’est pas garanti pour des tâches très interactives. Surtout quand elles sont orientées sur l’usage des personnes et le réajustement permanent des actions.

On rentre vite dans une logique où remplir la base de données et suivre les étapes standard, prévaut sur supporter et faciliter l’activité opérationnelle des utilisateurs, avec toutes les frustrations liées.

Ce qui nous conduit à d’autres approches que celles process-centric. User experience ou user-centric ou customer-centric, on parlera de parcours clients ou de parcours utilisateurs pour mettre l’accent sur l’usage. On peut également faire le distinguo entre le SOR (System Of Record ») et le SOE (System Of Engagement). Quelles que soient ces approches, elles ne suffisent néanmoins pas pour disposer d’un système agile qui ne tomberait pas dans l’écueil de séparer intention et action, stratégie et exécution.

Les approches data centric : vers un système vraiment agile ?

Flexibility

Les systèmes d’information servent à gérer l’information de l’organisation afin de l’aider à définir ses objectifs pour atteindre son but et supporter opérationnellement les activités qui le servent. Les ordinateurs ne manipulent pas à proprement parler des informations, ils manipulent des données qui représentent l’information selon des formats et des modèles très variés, en réalité très dépendants de l’usage visé au moment où ils ont été définis.

Peu importe les acronymes pour désigner les différents systèmes de stockages, les différents types de données, les différentes applications et les différents logiciels. Le problème, c’est que l’information utile se trouve morcelée dans différents systèmes. Les données qui représentent les informations utiles et pertinentes sont déterminées par les structures des solutions qui les stockent et les échangent. Elles nécessitent une interprétation humaine de spécifications pour les comprendre et développer des passerelles entre systèmes. La connaissance métier existante se perd dans les couches technologiques et nécessite une réinterprétation à chaque nouveau mouvement qui suppose d’étendre le domaine de connaissance et d’action initial.

Il est parfois très difficile de réutiliser les données d’un système dans un autre, c’est tout l’enjeu théorique de l’interopérabilité. Un système doit être capable de s’adapter et de collaborer avec d’autres systèmes indépendants déjà existants ou encore à créer.

L’approche data centric aborde cette question de l’interopérabilité par les données, en replaçant ces dernières au cœur de l’architecture de construction et d’évolution des SI, via une vision unifiée et intégrée des données. Elles sont désormais vues comme des « actifs » valorisables de l’entreprise qu’on peut exploiter, grâce à une perspective centralisée, indépendamment de la modélisation et du stockage conçus pour un cas d’usage spécifique. Ce sont les données qui recèlent le potentiel de connaissance pour action, pas forcément les systèmes qui les manipulent.

Pas d’échange efficace sans données contextualisées

Beautiful Chaos

Oui, mais …

Si on poursuit la métaphore avec le cervelet, on est très loin, avec les SI actuels, de systèmes qui transmettent rapidement les influx nerveux et qui peuvent tout de suite traiter l’information et ajuster le mouvement du (ou des) bon(s) membre(s) selon la perception de ce qui est reçu.

Les informations échangées entre systèmes, pour opération ou pour décision, auront plus d’efficacité s’il est possible de leur assigner un sens par rapport au but fixé de l’action souhaitée. Cependant, dans toutes les approches x-centric, data-centric incluse, une perspective est souvent très maltraitée : le sens des données. Il ne s’agit pas ici de parler de leur structure dans une base de données, ni de leur syntaxe, ni à quelle application elles « appartiennent », ou lesquelles les consomment et les mettent à jour, ni quels programmes les traitent, ni à quel utilisateur les restituer et comment.

Il ne s’agit pas non plus d’évoquer la constitution d’un super système de stockage ouvert, capable de traiter de multiples formats ainsi que de stocker de gros volumes de données en provenance de sources hétérogènes et de les indexer rapidement pour les restituer dans différents systèmes de visualisation.

Tout cela est nécessaire, mais pas suffisant. Si les ordinateurs ne peuvent pas contextualiser les données, c’est à dire qualifier sur quoi elles portent (quel concept de connaissance) et en quoi elles sont reliées (ce que signifient leurs interactions avec d’autres), avec des métadonnées signifiantes et suffisantes (au juste nécessaire), exploitables par les machines, on perdra en efficacité des échanges.

Le « bon » sens commun, pour casser les silos

Meaningless

En se préoccupant surtout de traiter le volume et la variété des données, on risque d’obtenir de nouveaux gisements centraux de données inexploitables. De gros systèmes de données, contenant beaucoup de choses, à la fois utiles et complètement inutiles, mais on perdra énormément de temps à essayer de faire le distinguo, après coup. Si tant est qu’un cerveau humain soit capable de faire le distinguo sans les bons influx, compte tenu du volume.

Ce ne sont pas les approches de corrélation via le Machine Learning qui résoudront seules le problème du sens. Corrélation n’est pas causalité (cf.le paragraphe “savoir que x est relié à y est très loin du fait de comprendre x et y” de l’article suivant ) . Identifier des patterns dans de grandes masses de données via des traitements statistiques, cela ne veut pas dire en comprendre le sens.

Pour casser les silos et l’auto génération d’une complexité croissante dans les SI, il faut quitter les approches technologies/outils/plateformes et revenir au sens des informations échangées par les parties prenantes. À quoi ça sert, pour qui?

Et il faut traiter le « sens » des données au juste nécessaire : que suffit-il de savoir sur le contexte de la donnée échangée pour que l’échange soit le plus efficace possible ? Sur quoi porte la donnée? Porte-t-elle sur un client, un produit, un service ou quelque chose en relation avec ceux-ci ? Qu’est-ce que cela veut dire si je le représente de manière formelle et structurée ?

Tout l’enjeu des approches data centric consiste à sortir, pour traiter des données de sources hétérogènes, d’une focalisation sur la structure des données et leurs contraintes de type pour aborder aux rivages d‘une vraie sémantique formelle.

La pierre de rosette sémantique du SI : les ontologies formelles

On peut concevoir des systèmes de traduction multiples entre schémas de base de données relationnelles, structure de tables, message XML ou schéma XSD, format Json. De même, on peut utiliser des spécifications d’API pour une meilleure interopérabilité. Mais cela ne suffit pas. La machine décode une syntaxe, tandis que l’humain programme, dans un contexte documenté. Hors du contexte, le sens se perd.

Nous sommes dans un environnement d’écosystèmes, où toute organisation doit faire communiquer ses systèmes largement avec d’autres. Pour une interopérabilité étendue, il faut formaliser le sens des données de manière logique, compréhensible par la machine. Il ne s’agit plus de faire des spécifications déchiffrables uniquement par des humains. Pour cela, il faut décrire de manière formelle et partagée la connaissance des organisations et de leurs écosystèmes. Ce qui est possible, via des réseaux modulaires d’ontologies formelles. Elles représenteront de manière adéquate les concepts des organisations ainsi que leurs liens, selon les secteurs et leurs spécialisations, avec des noyaux communs.

Ensuite, il sera possible de qualifier les données brutes, les annoter, dans tous les systèmes avec des métadonnées faisant référence à cette représentation des connaissances.

Celle-ci agira comme une sorte de pierre de rosette. Laquelle, si on n’avait pas connu le sens du texte grec, n’aurait peut-être pas été très utile.

Reste toutefois à construire ce réseau d’ontologies par organisation. Cela suppose une démarche itérative, pour progressivement constituer une forme de jumeau numérique du corps social. Le SI jouant le rôle du cervelet qui coordonne son mouvement. La première étape sera sans doute de démystifier ce que signifie cette approche à base d’ontologies, au sens des possibilités réelles et des prérequis nécessaires. Ce sera l’objet du prochain article « comprendre l’interopérabilité sémantique pour que les machines se comprennent ».

Sabine Bohnké.

Tags

Laisser un commentaire

Your email address will not be published.

top