MARDI  11 MARS

Tutorial
Qualité des données et de l'information

Première partie : Les critères de la qualité de l'information
Jusqu'alors le savoir-faire était sans doute l'élément majeur représentant la valeur première d'une entreprise. À l'ère de l'information et de l'automatisme, les données prennent peu à peu le devant de la scène. Quelles sont les critères qui vont nous permettre de qualifier les différentes organisations professionnelles ? Quelles sont les informations majeures pour pouvoir se maintenir dans un marché qui se mondialise un peu plus chaque jour ? À l'heure de l'intégration de multiples systèmes, comment structurer l'information pour que des organismes complètement différents puissent travailler ensemble du jour au lendemain ?
" Justesse ", " pertinence ", " interopérabilité ", " agilité "...Comment s'y retrouver dans ces mille et un critères avancés sur la longue quête de la qualité ? Les outils et les méthodes actuelles principalement orientés outils sont-ils adaptés à cette mutation ?

Cet exposé se propose de faire un tour d'horizon afin de répondre à toutes ces interrogations. Il suivra le plan suivant :
1. Généralités : Définitions, objectifs, mécanismes généraux, outils
2. Critères de la qualité des données : Description, typologie, qualité, critères environnementaux, intrinsèques ou émotionnels
3. Un exemple, l'information médicale : Aspects quantitatifs, qualitatifs et déontologiques.

Animateur :
Jean-Louis Alexandre, ingénieur DPE, expert-conseil en informatique et organisation, chargé de cours CNAM à Saclay et à Rouen, possède vingt années d'expérience dans le management, la qualité et l'intégration de systèmes organisationnels.

Deuxième partie : Les enjeux opérationnels d'une étude de la sémantique des bases de données
1. Position du problème et enjeux. Les informations contenues dans les bases de données sont-elles exactes ? La question de l'exactitude des " données " a-t-elle un sens ? Comment appréhender l'adéquation de l'information au " réel " observable correspondant ? Voici autant de questions que les concepteurs, les gestionnaires et les utilisateurs de bases de données peuvent très légitiment se poser. En tant qu'instruments d'action sur le réel, les bases de données soulèvent en effet des enjeux financiers, sociaux et humains cruciaux.
2. Évaluer et améliorer la qualité des données - orientations et méthodes. La qualité d'une base de données désigne son adéquation relative aux objectifs qui lui sont assignés. L'examen de cette adéquation inclut des éléments formels et informels. La data quality research, discipline née au sein des laboratoires américains d'AT&T et du MIT, a proposé plusieurs méthodes permettant de rectifier les erreurs formellement identifiables dans de vastes collections de données : nous en présenterons les grands axes : data cleansing, data tagging et data tracking.
3. Les apports d'une approche sémantique. À la question " L'information est-elle correcte ? " nous répondons : " Comment l'information se construit-elle progressivement ? " Une telle réponse implique que l'on s'interroge pratiquement sur les modes d'interprétation des données. Nous proposons d'en évaluer les enjeux opératoires à partir d'études de cas et notamment de l'étude concrète des bases de données de la sécurité sociale belge, que nous avons analysées durant plusieurs années de façon à obtenir des enseignements généralisables. Nous montrerons en quoi l'étude de la sémantique des bases de données permet d'améliorer la gestion de vastes systèmes d'information au sein desquels l'homogénéité des représentations formelles se heurte à l'hétérogénéité des catégories empiriques.

Animateur :
Isabelle Boydens, Docteur en Philosophie et Lettres (orientation " sciences de l'information et de la documentation "), est chargée de cours à l'Université Libre de Bruxelles. Elle a publié Informatique, normes et temps (éditions Bruylant, 1999), ouvrage pour lequel l'Académie Royale des Sciences de Belgique lui a décerné le prix de la Fondation Louis Davin.

MERCREDI  12 MARS

Conférence
Retours d'expérience

- Maîtriser l'information et les données
Lcl Patrick Teisserenc - EMAT

- Qualité des données et processus de recueil
Pascal Rivière - INSEE

- EpisemAction : échange de données dans le domaine des informations géologiques
Jean-François Rainaud - IFP

- Données de santé dans un environnement distribué hétérogène
Christian Paoletti - GERDOSS et Nicolas Chanchevrier - EADS/S&DE France

- Des référentiels pour la qualité du système d'information
Laurent Collet & Philippe Cottin - GIE AGORA/MSA

- Données bancaires
XX - Crédit Lyonnais

- Vers la notion de qualité sémantique dans les entreprises
Jean Rohmer - Consultant auprès de la société Thalès

- Gestion de l'information externe et interne : d'un processus non maîtrisé vers un service de qualité à l'aide d'outils de gestion sémantique de connaissances
Alain Garnier - Arisem

- Veille sur la sécurité informatique par l'analyse et la qualification d'information peu ou non structurées issues de sources ouvertes
Éric Dupuis - DGA

- d'autres conférenciers seront confirmés ultérieurement

Table ronde :
Animateurs :
Yann Pollet, Jacques Printz - CNAM-CMSL et Jean-Marie Faure - Crédit Lyonnais
avec le concours des orateurs.


Copyright (C) CNAM-CMSL 2003, Tous droits réservés.