| MARDI 11 MARS |
|---|
Tutorial
Qualité des données et de l'information
Première partie : Les critères de la qualité de l'information
Jusqu'alors le savoir-faire était sans doute l'élément majeur représentant la
valeur première d'une entreprise. À l'ère de l'information et de l'automatisme, les
données prennent peu à peu le devant de la scène. Quelles sont les critères qui vont
nous permettre de qualifier les différentes organisations professionnelles ? Quelles sont
les informations majeures pour pouvoir se maintenir dans un marché qui se mondialise un
peu plus chaque jour ? À l'heure de l'intégration de multiples systèmes, comment
structurer l'information pour que des organismes complètement différents puissent
travailler ensemble du jour au lendemain ?
" Justesse ", " pertinence ", " interopérabilité ", "
agilité "...Comment s'y retrouver dans ces mille et un critères avancés sur la
longue quête de la qualité ? Les outils et les méthodes actuelles principalement
orientés outils sont-ils adaptés à cette mutation ?
Cet exposé se propose de faire un tour d'horizon afin de répondre à toutes ces
interrogations. Il suivra le plan suivant :
1. Généralités : Définitions, objectifs, mécanismes généraux, outils
2. Critères de la qualité des données : Description, typologie, qualité, critères
environnementaux, intrinsèques ou émotionnels
3. Un exemple, l'information médicale : Aspects quantitatifs, qualitatifs et
déontologiques.
Animateur :
Jean-Louis Alexandre, ingénieur DPE, expert-conseil en informatique et
organisation, chargé de cours CNAM à Saclay et à Rouen, possède vingt années
d'expérience dans le management, la qualité et l'intégration de systèmes
organisationnels.
Deuxième partie : Les enjeux opérationnels d'une étude de la sémantique des
bases de données
1. Position du problème et enjeux. Les informations contenues dans les bases de
données sont-elles exactes ? La question de l'exactitude des " données "
a-t-elle un sens ? Comment appréhender l'adéquation de l'information au " réel
" observable correspondant ? Voici autant de questions que les concepteurs, les
gestionnaires et les utilisateurs de bases de données peuvent très légitiment se poser.
En tant qu'instruments d'action sur le réel, les bases de données soulèvent en effet
des enjeux financiers, sociaux et humains cruciaux.
2. Évaluer et améliorer la qualité des données - orientations et méthodes. La
qualité d'une base de données désigne son adéquation relative aux objectifs qui lui
sont assignés. L'examen de cette adéquation inclut des éléments formels et informels.
La data quality research, discipline née au sein des laboratoires américains d'AT&T
et du MIT, a proposé plusieurs méthodes permettant de rectifier les erreurs formellement
identifiables dans de vastes collections de données : nous en présenterons les grands
axes : data cleansing, data tagging et data tracking.
3. Les apports d'une approche sémantique. À la question " L'information est-elle
correcte ? " nous répondons : " Comment l'information se construit-elle
progressivement ? " Une telle réponse implique que l'on s'interroge pratiquement sur
les modes d'interprétation des données. Nous proposons d'en évaluer les enjeux
opératoires à partir d'études de cas et notamment de l'étude concrète des bases de
données de la sécurité sociale belge, que nous avons analysées durant plusieurs
années de façon à obtenir des enseignements généralisables. Nous montrerons en quoi
l'étude de la sémantique des bases de données permet d'améliorer la gestion de vastes
systèmes d'information au sein desquels l'homogénéité des représentations formelles
se heurte à l'hétérogénéité des catégories empiriques.
Animateur :
Isabelle Boydens, Docteur en Philosophie et Lettres (orientation "
sciences de l'information et de la documentation "), est chargée de cours à
l'Université Libre de Bruxelles. Elle a publié Informatique, normes et temps (éditions
Bruylant, 1999), ouvrage pour lequel l'Académie Royale des Sciences de Belgique lui a
décerné le prix de la Fondation Louis Davin.
| MERCREDI 12 MARS |
|---|
Conférence
Retours d'expérience
- Maîtriser l'information et les données
Lcl Patrick Teisserenc - EMAT
- Qualité des données et processus de recueil
Pascal Rivière - INSEE
- EpisemAction : échange de données dans le domaine des informations géologiques
Jean-François Rainaud - IFP
- Données de santé dans un environnement distribué hétérogène
Christian Paoletti - GERDOSS et Nicolas Chanchevrier - EADS/S&DE France
- Des référentiels pour la qualité du système d'information
Laurent Collet & Philippe Cottin - GIE AGORA/MSA
- Données bancaires
XX - Crédit Lyonnais
- Vers la notion de qualité sémantique dans les entreprises
Jean Rohmer - Consultant auprès de la société Thalès
- Gestion de l'information externe et interne : d'un processus non maîtrisé vers un
service de qualité à l'aide d'outils de gestion sémantique de connaissances
Alain Garnier - Arisem
- Veille sur la sécurité informatique par l'analyse et la qualification d'information
peu ou non structurées issues de sources ouvertes
Éric Dupuis - DGA
- d'autres conférenciers seront confirmés ultérieurement
Table ronde :
Animateurs :
Yann Pollet, Jacques Printz - CNAM-CMSL et Jean-Marie Faure - Crédit
Lyonnais
avec le concours des orateurs.
Copyright (C) CNAM-CMSL 2003, Tous droits réservés.