Département Informatique

Accueil > UES > UEs par domaine > IRSM NSY122 : Analyse des images et des sons numériques
s'abonner à cette rubrique Envoi vers Viadeo Envoi vers Twitter Envoi vers LinkedIn Envoi vers Facebook Format d'impression Accessibilité malvoyants (Format Texte)  


NSY122 : Analyse des images et des sons numériques

Responsable national : Marin Ferecatu

Mots-clés : représentation du signal, filtrage, extraction de primitives image et son, analyse d’images et de vidéos, détection d’objets, suivi et reconnaissance d’objets, perception du son, reconnaissance vocale.

- Plateforme de suivi de l’UE, dont les supports de cours : lecnam.net.

Objectifs du cours

A l’heure où la technologie numérique permet de produire, stocker et disséminer des volumes de plus en plus importants de données multimédia, automatiser l’analyse et la recherche dans ces contenus numériques est devenu un enjeu crucial pour bon nombre d’applications. Les lacunes des approches de recherche textuelle (ambiguïté et subjectivité des mots-clé, passage à l’échelle de l’annotation manuelle irréalisable) ont conduit à la mise en place de techniques d’analyse automatique des contenus audiovisuels. Ce cours vise à faire connaître et à manipuler les solutions actuelles à la problématique de l’analyse des contenus audiovisuels. Il commence par rappeler les bases de traitement du signal communes à l’image (fixe et animée) et au son. Puis il introduit les outils mathématiques, algorithmiques et informatiques d’analyse automatique du contenu des images, des vidéos et des sons.

Les différentes techniques présentées auront pour finalité la reconstruction 3D de scènes ou d’objets, le suivi de mouvements, la reconnaissance d’objets et la reconnaissance vocale. Le cours permet d’acquérir les bases mathématiques et algorithmiques d’analyse des images (fixes et animées) et des sons numériques, de comprendre et manipuler les outils associés ainsi que de connaître les solutions actuelles à la recherche d’information dans les contenus audiovisuels.

Les applications industrielles présentées concernent la vidéo-surveillance, l’aide à l’annotation de documents audiovisuels, la détection de copies pour le problème des droits d’auteurs, l’identification biométrique et plus généralement la recherche d’information dans les bases de données multimédia (web, archives professionnelles ou grand public) par analyse du contenu.

Contacts | FORUMS | CEDRIC | CNAM | Réseau CNAM | Mentions légales