Accueil >FORMATIONS >Unités d’enseignements (UEs) et supports >Unités d’enseignements (UEs) >IRSM

NSY122 : Analyse des images et des sons numériques

Diplômes:  Diplôme d’ingénieur Cnam spé. informatique option réseaux, systèmes et multimédia , Master Design et développement des objets, médias et espaces numériques
Mots clés:  Multimédia , Image animée , Image fixe , Image , Vidéo , Intelligence artificielle , Analyse photographique , Analyse statistique des données , Codage du son , Colorimétrie , Document audiovisuel , Image numérique , Perception du son , Reconnaissance des formes , Son , Son numérique , Traitement du signal , Vision artificielle
UE:  NSY122 Analyse des images et des sons numériques
Fiche descriptive de l'UE: Cliquez ici

Responsable national : Marin Ferecatu

Mots-clés : représentation du signal, filtrage, extraction de primitives image et son, analyse d’images et de vidéos, détection d’objets, suivi et reconnaissance d’objets, perception du son, reconnaissance vocale.

 Plateforme de suivi de l’UE, dont les supports de cours : lecnam.net.

Objectifs du cours

A l’heure où la technologie numérique permet de produire, stocker et disséminer des volumes de plus en plus importants de données multimédia, automatiser l’analyse et la recherche dans ces contenus numériques est devenu un enjeu crucial pour bon nombre d’applications. Les lacunes des approches de recherche textuelle (ambiguïté et subjectivité des mots-clé, passage à l’échelle de l’annotation manuelle irréalisable) ont conduit à la mise en place de techniques d’analyse automatique des contenus audiovisuels. Ce cours vise à faire connaître et à manipuler les solutions actuelles à la problématique de l’analyse des contenus audiovisuels. Il commence par rappeler les bases de traitement du signal communes à l’image (fixe et animée) et au son. Puis il introduit les outils mathématiques, algorithmiques et informatiques d’analyse automatique du contenu des images, des vidéos et des sons.

Les différentes techniques présentées auront pour finalité la reconstruction 3D de scènes ou d’objets, le suivi de mouvements, la reconnaissance d’objets et la reconnaissance vocale. Le cours permet d’acquérir les bases mathématiques et algorithmiques d’analyse des images (fixes et animées) et des sons numériques, de comprendre et manipuler les outils associés ainsi que de connaître les solutions actuelles à la recherche d’information dans les contenus audiovisuels.

Les applications industrielles présentées concernent la vidéo-surveillance, l’aide à l’annotation de documents audiovisuels, la détection de copies pour le problème des droits d’auteurs, l’identification biométrique et plus généralement la recherche d’information dans les bases de données multimédia (web, archives professionnelles ou grand public) par analyse du contenu.