Découvrir l'Espace Recherche

Résultats de recherche technologique de l'Ina

L’Espace Recherche propose des démonstrations d’outils, de procédés ou de démarches s’inscrivant dans les activités de recherche de l’Ina. Il est possible de voir, tester ou expérimenter des projets sur lesquels travaille l’Ina. Dans un environnement simple d’utilisation, l’Espace Recherche présente de manière claire la nature des expérimentations, le mode d’utilisation et les concepts mis en œuvre.

Cet espace a vocation à réunir certaines des évolutions saillantes de l’Ina dans le domaine des médias numériques. Le Département Recherche met en lumière ses prototypes et démonstrations afin de montrer les contributions apportées par ses chercheurs et ingénieurs de recherche à la réflexion et à l’évolution des usages et des outils. L'Espace Recherche a pour but de susciter réactions, questions et commentaires, dans la perspective d’améliorer les résultats voire d’initier de nouvelles collaborations.

Pour en savoir plus sur les activités et les thématiques de recherche à l’Ina, rendez-vous sur le site de l'entreprise

Projets de recherche

Démonstrations et prototypes

DigInPix

Système d'identification d'entités visuelles dans les images et les vidéos
Tags : demo video
Facebook Twitter Google

A propos du projet DigInPix

Description

Les vidéos des fonds de l'Ina contiennent une large variété et un grand nombre d'entités visuelles qui ont un intérêt potentiel à être annotées si l'on veut un jour être en mesure de les retrouver rapidement. Ces entités visuelles, qui peuvent être des logos, des œuvres d'arts, des bâtiments, des visages, etc., sont difficilement annotables par des humains, même experts, comme les documentalistes de l'Ina. Tout d'abord parce que la tâche est très chronophage, ensuite parce que certaines entités sont tellement rares que peu de gens sont à même de pouvoir les identifier. DigInPix a donc pour objectif d'identifier de façon automatique, un maximum d'entités visuelles, parmi une liste prédéterminée d'entitées regroupées par "dictionnaires". Bien que cela soit plus difficile, le système peut parfois détecter la présence d'une entité occupant une très faible portion de l'image. Il n'est par contre pas adapté à la catégorisation d'images ou de vidéos (coucher de soleil, plage, montagne, chien, etc.).

Utilisation

  • Enrichissement des fonds par ajout de métadonnées
  • Gestion des droits sur les oeuvres et objets protégés
  • Liage de données avec d'autres fonds et bases de données
  • Smart city, smart museum, etc.

Contact(s) projet DigInPix

  • original
    Pierre Letessier

    Ingénieur de recherche en vision par ordinateur.

  • original
    Nicolas Hervé

    Ingénieur de recherche en vision par ordinateur.

Nous écrire : diginpix@ina.fr

Syncnotes

Repérage temporel de sujets de journaux télévisés
Tags : audio demo video
Facebook Twitter Google

A propos du projet Syncnotes

Description

Les notices documentaires rédigées par les documentalistes de l'Ina ne possèdent pas toujours d'information permettant de les localiser temporellement sur leur support (temps de début et temps de fin, ou "TC in" et "TC out"). Cette démonstration illustre un procédé de découpage temporel automatique de sujets de journaux télévisés et de repérage temporel automatique ("TC in" et "TC out") des notices documentaires associées.

Un repérage des plateaux est tout d’abord effectué en identifiant automatiquement la voix du présentateur avec un logiciel développé par le Laboratoire d'Informatique de l'Université du Maine (LIUM). Une transcription automatique de la parole est réalisée avec le logiciel VoxSigma de la société VOCAPIA Research. Chacune des notices documentaires décrivant les différents sujets est alors « positionnée » sur la ligne temporelle du journal. Pour cela le texte des notices (le titre, le résumé et les mots-clés) est comparé avec les portions de transcription correspond temporellement aux plateaux et aux inter-plateaux en utilisant une mesure de comparaison prenant en compte l’ensemble des mots de la notice d’une part, de la portion de transcription d’autre part. Chaque notice est alors associée au segment temporel pour lequel la mesure de similarité notice / portion de transcription est la plus grande. On distingue les sujets "en plateau", qui sont positionnés pendant les plateaux, des autres sujets de type reportage (positionnés entre les plateaux).

Utilisation

Cette étude est directement issue de besoins identifiés par les secteurs opérationnels de l’Ina. Les deux principaux usages visés sont :

  • Pour les documentalistes : gain de temps dans la description des sujets de journaux télévisés en proposant automatiquement des timecodes.
  • Pour les clients et usagers de l’Ina : positionnement automatique du dispositif de lecture (player) en début de sujet.

Contact(s) projet Syncnotes

  • medium
    Jean Carrive

    Responsable du Groupe de recherches audiovisuelles

NOUS ECRIRE : SYNCNOTES@INA.FR

Saphir

Lecture Optique des Disques Audio Analogiques
Tags : audio
Facebook Twitter Google

A propos du projet Saphir

Description

Des années 1930 aux années 1960, toute la mémoire sonore des stations de radio a été conservée sur disques audio gravés (les bandes magnétiques n’ont été utilisées de manière opérationnelle qu’à partir de 1960). Avec le temps ces supports ont été détériorés par des manipulations, ou se sont dégradés naturellement. Certains supports d’une valeur historique inestimable sont, aujourd’hui, illisibles avec les moyens habituels de lecture (cellules magnétiques avec pointe diamant) et il est impossible de restaurer mécaniquement la surface du disque. Sur les 276.000 disques de l’Ina, environ 20.000 sont concernés. Il en va de même pour un grand nombre de stocks d’archives d’établissements de radiodiffusion de par le monde.

Les disques rayés, cassés, fêlés, fractionnés sont illisibles par des moyens mécaniques. C’est aussi le cas pour ceux dont la surface s’est transformée et dégradée.

Utilisation

Notre procédé permet la lecture de ces disques de manière optique, sans pointe de lecture, et sans contact.

Contact(s) projet Saphir

  • original
    Jean-Hugues Chenot

    Chef de Projet Recherche et Développement

Nous écrire : saphir@ina.fr

Interfaces de visualisation

Accès rapide au contenu vidéo
Tags : demo video
Facebook Twitter Google

A propos du projet Interfaces de visualisation

Description

L’accroissement des flux à archiver impose des contraintes de productivité nouvelles sur la documentation. Si les outils automatiques apportent des aides précieuses pour l’indexation, ils ne peuvent remplacer actuellement l’intervention humaine. Il faut donc réduire le temps consacré à la consultation d’un ensemble de documents multimédias, en proposant à l’utilisateur des représentations permettant de superviser le contenu d’un programme sans avoir à le visionner, ainsi que le contenu d’ensembles de documents. Consulter rapidement un contenu multimédia, les contenus "proches" selon différents types de proximité, le manipuler et valider la description qui en est faite, constitue un réel défi pour les prochaines années. Dans ce contexte, visualisation indexation et fouille de données se complètent pour apporter à l’utilisateur un confort d’accès, de lecture et de manipulation de ressources. Trois interfaces ont été développées pour permettre l’exploration à différentes échelles de contenus vidéo : Collection Explorer, Bobino Explorer et News Explorer. Ces outils sont basés sur une analyse automatique des contenus multimédias.

Utilisation

  • Découverte et recherche du contenu appartenant à une collection de vidéos
  • Parcours rapide de flux ou de programmes vidéos
  • Aide à la segmentation de flux vidéos

Contact(s) projet Interfaces de visualisation

  • medium
    Marie luce viaud

    Chef de projet Recherche et Développement.

  • medium
    agnès saulnier

    Ingénieur -chercheur IHM et expérimentations

NOUS ECRIRE : BOBINO@INA.FR

Speech Trax

Suivi vocal des locuteurs célèbres du Paysage Audiovisuel Français
Tags : audio demo video
Facebook Twitter Google

A propos du projet Speech Trax

Description

D’illustres voix hantent le patrimoine audiovisuel français. Hommes politiques, sportifs, intellectuels, présentateurs, notre histoire radiotélévisée est ponctuée d’accents et de discours tour à tour héroïques, tendres, comiques ou dramatiques.

Les technologies de traitement automatique de la parole permettent d’extraire du signal audio un grand nombre d’informations. Identification des zones de musique et de parole, segmentation d’un échange entre différents locuteurs suivant leurs interventions respectives, identification d’un individu par sa voix ou encore retranscription textuelle des phrases prononcées à l’oral, c’est toute une batterie d’outils d’analyse qui est désormais disponible.

L’ambition du démonstrateur Speech Trax — pour speech track, en français la voie de la voix — est de rassembler les résultats de ces différentes analyses automatiques au sein d’un outil permettant facilement leur visualisation et leur manipulation. Le choix a été fait d’analyser des données radiophoniques et télévisées portant sur le mois de mars 2014 pour les chaînes publiques France 2, France 5, France 24, France Info, France Inter et France Culture. Le choix de la période a été effectué en raison de l’importante actualité du mois de mars 2014 (élections municipales 2014, affaire des écoutes de Nicolas Sarkozy, invasion de l’Ukraine par les troupes russes, disparition du vol 370 Malaysian Airlines, etc.) Au total ce sont plus de 250 heures de journaux télévisés, radiophoniques et de magazines d’information qui ont été analysées.

Des collaborations ont été menées avec différentes universités et entreprises françaises : le Laboratoire d’Informatique de l’Université du Maine (LIUM) et le Laboratoire d’Informatique d’Avignon (LIA) pour la segmentation en tours de parole et la reconnaissance de locuteur, l’Institut de Recherche en Informatique de Toulouse (IRIT) pour la détection des séquences de parole et de musique et la société Vocapia Research pour la transcription automatique de la parole effectuée à l’aide de la suite logicielle VoxSigma.

Utilisation

  • Pour les documentalistes : proposer une première documentation brute et imparfaite des contenus indexés par l’Ina pour amorcer le travail documentaire.
  • Pour les clients et usagers de l’Ina : proposer des parcours d’archives « obliques » reposant sur les interventions orales de personnalités du Paysage Audiovisuel Français.

Contact(s) projet Speech Trax

  • medium
    Félicien Vallet

    Ingénieur Recherche et Développement

  • medium
    Jean Carrive

    Responsable du Groupe de recherches audiovisuelles

NOUS ECRIRE : SPEECHTRAX@INA.FR

Dataset

Mise à disposition de la communauté scientifique et technologique d'un corpus de documents audiovisuels issus des collections de l'INA
Tags : audio video
Facebook Twitter Google

A propos du projet Dataset

Description

L’INA met à la disposition de la communauté scientifique et technologique un corpus de documents audiovisuels issus de ses collections, de fiches documentaires et de métadonnées associées à ces documents.

Ce corpus est destiné à la mise au point, l’expérimentation et l’évaluation d’outils de recherche et d’analyse de contenus multimédias dans un strict cadre de recherche scientifique. Pour accéder au Corpus, vous devez être préalablement inscrit et avoir à disposition un client FTP vous permettant de télécharger le Corpus.

Utilisation

Le Corpus est mis à disposition aux conditions visées dans les Conditions générales d'utilisation (CGU), à toute personne morale inscrite ayant préalablement accepté l’intégralité desdites CGU.

Seuls sont autorisés à s’inscrire les laboratoires de recherche, les PME innovantes ainsi que toutes autres personnes morales disposant d’un service ou d’une activité de recherche scientifique.

Votre demande sera envoyée à l’Ina pour examen. Après validation de votre demande, vous recevrez par courriel de confirmation les coordonnées du serveur FTP ainsi que les login et mot de passe confidentiels attribués à votre Organisation lui permettant d’accéder au Corpus.

Contact(s) projet Dataset

  • medium
    Jean Carrive

    Responsable du Groupe de recherches audiovisuelles

NOUS ECRIRE : DATASET@INA.FR
espace-recherche-#-ina.fr
+33 1 49 83 21 01
Institut national de l'audiovisuel, 94366 Bry sur Marne

Contact

Veuillez remplir le formulaire ci-dessous

Veuillez remplir ce champ
contactMessageErreurEmailInvalide
captcha
Veuillez remplir ce champ
Réponse incorrecte
Veuillez remplir ce champ
Votre message à été envoyé avec succès.
Désolé, une erreur s'est produite lors de l'envoi de votre message.
Désolé, le formulaire de contact n'est pas disponible
* requis