ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-E0046
    Package d’évaluation ETAPE
    Le projet ETAPE (Evaluation en Traitement Automatique de la Parole) consiste en une campagne d’évaluation pour les systèmes de traitement automatique de la parole. Le projet a été finance par l’Agence Nationale de la Recherche (ANR) sous le contrat de subvention ANR-09-CORD-009.

    La campagne ETAPE 2011 vient à la suite des series de campagnes ESTER organisées en 2003, 2005 et 2009 (voir aussi ELRA-E0021, ELRA-S0241, ELRA-S0305 et ELRA-S0338 pour les ressources des campagnes ESTER), avec comme objectifs la qualité d’une plus large variété de données de parole et le défi encore plus difficile qu’est la parole spontanée. Alors que les campagnes ESTER initiales visaient les émissions d’actualités radio-diffusées, l’édition 2009 a introduit de la parole accentuée et de la parole spontanée provenant d’autres types d’émissions (hors actualités). L’évaluation ETAPE 2011 se concentre sur du materiel télé-diffusé contenant différents niveaux de parole spontanée et de la parole avec des locuteurs multiples. En-dehors de la parole spontanée, l’originalité de la campagne ETAPE 2011 est qu’elle ne vise pas un type particulier d’émissions telles que les actualités, afin de favoriser le développement de systèmes de transcription à visée plus générale pour le matériel multimédia de qualité professionnelle.

    Comme par le passé, plusieurs tâches ont été évaluées de façon indépendante sur le même jeu de données. Dans l’évaluation ETAPE 2011, quatre tâches ont été prises en compte. Pour des raisons historiques, les taches appartiennent aux 3 catégories suivantes: segmentation, transcription et extraction d’information. Une tâche de detection multi-locuteurs a été mise en oeuvre comme tâche exploratoire au vu du manque de contexte précédent.

    Les données ETAPE 2011 comprennent environ 30 heures de données radio et TV françaises, choisies dans le but d’inclure principalement de la parole non planifiée et une proportion raisonnable de données multi-locuteurs. Toutes les données ont été transcrites avec soin, en incluant l’annotation des entités nommées.

    Dans le but du projet ETAPE ANR, les alignements phonétiques et les arbres syntaxiques enrichissent une partie de l’ensemble de données ETAPE.

    Ce package comprend l’ensemble des données utilisées lors de la campagne d’évaluation ETAPE. Il regroupe des ressources, des outils de notation, les résultats de la campagne officielle, etc., qui ont été utilisés ou produits pendant la campagne. Le but de ce "package" d’évaluation est de permettre à tout acteur externe de pouvoir évaluer son propre système et ainsi, de pouvoir comparer ses résultats à ceux obtenus pendant la campagne.

    ISLRN : 425-777-374-455-4
    Production
    Projet : ETAPE Date de création : 2011
    Applications
    Applications existantes : Speaker identification#Speech recognition
    Informations techniques
    Support de distribution : Downloadable
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
     
    Prix Membres
    Academic - Commercial 20000.00 EUR
    Academic - Research 300.00 EUR
    Commercial - Commercial 20000.00 EUR
    Commercial - Evaluation 1000.00 EUR
    Commercial - Research 5000.00 EUR
    Prix Non Membres
    Academic - Commercial 25000.00 EUR
    Academic - Research 2000.00 EUR
    Commercial - Commercial 25000.00 EUR
    Commercial - Evaluation 6500.00 EUR
    Commercial - Research 7500.00 EUR

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0