ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-S0140
    Base de données SpeechDat-Car de l 'espagnol
    La base de données SpeechDat-Car de l’espagnol est composée d’enregistrements réalisés à travers le réseau GSM espagnol. 306 locuteurs espagnols (156 hommes, 150 femmes) de 4 régions différentes ont été enregistrés dans une voiture. Cette base de données est distribuée sur 89 CD-ROM ou sur DVD. Les bases orales réalisées lors du projet SpeechDat-Car ont été validées par SPEX, Pays-Bas, afin de contrôler leur adéquation avec le format SpeechDat-Car et les spécifications de contenu.

    Les données de parole se présentent sous deux formats. Quatre microphones ont été connectés sur un ordinateur placé dans le coffre de la voiture. Ces fichiers sont stockés en séquences d'échantillons de 16 kHz, 16 bit et ne sont pas compressés. Le cinquième microphone a été connecté au téléphone mobile et les enregistrements effectués sur une machine à distance. Les fichiers sont ici stockés en séquences d’échantillons de 8kHz, 8 bit loi-A. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

    Chaque locuteur a prononcé les éléments suivants :

    * 2 mots-clés d'activation vocale
    * 1 séquence de 10 chiffres isolés
    * 7 chiffres connectés : 1 numéro permettant d'identifier la feuille de prompt (5+ chiffres), 1 numéro de téléphone spontané, 3 numéros de téléphone lus, 1 numéro de carte de crédit (14-16 chiffres), 1 code confidentiel (6 chiffres)
    * 3 dates : 1 date spontanée (ex. anniversaire), 1 date lue, 1 date générale
    * 2 expressions utilisant un mot de commande
    * 4 chiffres isolés
    * 7 mots épelés : 1 spontané (nom ou prénom du locuteur), 1 nom de ville provenant d'un annuaire de renseignements téléphoniques, 4 mots/noms réels, 1 nom artificiel pour couverture
    * 1 montant en devises
    * 1 nombre naturel
    * 7 noms provenant d'un annuaire de renseignements téléphoniques : 1 spontané (nom ou prénom du locuteur), 1 nom de ville de naissance/d'origine du locuteur (spontané), 2 noms de ville parmi les plus fréquentes, 2 noms de compagnie/société parmi les plus fréquentes, 1 répétition de "prénom nom"
    * 9 phrases phonétiquement riches
    * 2 phrases comportant une notion de temps : 1 jour (spontané), 1 phrase comportant une notion de temps
    * 4 mots phonétiquement riches
    * 67 mots de commande: 13 mots de commande dans le domaine de la téléphonie mobile, 22 mots de fonction dans le domaine des serveurs vocaux interactifs, 32 mots-clés de produits du domaine de l'automobile
    * 2 mots-clés dépendants de la langue supplémentaires
    * phrases spontanées

    Les classes d'âge sont réparties comme suit : 160 locuteurs ont entre 18 et 30 ans, 80 locuteurs entre 31 et 45 ans, 65 locuteurs entre 46 et 60 ans et 1locuteur a plus de 60 ans.

    Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.

    ISLRN : 937-459-364-430-3
    Production
    Projet : SpeechDat-Car
    Informations techniques
    Support de distribution : Downloadable
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
    Fichiers complémentaires
  • Télécharger Rapport de validation
  •  
    Prix Membres
    Academic - Commercial 30000.00 EUR
    Academic - Research 25000.00 EUR
    Commercial - Commercial 30000.00 EUR
    Commercial - Research 30000.00 EUR
    Prix Non Membres
    Academic - Commercial 39000.00 EUR
    Academic - Research 32500.00 EUR
    Commercial - Commercial 39000.00 EUR
    Commercial - Research 39000.00 EUR

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0