ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : S0258
    Base de données OrienTel des Emirats Arabes Unis MCA (arabe parlé moderne)
    La base de données OrienTel des Emirats Arabes Unis MCA (arabe parlé moderne) contient 880 locuteurs (432 hommes, 448 femmes) enregistrés à travers le réseau téléphonique fixe et mobile local. Cette base est répartie sur 2 DVD. Les bases de données OrienTel ont été réalisées selon les spécifications du projet SpeechDat(II) et validées par SPEX, Pays-Bas.

    Les fichiers de parole sont stockés en séquences d’échantillons de 8 bits, 8 kHz, loi-A. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

    Chaque locuteur a prononcé les éléments suivants :
    • 1 chiffre isolé ;
    • 1 séquence de 10 chiffres isolés ;
    • 4 chiffres connectés : 1 numéro permettant d'identifier la feuille de prompt (6 chiffres), 1 numéro de téléphone (6-15 chiffres), 1 numéro de carte de crédit (14-16 chiffres), 1 code confidentiel (6 chiffres);
    • 2 montants en devises ;
    • 1 nombre naturel ;
    • 4 dates : 1 date spontanée (date de naissance), 1 date lue, 1 date relative et générale, 1 expression de date lue (calendrier islamique) ;
    • 2 phrases comportant une notion de temps : 1 jour (spontané), 1 phrase comportant une notion de temps ;
    • 3 mots épelés : 1 spontané (prénom), 1 nom de ville provenant d'un annuaire de renseignements téléphoniques, 1 mot réel pour couverture ;
    • 5 noms provenant d'un annuaire de renseignements téléphoniques : 1 spontané (prénom), 1 nom de ville de naissance/d'origine du locuteur (spontané), 1 nom de ville parmi les plus courantes (sur 500 noms), 1 nom de compagnie/société (sur 500 noms), 1 ”prénom nom” (sur 500 noms) ;
    • 2 questions oui/non : 1 question à prédominance "oui", 1 question à prédominance "non" ;
    • 6 mots/expressions de commande ;
    • 1 expression utilisant un mot de commande ;
    • 4 mots phonétiquement riches ;
    • 9 phrases phonétiquement riches
    • 3 éléments spontanés (pour contrôle).

    Les classes d’âge sont réparties comme suit : 488 locuteurs entre 16 et 30 ans, 309 locuteurs entre 31 et 45 ans, 83 ont plus de 46 ans.

    Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.
    Production
    Projet : Orientel
    Informations techniques
    Support de distribution : DVD
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
     
    Prix Membres
    Academic - Commercial 28000.00 EUR
    Academic - Research 26600.00 EUR
    Commercial - Commercial 28000.00 EUR
    Commercial - Research 28000.00 EUR
    Prix Non Membres
    Academic - Commercial 35000.00 EUR
    Academic - Research 33250.00 EUR
    Commercial - Commercial 35000.00 EUR
    Commercial - Research 35000.00 EUR

    Bundle
    La ressource est disponible dans le(s) bundle(s) ci-dessous
    B0010

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0