ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : S0289
    Base de données OrienTel du jordanien MCA (arabe parlé moderne)
    La base de données OrienTel du jordanien MCA (arabe parlé moderne) contient 757 locuteurs jordaniens (393 hommes, 364 femmes) enregistrés à travers le réseau téléphonique fixe et mobile jordanien. Cette base est stockée sur 1 DVD. Les bases de données OrienTel ont été réalisées selon les spécifications du projet SpeechDat(II) et validées par SPEX, Pays-Bas.
    Les fichiers de parole sont stockés en séquences d’échantillons de 8 bits, 8 kHz, loi-A. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

    Chaque locuteur a prononcé les éléments suivants :
    • 1 chiffre isolé ;
    • 1 séquence de 10 chiffres isolés ;
    • 5 chiffres connectés : 1 numéro permettant d'identifier la feuille de prompt (6 chiffres), 1 numéro de téléphone (6-15 chiffres), 1 numéro de carte de crédit (14-16 chiffres), 1 code confidentiel (6 chiffres), 1 numéro de téléphone spontané ;
    • 2 montants en devises ;
    • 1 nombre naturel ;
    • 4 dates : 1 date spontanée (date de naissance), 1 date lue, 1 date relative et générale, 1 expression de date lue (calendrier islamique) ;
    • 2 phrases comportant une notion de temps : 1 jour (spontané), 1 phrase comportant une notion de temps ;
    • 3 mots épelés : 1 prénom provenant d’un annuaire de renseignements téléphoniques, 1 nom de ville, 1 mot réel pour couverture ;
    • 5 noms provenant d'un annuaire de renseignements téléphoniques : 1 spontané (prénom), 1 nom de ville de naissance/d'origine du locuteur (spontané), 1 nom de ville parmi les plus courantes (sur 500 noms), 1 nom de compagnie/société (sur 500 noms), 1 ”prénom nom” (sur 500 noms) ;
    • 2 questions oui/non : 1 question à prédominance "oui", 1 question à prédominance "non" ;
    • 6 mots/expressions de commande ;
    • 1 expression utilisant un mot de commande ;
    • 4 mots phonétiquement riches ;
    • 9 phrases phonétiquement riches
    • 3+2 éléments spontanés (pour contrôle).
    • 1 parole spontanée libre (plus d’une phrase)

    Les classes d’âge sont réparties comme suit : 427 locuteurs entre 16 et 30 ans, 230 locuteurs entre 31 et 45 ans, 100 locuteurs entre 46 et 60 ans.

    Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.
    Production
    Projet : OrienTel
    Applications
    Applications existantes : Speech recognition
    Informations techniques
    Support de distribution : DVD
    Plate-forme : PC#Unix#Macintosh
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
    Fichiers complémentaires
  • Télécharger Rapport de validation
  •  
    Prix Membres
    Academic - Commercial 24000.00 EUR
    Academic - Research 18000.00 EUR
    Commercial - Commercial 24000.00 EUR
    Commercial - Research 24000.00 EUR
    Prix Non Membres
    Academic - Commercial 30000.00 EUR
    Academic - Research 22500.00 EUR
    Commercial - Commercial 30000.00 EUR
    Commercial - Research 30000.00 EUR

    Bundle
    La ressource est disponible dans le(s) bundle(s) ci-dessous
    B0011

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0