ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : S0183
    Base de données OrienTel du marocain MCA (arabe parlé moderne)
    La base de données OrienTel du marocain MCA (arabe parlé moderne) contient 772 locuteurs marocains (383 hommes, 389 femmes) enregistrés à travers le réseau téléphonique fixe et mobile marocain. Cette base est répartie sur 1 CD et 1 DVD. Les bases de données OrienTel ont été réalisées selon les spécifications du projet SpeechDat(II) et validées par SPEX, Pays-Bas.
    Les fichiers de parole sont stockés en séquences d’échantillons de 8 bits, 8 kHz, loi-A. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

    Chaque locuteur a prononcé les éléments suivants :
    • 1 chiffre isolé ;
    • 1 séquence de 10 chiffres isolés ;
    • 5 chiffres connectés : 1 numéro permettant d'identifier la feuille de prompt (6 chiffres), 1 numéro de téléphone (6-15 chiffres), 1 numéro de carte de crédit (14-16 chiffres), 1 code confidentiel (6 chiffres), 1 numéro de téléphone spontané ;
    • 2 montants en devises ;
    • 1 nombre naturel ;
    • 4 dates : 1 date spontanée (date de naissance), 1 date lue, 1 date relative et générale, 1 expression de date lue (calendrier islamique) ;
    • 2 phrases comportant une notion de temps : 1 jour (spontané), 1 phrase comportant une notion de temps ;
    • 3 mots épelés : 1 spontané (prénom), 1 nom de ville provenant d'un annuaire de renseignements téléphoniques, 1 mot réel pour couverture ;
    • 5 noms provenant d'un annuaire de renseignements téléphoniques : 1 spontané (prénom), 1 nom de ville de naissance/d'origine du locuteur (spontané), 1 nom de ville parmi les plus courantes (sur 500 noms), 1 nom de compagnie/société (sur 500 noms), 1 ”prénom nom” (sur 500 noms) ;
    • 2 questions oui/non : 1 question à prédominance "oui", 1 question à prédominance "non" ;
    • 6 mots/expressions de commande ;
    • 1 expression utilisant un mot de commande ;
    • 4 mots phonétiquement riches ;
    • 9 phrases phonétiquement riches
    • 3 éléments spontanés (pour contrôle).

    Les classes d’âge sont réparties comme suit : 381 locuteurs entre 16 et 30 ans, 262 locuteurs entre 31 et 45 ans, 129 locuteurs entre 46 et 60 ans.

    Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.
    Production
    Projet : Orientel
    Informations techniques
    Support de distribution : CD-ROM#DVD
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
    Fichiers complémentaires
  • Télécharger Rapport de validation
  •  
    Prix Membres
    Academic - Commercial 24000.00 EUR
    Academic - Research 18000.00 EUR
    Commercial - Commercial 24000.00 EUR
    Commercial - Research 24000.00 EUR
    Prix Non Membres
    Academic - Commercial 30000.00 EUR
    Academic - Research 22500.00 EUR
    Commercial - Commercial 30000.00 EUR
    Commercial - Research 30000.00 EUR

    Bundle
    La ressource est disponible dans le(s) bundle(s) ci-dessous
    B0004

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0