ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : S0187
    Base de données OrienTel du tunisien MSA (arabe standard moderne)
    La base de données OrienTel du tunisien MSA (arabe standard moderne) contient 598 locuteurs tunisiens (359 hommes, 239 femmes) enregistrés à travers le réseau téléphonique fixe et mobile tunisien. Cette base est répartie sur 1 CD et 1 DVD. Les bases de données OrienTel ont été réalisées selon les spécifications du projet SpeechDat(II) et validées par SPEX, Pays-Bas.
    Les fichiers de parole sont stockés en séquences d’échantillons de 8 bits, 8 kHz, loi-A. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

    Chaque locuteur a prononcé les éléments suivants :
    • 1 chiffre isolé ;
    • 2 séquences de 5 chiffres isolés ;
    • 7+1 chiffres connectés : 1 numéro permettant d'identifier la feuille de prompt (6 chiffres), 6 ensembles de 4 chiffres sous la forme écrite, +1 numéro permettant d’identifier la feuille de prompt en chiffres.
    • 2 montants en devises ;
    • 2 nombres naturels ;
    • 3 dates : 1 date lue, 1 date relative et générale, 1 expression de date lue (calendrier islamique) ;
    • 1 phrase comportant une notion de temps ;
    • 2 mots épelés : ensemble de 4 séquences de lettres ;
    • 3 noms provenant d'un annuaire de renseignements téléphoniques : 1 nom de ville de naissance/d'origine du locuteur (spontané), 1 nom de ville parmi les plus courantes (sur 500 noms), 1 nom de compagnie/société (sur 500 noms), 1 nom personnel (prénom et nom) ;
    • 2 questions oui/non : 1 question à prédominance "oui", 1 question à prédominance "non" ;
    • 6 mots/expressions de commande ;
    • 1 expression utilisant un mot de commande ;
    • 4 mots phonétiquement riches ;
    • 9 phrases phonétiquement riches
    • 4+1 éléments spontanés (pour contrôle).

    Les classes d’âge sont réparties comme suit : 2 locuteurs de moins de 16 ans, 441 locuteurs entre 16 et 30 ans, 101 locuteurs entre 31 et 45 ans, 54 locuteurs entre 46 et 60 ans.

    Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.
    Production
    Projet : Orientel
    Informations techniques
    Support de distribution : CD-ROM#DVD
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
    Fichiers complémentaires
  • Télécharger Rapport de validation
  •  
    Prix Membres
    Academic - Commercial 16000.00 EUR
    Academic - Research 12000.00 EUR
    Commercial - Commercial 16000.00 EUR
    Commercial - Research 16000.00 EUR
    Prix Non Membres
    Academic - Commercial 20000.00 EUR
    Academic - Research 15000.00 EUR
    Commercial - Commercial 20000.00 EUR
    Commercial - Research 20000.00 EUR

    Bundle
    La ressource est disponible dans le(s) bundle(s) ci-dessous
    B0005

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0