ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-S0064
    Colombian Spanish Speech Database
    Cette base de données contient des enregistrements collectés en Colombie.

    Cette base de données est composée d'enregistrements téléphoniques de 1065 locuteurs (563 locuteurs hommes et 502 locuteurs femmes) enregistrés directement à travers le réseau téléphonique fixe colombien, et utilisant une plate-forme d'enregistrement avec une interface ISDN (interface E-1).

    Les fichiers de parole ont été échantillonnés à 8 kHz, et enregistrés en séquences de 8 bits, loi-A, sans compression (Recommandation CCITT G.711). Chaque énoncé est stocké dans un fichier séparé. Chaque fichier est accompagné d'un fichier d'en-tête au format SAM. Le format des fichiers de parole et des fichiers d'en-têtes SAM suivent les spécifications du projet SpeechDat.

    Les locuteurs ont été principalement recrutés parmi le personnel de Siemens, les étudiants de plusieurs universités de Colombie, et leurs familles. Les classes d'âge sont réparties comme suit : 56 locuteurs de moins de 16 ans (38 hommes, 18 femmes), 542 locuteurs entre 16 et 30 ans (277 hommes, 265 femmes), 347 locuteurs entre 31 et 45 ans (178 hommes, 169 femmes), 99 locuteurs entre 46 et 60 ans (59 hommes, 40 femmes) et 21 locuteurs de plus de 60 ans (11 hommes, 10 femmes).

    La base contient une transcription orthographique qui donne des informations sur les événements acoustiques (parole ou non parole) présents dans les fichiers d'enregistrements correspondants. Un lexique est également fourni.

    Les événements acoustiques de non parole ont été classés en 4 catégories (hésitation, bruit émis par le locuteur, bruit de fond "permanent" - ex : bruit de voiture - et bruit de fond intermittent - ex : claquement de porte) et ont été transcrits.

    CARACTERISTIQUES :
    Type de ressource : Enregistrements de parole (acoustique)
    Mode de parole : Lu
    Conditions d'enregistrement : Réseau téléphonique fixe
    Langue : Espagnol colombien
    Sexe et nombre de locuteurs : 1065 locuteurs (563 hommes et 502 femmes)
    Annotation linguistique : Orthographique (+ transcription des bruits audibles)
    Format de fichier : 8 bits, loi A
    Standard utilisé : SAM
    Ensemble phonétique: SAMPA
    Fréquence d'échantillonnage (kHz) : 8 kHz
    Mode de distribution : 1 CD-ROM
    Ressources connexes : Famille SpeechDat. D'autres langues sont également disponibles à ELRA

    ISLRN : 260-277-550-048-8
    Informations techniques
    Support de distribution : Downloadable
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
    Fichiers complémentaires
  • Télécharger Description
  •  
    Prix Membres
    Academic - Commercial 5000.00 EUR
    Academic - Research 5000.00 EUR
    Commercial - Commercial 5000.00 EUR
    Commercial - Research 5000.00 EUR
    Prix Non Membres
    Academic - Commercial 7500.00 EUR
    Academic - Research 7500.00 EUR
    Commercial - Commercial 7500.00 EUR
    Commercial - Research 7500.00 EUR

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0