ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-S0165
    MICROAES
    MICROAES est une base de données orale en espagnol, produite par ATLAS (Applied Technologies on Language and Speech, S.L ), qui comprend les enregistrements au microphone de 300 locuteurs espagnols, issus de 5 régions dialectales différentes et répartis en fonction de critères de sexe et d’âge.

    Le corpus contient 30 ensembles de 15 paragraphes ; soit au total 450 paragraphes. Chaque ensemble comprend au moins 2 allophones issus de la norme SAMPA. C’est pourquoi, l’effet de co-articulation entre les mots a été pris en compte.

    La plateforme d’enregistrements est un ordinateur portable combiné au matériel audio grâce à une carte PCMCIA. Un maximum de 4 microphones ont été utilisés simultanément :

    * Sennheiser ME 104 (proche)
    * Nokia Lavalier HDC-6D (proche)
    * Sennheiser ME 64 (moyen)
    * Haun MBNM-550 E-L (éloigné)

    Les enregistrements ont eu lieu dans un bureau, sans bruits extérieurs. Les signaux sont stockés dans des fichiers bruts, sans en-tête. Chacun des 4 canaux est enregistré avec une fréquence de 16 kHz -16 bits.

    Une description du taux d’échantillonnage, de la quantification et de l’ordre des octets utilisés est disponible dans le fichier d’étiquettes SAM correspondant à chaque fichier son. Ce fichier contient également des informations sur la qualité du signal.

    Les transcriptions des données sont orthographiques et lexicales, avec quelques compléments d’information sur les événements acoustiques audibles (de parole ou non) présents dans les fichiers .wav. La transcription inclut des marqueurs de segments divisant le paragraphe en portions de moins de 10 secondes utilisant les pauses des locuteurs.
    Le lexique comprend plus de 7 400 mots avec leur prononciation en SAMPA.

    La base de données, comprenant au total 30 heures de discours, est distribuée sur 30 CD-ROM ou 5 DVD-ROM suivant la norme ISO 9660.

    ISLRN : 313-534-255-935-8
    Informations techniques
    Support de distribution : Downloadable
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
    Fichiers complémentaires
  • Télécharger QQC
  •  
    Prix Membres
    Academic - Commercial 28000.00 EUR
    Academic - Research 18000.00 EUR
    Commercial - Commercial 28000.00 EUR
    Commercial - Research 28000.00 EUR
    Prix Non Membres
    Academic - Commercial 32000.00 EUR
    Academic - Research 22000.00 EUR
    Commercial - Commercial 32000.00 EUR
    Commercial - Research 32000.00 EUR

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0