ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : S0226-01
    IDIOLOGOS 1 “Bootstrap” (projet NEOLOGOS)
    La base de données IDIOLOGOS 1 “Bootstrap” a été produite dans le cadre du projet national français NEOLOGOS, du programme Technolangue, financé par le ministère français chargé de la recherche et des nouvelles technologies (MRNT). Les bases de données produites dans le cadre du projet NEOLOGOS ont été conçues pour le développement et la vérification de systèmes de reconnaissance de la parole ou du locuteur en français, ainsi que pour les synthétiseurs de parole. Elle consistent en :
    1) les bases IDIOLOGOS sont composées de voix adultes et sont disponibles sous la forme de 2 sous-ensembles :
    - la base de données “Bootstrap” (réf. catalogue ELRA-S0226-01),
    - la base de données “Eingenspeakers” (réf. catalogue ELRA-S0226-02) ;
    2) la base de données PAIDIALOGOS (réf. catalogue ELRA-S0227) est composée de voix d’enfants et d’adolescents.

    La base de données IDIOLOGOS 1 “Bootstrap” contient les enregistrements de 1000 locuteurs français adultes (470 hommes, 530 femmes) enregistrés à travers le réseau téléphonique fixe français. Les locuteurs ont prononcé 45 phrases phonétiquement riches. Ces 45 phrases sont identiques pour tous les locuteurs

    Cette base est distribuée sur 1 DVD-ROM. Selon les spécifications de NEOLOGOS, les fichiers de parole sont stockés en séquences d'échantillons de 8 bit, 8 kHz, loi-A et ne sont pas compressés. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

    Cette base de données a été validée par SPEX (Pays-Bas) afin de vérifier sa conformité avec le format NEOLOGOS et les spécifications du contenu.

    Contenu du corpus :
    • 1 séquence de chiffres (5+ chiffres) ;
    • 1 numéro de téléphone (10 chiffres) ;
    • 1 numéro de carte de crédit (16 chiffres) ;
    • 1 prénom, 1 nom de ville provenant d'un annuaire de renseignements téléphoniques ;
    • 1 mot réel/artificiel pour la couverture ;
    • 45 phrases phonétiquement riches ;

    Les classes d'âge sont réparties comme suit : 288 locuteurs ont entre 18 et 30 ans, 264 locuteurs ont entre 31 et 45 ans, 247 locuteurs ont entre 46 et 61 ans et 201 locuteurs ont plus de 61 ans.

    Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.
    Production
    Projet : NEOLOGOS
    Applications
    Applications existantes : Speech recognition#Speech synthesis
    Informations techniques
    Support de distribution : DVD
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
    Fichiers complémentaires
  • Télécharger Rapport de validation
  •  
    Prix Membres
    Academic - Commercial 10000.00 EUR
    Academic - Research 1000.00 EUR
    Commercial - Commercial 10000.00 EUR
    Commercial - Research 10000.00 EUR
    Prix Non Membres
    Academic - Commercial 16000.00 EUR
    Academic - Research 1000.00 EUR
    Commercial - Commercial 16000.00 EUR
    Commercial - Research 16000.00 EUR

    Prix Spéciaux

    Prix spéciaux disponibles à la demande pour des études en linguistique ou en sciences humaines.


    Bundle
    La ressource est disponible dans le(s) bundle(s) ci-dessous
    B0007

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0