Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Informations
Procédure & Conditions d'achat
Prix et licences d'utilisation
Comment promouvoir vos ressources ?
Contactez-nous
Référence Catalogue : S0226-02
IDIOLOGOS 2 “Eingenspeakers” (projet NEOLOGOS)
La base de données IDIOLOGOS 2 “Eingenspeakers” a été produite dans le cadre du projet national français NEOLOGOS, du programme Technolangue, financé par le ministère français chargé de la recherche et des nouvelles technologies (MRNT). Les bases de données produites dans le cadre du projet NEOLOGOS ont été conçues pour le développement et la vérification de systèmes de reconnaissance de la parole ou du locuteur en français, ainsi que pour les synthétiseurs de parole. Elle consistent en :
1) les bases IDIOLOGOS sont composées de voix adultes et sont disponibles sous la forme de 2 sous-ensembles :
- la base de données “Bootstrap” (réf. catalogue ELRA-S0226-01),
- la base de données “Eingenspeakers” (réf. catalogue ELRA-S0226-02) ;
2) la base de données PAIDIALOGOS (réf. catalogue ELRA-S0227) est composée de voix d’enfants et d’adolescents.
La base de données IDIOLOGOS 2 “Eingenspeakers” contient les enregistrements de 200 locuteurs français adultes (97 hommes, 103 femmes) enregistrés à travers le réseau téléphonique fixe français. Les locuteurs ont prononcé 45 phrases phonétiquement riches, avec 10 appels par locuteur. Les 450 phrases prononcées par locuteur sont identiques pour tous les locuteurs. Les locuteurs ont été sélectionnés à partir de la base IDIOLOGOS 1 “Bootstrap” (ELRA-S0226-01).
Cette base est distribuée sur 1 DVD-ROM. Selon les spécifications de NEOLOGOS, les fichiers de parole sont stockés en séquences d'échantillons de 8 bit, 8 kHz, loi-A et ne sont pas compressés. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.
Cette base de données a été validée par SPEX (Pays-Bas) afin de vérifier sa conformité avec le format NEOLOGOS et les spécifications du contenu.
Contenu du corpus :
• 1 séquence de chiffres (6 chiffres) ;
• 1 numéro de téléphone (10 chiffres) ;
• 1 numéro de carte de crédit (16 chiffres) ;
• 1 prénom, 1 nom de ville provenant d'un annuaire de renseignements téléphoniques ;
• 1 mot réel/artificiel pour la couverture ;
• 45 phrases phonétiquement riches ;
Les classes d'âge sont réparties comme suit : 42 locuteurs ont entre 18 et 30 ans, 50 locuteurs ont entre 31 et 45 ans, 62 locuteurs ont entre 46 et 61 ans et 46 locuteurs ont plus de 61 ans.
Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.
Production
Projet :
NEOLOGOS
Applications
Applications existantes :
Speech recognition#Speech synthesis
Informations techniques
Support de distribution :
DVD
Contenus
Cliquer sur la flèche afin d'afficher les informations des contenus.
speech corpus
Langue(s) :
français
Quantisation :
8-bit
signal Encoding :
A-law
Source Channel :
Telephone
Annotation Level :
Orthographic
Fichiers complémentaires
Rapport de validation
Prix Membres
Academic - Commercial 15000.00 EUR
Academic - Research 1000.00 EUR
Commercial - Commercial 15000.00 EUR
Commercial - Research 15000.00 EUR
Prix Non Membres
Academic - Commercial 24000.00 EUR
Academic - Research 1000.00 EUR
Commercial - Commercial 24000.00 EUR
Commercial - Research 24000.00 EUR
Prix Spéciaux
Prix spéciaux disponibles à la demande pour des études en linguistique ou en sciences humaines.
Bundle
La ressource est disponible dans le(s) bundle(s) ci-dessous
B0007
samedi 31 juillet, 2010
5266437 requêtes depuis le lundi 27 septembre, 2004
Copyright © 2008
ELRA
ELRACatalogue 0.8.0