Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Informations
Procédure & Conditions d'achat
Prix et licences d'utilisation
Comment promouvoir vos ressources ?
Contactez-nous
Référence Catalogue : S0239
Base de données N4 (NATO Native and Non Native)
La technologie de la parole couvre un nombre croissant de langues et les systèmes deviennent plus robustes vis-à-vis de la variabilité de la parole tel que le style de parole et les accents. Cependant, pour les applications réelles, en particulier dans un contexte multilingue et multinational, plus de robustesse est nécessaire vis-à-vis des accents régionaux et mêmes des accents non natifs. Parmi les nombreux corpus disponibles pour la recherche en parole, peu répondent spécifiquement à cette question.
Le groupe de technologie de la langue et de la parole de l’OTAN a décidé de créer un corpus orienté vers l’étude des accents non natifs. Le groupe a choisi la communication navale comme tâche commune car elle comprend très naturellement une grande variété de parole non native et il existait des facilités d’expérimentation puisque les données pouvaient être collectées dans plusieurs pays.
Le corpus de parole N4 (NATO Native and Non-Native) a été développé par le groupe de recherché en parole et technologie de la langue de l’OTAN, afin d’offrir une base de données de type militaire pour les études de traitement de la parole multilingue et non native.
Les données de parole ont été enregistrées dans des centres d’entraînement de transmission navale de quatre pays (Allemagne, Pays-Bas, Royaume Uni et Canada) au cours des sessions d’entraînement en communication navale entre 2000 et 2002. Le matériel consiste en l’enregistrement de locuteurs natifs et non natifs, utilisant une procédure navale de l’OTAN en anglais, avec des phrases types ressemblant à “This is alpha, whiskey, roger. I make two seven zero six hostile, two seven zero six. Out”. Les locuteurs ont également lu un texte, "The North Wind and the Sun," à la fois en anglais et dans la langue du locuteur.
Le matériel audio a été enregistré sur DAT et échantillonné en 16kHz-16bit. Tous les fichiers audio ont été transcrits manuellement et annotés avec l’identité des locuteurs grâce à l’outil Transcriber. Les enregistrements des procédures de navigation et les textes lus ont été stockés dans des fichiers différents. Le premier numéro du fichier précise le type de parole.
Pour les segments de parole, la durée des enregistrements de procédure navale se situe entre 1,3 et 2,3 heures pour un total de 7,5 heures. La durée du texte lu dans la langue native se situe entre 1,5 minutes et 22,9 minutes pour un total d’environ une heure.
Canada
Allemagne
Pays-Bas
Royaume Uni
All
Signal
5.30
3.20
5.00
6.30
19.80
Silence
3.00
0.56
2.00
4.70
Parole
2.30
2.64
3.00
1.60
Parole
2.30
2.64
3.00
1.60
9.54
Procédure navale
2.00
1.90
2.30
1.30
Texte lu
0.30
0.74
0.70
0.30
Texte lu
0.30
0.74
0.70
0.30
2.04
Non natif
0.27
0.37
0.32
0.00
Natif
0.03
0.37
0.38
0.30
La base de données contient l’information suivante pour chaque locuteur : sexe, âge, poids, taille, éventuels troubles de parole ou d’audition, niveau de formation, lieu de résidence, accent, deuxième langue, l’année où il/elle a appris l’anglais (pour les locuteurs non natifs). Les accents des locuteurs varient de manière importante d’un pays à l’autre. La moyenne d’âge des locuteurs est de 22,6 ans. Dix-neuf femmes ont participaté, soit 18% des participants à l’étude. Un total de 115 locuteurs a été enregistré.
Canada
Allemagne
Pays-Bas
Royaume Uni
All
#Locuteurs
22
51
31
11
115
#Femmes
5
0
9
5
19
Age
22-35
17-23
17-61
19-62
17-62
Moyenne d'âge
28.3
20.1
21
27.5
22.6
Informations techniques
Support de distribution :
DVD
Contenus
Cliquer sur la flèche afin d'afficher les informations des contenus.
speech corpus
Langue(s) :
anglais
Quantisation :
16 bits
Clipping Rate Percentage :
16 kHz
Source Channel :
Microphone
Prix Membres
Academic - Research 400.00 EUR
Commercial - Research 400.00 EUR
Prix Non Membres
Academic - Research 500.00 EUR
Commercial - Research 500.00 EUR
vendredi 10 septembre, 2010
5380117 requêtes depuis le lundi 27 septembre, 2004
Copyright © 2008
ELRA
ELRACatalogue 0.8.0