ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : S0239
    Base de données N4 (NATO Native and Non Native)
    La technologie de la parole couvre un nombre croissant de langues et les systèmes deviennent plus robustes vis-à-vis de la variabilité de la parole tel que le style de parole et les accents. Cependant, pour les applications réelles, en particulier dans un contexte multilingue et multinational, plus de robustesse est nécessaire vis-à-vis des accents régionaux et mêmes des accents non natifs. Parmi les nombreux corpus disponibles pour la recherche en parole, peu répondent spécifiquement à cette question.

    Le groupe de technologie de la langue et de la parole de l’OTAN a décidé de créer un corpus orienté vers l’étude des accents non natifs. Le groupe a choisi la communication navale comme tâche commune car elle comprend très naturellement une grande variété de parole non native et il existait des facilités d’expérimentation puisque les données pouvaient être collectées dans plusieurs pays.

    Le corpus de parole N4 (NATO Native and Non-Native) a été développé par le groupe de recherché en parole et technologie de la langue de l’OTAN, afin d’offrir une base de données de type militaire pour les études de traitement de la parole multilingue et non native.

    Les données de parole ont été enregistrées dans des centres d’entraînement de transmission navale de quatre pays (Allemagne, Pays-Bas, Royaume Uni et Canada) au cours des sessions d’entraînement en communication navale entre 2000 et 2002. Le matériel consiste en l’enregistrement de locuteurs natifs et non natifs, utilisant une procédure navale de l’OTAN en anglais, avec des phrases types ressemblant à “This is alpha, whiskey, roger. I make two seven zero six hostile, two seven zero six. Out”. Les locuteurs ont également lu un texte, "The North Wind and the Sun," à la fois en anglais et dans la langue du locuteur.

    Le matériel audio a été enregistré sur DAT et échantillonné en 16kHz-16bit. Tous les fichiers audio ont été transcrits manuellement et annotés avec l’identité des locuteurs grâce à l’outil Transcriber. Les enregistrements des procédures de navigation et les textes lus ont été stockés dans des fichiers différents. Le premier numéro du fichier précise le type de parole.

    Pour les segments de parole, la durée des enregistrements de procédure navale se situe entre 1,3 et 2,3 heures pour un total de 7,5 heures. La durée du texte lu dans la langue native se situe entre 1,5 minutes et 22,9 minutes pour un total d’environ une heure.










    CanadaAllemagnePays-BasRoyaume UniAll
    Signal5.303.205.006.3019.80
    Silence3.000.562.004.70
    Parole2.302.643.001.60
    Parole2.302.643.001.609.54
    Procédure navale2.001.902.301.30
    Texte lu0.300.740.700.30
    Texte lu0.300.740.700.302.04
    Non natif0.270.370.320.00
    Natif0.030.370.380.30


    La base de données contient l’information suivante pour chaque locuteur : sexe, âge, poids, taille, éventuels troubles de parole ou d’audition, niveau de formation, lieu de résidence, accent, deuxième langue, l’année où il/elle a appris l’anglais (pour les locuteurs non natifs). Les accents des locuteurs varient de manière importante d’un pays à l’autre. La moyenne d’âge des locuteurs est de 22,6 ans. Dix-neuf femmes ont participaté, soit 18% des participants à l’étude. Un total de 115 locuteurs a été enregistré.





    CanadaAllemagnePays-BasRoyaume UniAll
    #Locuteurs22513111115
    #Femmes509519
    Age22-3517-2317-6119-6217-62
    Moyenne d'âge28.320.12127.522.6
    Informations techniques
    Support de distribution : DVD
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
     
    Prix Membres
    Academic - Research 400.00 EUR
    Commercial - Research 400.00 EUR
    Prix Non Membres
    Academic - Research 500.00 EUR
    Commercial - Research 500.00 EUR

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0