ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : S0192
    GlobalPhone arabe
    GlobalPhone est une base de données orale et textuelle collectée par l’Université de Karlsruhe, en Allemagne. Le corpus GlobalPhone offre des données orales transcrites pour le développement et l’évaluation de systèmes de reconnaissance de parole continue à large vocabulaire dans les langues les plus répandues dans le monde. GlobalPhone a été conçu de façon à fournir des informations uniformes entre les langues, telles que la taille du texte et de l’audio par langue, la qualité des données audio (microphone, bruit, canal), le scénario de collecte (tâche, mise en place, style de locution, etc.), ou encore les conventions de transcription. Ainsi, GlobalPhone offre une excellente base pour la recherche dans les domaines de (1) la reconnaissance de la parole multilingue, (2) l’adaptation rapide de systèmes de traitement de la parole à de nouvelles langues, (3) des tâches d’identification de la langue et du locuteur, ainsi que (4) la reconnaissance de parole monolingue pour une grande variété de langues.

    A ce jour, le corpus GlobalPhone couvre 15 langues : allemand, arabe (arabe standard moderne), chinois-mandarin, chinois de Shanghai, coréen, croate, espagnol (d’Amérique latine), français, japonais, portugais (brésilien), russe, suédois, tamoul, tchèque et turc. Cette sélection couvre une large variété de particularités langagières intéressantes pour la recherche et le développement dans le domaine de la parole et des langues. En effet, le corpus contient des langues très répandues (arabe, chinois, espagnol), ainsi que des langues importantes d’un point de vue économique et politique (coréen, japonais, arabe), et couvre une grande partie des territoires géographiques (Europe, Amériques, Asie). Les données de parole couvrent un grand choix de caractéristiques phonétiques, comme les tons (mandarin, chinois de Shanghai), la pharyngalisation (arabe), les groupes consonantiques (allemand), la nasalisation (français, portugais), la palatisation (russe), et plus. La partie écrite comprend une grande variété de variations orthographiques, telles que des systèmes d’écriture phonologique (alphabétiques, tels que roman, cyrillique, arabe ; à base syllabique comme le kana japonais, le hangul coréen), et des systèmes d’écriture idéographique (hanzi chinois et kanji japonais). Les langues couvrent plusieurs variations morphologiques, telles que les langues agglutinantes (turc, coréen), les langues composées (allemand), ainsi que des langues sans aucune segmentation de mot (chinois).

    L’acquisition des données a été réalisée dans des pays où la langue est officiellement parlée. Pour chaque langue ont été enregistrés environ 100 adultes natifs ayant lu 100 phrases différentes. Les textes lus sont extraits d’articles de journaux nationaux disponibles sur internet afin de couvrir un large domaine et un large vocabulaire. Les articles relatent des actualités politiques nationales et internationales, ainsi que des nouvelles économiques, principalement entre 1995 et 1998. Les données de parole ont été enregistrées avec un micro-casque Sennheiser 440-6 utilisé avec les mêmes caractéristiques pour l’ensemble des langues: codage PCM, qualité mono, 16-bit, et fréquence d’échantillonnage de 16 kHz. La plupart des données orales ont été enregistrées dans un bureau calme, et quelques-uns en appartement (salles à manger). Les transcriptions sont disponibles dans le système d’écriture d’origine des langues correspondantes. De plus, toutes les transcriptions ont été romanisées, c’est-à-dire converties en écriture romane en appliquant des algorithmes de correspondance adaptés. Les transcriptions ont été validées et annotées au moyen de balises spéciales pour marquer les effets spontanés, tels que le bégaiement, les faux démarrages, et les effets non verbaux comme le souffle, le rire et les hésitations. La base contient également des informations sur les locuteurs, telles que l’âge, le genre, la profession, etc. ainsi des informations sur la mise en place de l’enregistrement. Le corpus intégral GlobalPhone comprend plus de 300 heures de parole enregistrées par plus de 1500 locuteurs adultes natifs. La base est structurée en ensembles distincts de locuteurs pour l’entraînement (80 locuteurs), le développement (10 locuteurs) et l’évaluation (10 locuteurs), ainsi que par langue et par locuteur.

    Le corpus arabe a été produit à partir du journal Assabah. Il comprend les enregistrements de 78 locuteurs (35 hommes, 43 femmes) enregistrés en Tunisie, Palestine et Jordanie. Les classes d'âge sont réparties comme suit : 20 locuteurs de moins de 19 ans, 35 locuteurs entre 20 et 29 ans, 13 locuteurs entre 30 et 39 ans, 6 locuteurs entre 40 et 49 ans, et 4 locuteurs de plus de 50 ans.

    Pour plus d’informations, visiter le site web suivant : http://www.cs.cmu.edu/~tanja/GlobalPhone
    Applications
    Applications existantes : Language identification#Speaker identification#Speech recognition
    Informations techniques
    Taille : approximately 2 Gb per language
    Support de distribution : DVD
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
    Fichiers complémentaires
  • Télécharger QQC
  •  
    Prix Membres
    Academic - Commercial 3000.00 EUR
    Academic - Research 600.00 EUR
    Commercial - Commercial 3000.00 EUR
    Commercial - Research 3000.00 EUR
    Prix Non Membres
    Academic - Commercial 3600.00 EUR
    Academic - Research 700.00 EUR
    Commercial - Commercial 3600.00 EUR
    Commercial - Research 3600.00 EUR

    Prix Spéciaux

    Prix spéciaux pour l’achat de plusieurs langues GlobalPhone
    (Prix membre - Prix non membre):
    • 5 langues:
    R. 2600 R. 3000
    C. 13500 C. 16200
    • 10 langues:
    R. 5000 R. 6000
    C. 24000 C. 28800
    • 15 langues:
    R. 7500 R. 9000
    C. 31500 C. 37800


    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0