ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-W0120
    Corpus NUM 5M de textes en mongol
    Il s’agit d’un corpus de textes en mongol provenant principalement de quotidiens en ligne ou papier, de livres et de textes juridiques.

    La taille du corpus a été réduite de 5 millions à 4,8 millions de mots après nettoyage des textes bruts. Le corpus nettoyé contient :
    - 144 textes juridiques jusqu’à 2009,
    - 288 textes littéraires qui sont actuellement utilisés dans les livres d’école primaire et secondaire en Mongolie (comprenant des histoires, romans, nouvelles),
    - 1134 éditoriaux du journal "Unen" entre 1984-1989,
    - 2477 articles journalistiques en ligne entre 2003 et 2009.

    Une partie du corpus, environ 2800 phrases (100000 mots), a été annotée manuellement en partie du discours et standardisée au format XML TEI.

    ISLRN : 492-817-146-504-9
    Informations techniques
    Support de distribution : Downloadable
    Format de fichiers : Plain text
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
    written corpus 
     
    Prix Membres
    Academic - Commercial 5000.00 EUR
    Academic - Research Free
    Commercial - Commercial 5000.00 EUR
    Commercial - Research 5000.00 EUR
    Prix Non Membres
    Academic - Commercial 7000.00 EUR
    Academic - Research Free
    Commercial - Commercial 7000.00 EUR
    Commercial - Research 7000.00 EUR

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0