ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-W0120
    Corpus NUM 5M de textes en mongol
    Il s’agit d’un corpus de textes en mongol provenant principalement de quotidiens en ligne ou papier, de livres et de textes juridiques.

    La taille du corpus a été réduite de 5 millions à 4,8 millions de mots après nettoyage des textes bruts. Le corpus nettoyé contient :
    - 144 textes juridiques
    - 278 histoires
    - 8 nouvelles
    - 4 romans littéraires
    - 597 articles journalistiques
    - 505 interviews
    - 302 rapports
    - 578 essais
    - 469 histoires
    - 1258 éditoriaux de journaux

    Une partie du corpus, environ 2800 phrases (100000 mots), a été annotée manuellement en partie du discours et standardisée au format TEI.

    ISLRN : 492-817-146-504-9
    Informations techniques
    Support de distribution : Downloadable
    Format de fichiers : Plain text
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
    written corpus 
     
    Prix Membres
    Academic - Commercial 5000.00 EUR
    Academic - Research Free
    Commercial - Commercial 5000.00 EUR
    Commercial - Research 5000.00 EUR
    Prix Non Membres
    Academic - Commercial 7000.00 EUR
    Academic - Research Free
    Commercial - Commercial 7000.00 EUR
    Commercial - Research 7000.00 EUR

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0