ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-W0123
    Tâche partagée CoNLL 2007 – arabe et anglais
    Le corpus de la tâche partagée CoNLL 2007 - arabe et anglais contient des treebanks annotés en dépendances en deux langues, utilisés dans le cadre de la tâche partagée CoNLL 2007 concernant l’analyse en dépendances syntaxiques multilingues et de l’adaptation au domaine. Les langues couvertes par cette édition sont les suivantes: arabe et anglais.

    La conférence CoNLL (Conference on Computational Natural Language Learning – Conférence sur l’apprentissage du langage naturel computationnel) s’accompagne chaque année d’une tâche partagée visant à promouvoir les applications de traitement du langage naturel et les évalue dans un environnement standardisé. En 2006 et 2007, la tâche partagée s’est consacrée à l’analyse en dépendances syntaxiques, exploitant des corpus allant jusqu’à 13 langues. La tâche avait pour objectif de définir et élargir l’état de l’art du moment de l’analyse en dépendances syntaxiques, une technologie venant en complément de tâches précédentes par la production d’un genre différent des descriptions syntaxiques des textes en entrée. La tâche partagée 2007 a ajouté une tâche de vérification de l’adaptation au domaine pour l’anglais en plus de la tâche multilingue. Plus d’informations sur CoNLL et la tâche partagée de 2007 sont disponibles respectivement sur http://www.signll.org/conll/ et http://www.conll.org/previous-tasks.

    Les données sources des treebanks de cette édition comprennent principalement différents types de textes (manuels, actualités, littérature, etc.) annotés en dépendance. En général, la grammaire de dépendance est basée sur le principe que le verbe est le centre de la structure propositionnelle et que les autres unités de la phrase sont connectées au verbe par des liens directs ou dépendances. C’est une correspondance biunivoque : pour chaque élément, on a un noeud de la structure de la phrase correspondant à l’élément donné. Dans les grammaires en constituants ou en structures de phrases, d’une part, les propositions sont divisées en locutions nominales et en locutions verbales et dans chaque phrase, un ou plusieurs nœuds peut correspondre à un élément. L’ensemble des données fournies dans cette édition sont des treebanks en dépendances.

    Les ensembles de données individuels sont:
    Treebank en dépendances de Prague Arabic (arabe)
    CHILDES (anglais)
    PennBioIE Oncology 1.0 (anglais)
    PennBioIE CYP 1.0 (anglais)
    Treebank-3 (anglais)

    Veuillez cliquer ci-après pour les instructions sur les licences: https://catalog.ldc.upenn.edu/LDC2018T08.

    ISLRN : 505-782-255-628-8
    Production
    Date de création : 2007
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
    written corpus 
     

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0