ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-W0122
    Tâche partagée CoNLL 2007 – grec, hongrois et italien
    Le corpus de la tâche partagée CoNLL 2007 - grec, hongrois et italien contient des treebanks annotés en dépendances en trois langues, utilisés dans le cadre de la tâche partagée CoNLL 2007 concernant l’analyse en dépendances syntaxiques multilingues et de l’adaptation au domaine. Les langues couvertes par cette édition sont les suivantes: grec, hongrois et italien.

    La conférence CoNLL (Conference on Computational Natural Language Learning – Conférence sur l’apprentissage du langage naturel computationnel) s’accompagne chaque année d’une tâche partagée visant à promouvoir les applications de traitement du langage naturel et les évalue dans un environnement standardisé. En 2006 et 2007, la tâche partagée s’est consacrée à l’analyse en dépendances syntaxiques, exploitant des corpus allant jusqu’à 13 langues. La tâche avait pour objectif de définir et élargir l’état de l’art du moment de l’analyse en dépendances syntaxiques, une technologie venant en complément de tâches précédentes par la production d’un genre différent des descriptions syntaxiques des textes en entrée. La tâche partagée 2007 a ajouté une tâche de vérification de l’adaptation au domaine pour l’anglais en plus de la tâche multilingue. Plus d’informations sur CoNLL et la tâche partagée de 2007 sont disponibles respectivement sur http://www.signll.org/conll/ et http://www.conll.org/previous-tasks.

    Les données sources des treebanks de cette édition comprennent principalement différents types de textes (manuels, actualités, littérature, etc.) annotés en dépendance. En général, la grammaire de dépendance est basée sur le principe que le verbe est le centre de la structure propositionnelle et que les autres unités de la phrase sont connectées au verbe par des liens directs ou dépendances. C’est une correspondance biunivoque : pour chaque élément, on a un noeud de la structure de la phrase correspondant à l’élément donné. Dans les grammaires en constituants ou en structures de phrases, d’une part, les propositions sont divisées en locutions nominales et en locutions verbales et dans chaque phrase, un ou plusieurs nœuds peut correspondre à un élément. L’ensemble des données fournies dans cette édition sont des treebanks en dépendances.

    Les ensembles de données individuels sont:
    Treebank en dépendances grec (grec)
    Treebank de Szeged (SzTB) (hongrois)
    ISST-CoNLL (italien)

    Ce corpus est distribué conjointement avec le Linguistic Data Consortium (LDC). La référence catalogue LDC est: https://catalog.ldc.upenn.edu/LDC2018T07.

    ISLRN : 270-733-242-642-3
    Production
    Date de création : 2007
    Informations techniques
    Support de distribution : Downloadable
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
    written corpus 
     
    Prix Membres
    Academic - Research Free
    Commercial - Research Free
    Prix Non Membres
    Academic - Research Free
    Commercial - Research Free

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0