AnCora Catalan 2.0.0
View resource name in all available languages
Corpus AnCora catalan 2.0.0
The AnCora Catalan Corpus 2.0.0 is a corpus of 500,000 words annotated at different levels:
- Lemma and Part of Speech,
- Syntactic constituents and functions,
- Argument structure and thematic roles,
- Semantic classes of the verb,
- Denotative type of deverbal nouns,
- Nouns related to WordNet synsets,
- Named Entities,
- Coreference relation.
The annotation process was carried sequentially from lower- to upper-level layers of linguistic description (i.e. first morphology, next different levels of syntactic description, and finally semantic annotation). The annotation was performed manually, semi-automatically, or fully automatically, depending on the corresponding linguistic information.
View resource description in
Le Corpus Ancora catalan 2.0.0 est un corpus de 500,000 mots annotés à différents niveaux :
- Lemmes et Part of Speech,
- Fonctions et constituants syntaxiques,
- Rôles thématiques et structures d’arguments,
- Classes sémantiques des verbes,
- Type dénotatif des noms déverbaux,
- Noms liés aux synsets de WordNet,
- Entités nommées,
- Relation de coréférence.
Le processus d’annotation a été menée de façon séquentielle du plus bas au plus haut niveau de description linguistique (ex. en premier la morphologie, puis différents niveaux de description syntaxique et finalement d’annotation syntaxique). L’annotation a été effectuée manuellement, de façon semi-automatique ou totalement automatisée en fonction des informations linguistiques correspondantes.
MEMBER | academic | commercial |
Licence: Attribution, Commercial Use - GPL |
0.00 €
0.00 €
NON MEMBER | academic | commercial |
Licence: Attribution, Commercial Use - GPL |
0.00 €
0.00 €