Bulgarian Event Corpus

View resource name in all available languages

Corpus d’évènements en bulgare

832-960-876-604-2

ID:

ELRA-W0329

The Bulgarian Event Corpus is composed 324,905 tokens appropriate for training Named Entity Recognition (NER), Named Entity Linking (NEL) and Event Recognition models for Bulgarian in a multidomain context within Humanities. The texts are domain related. They include documents from the area of Social Sciences and Humanities – scientific papers, archive documents, popular documents, and Wikipedia articles in the relevant areas.

The annotation scheme reflects the rationale behind the CIDOC-CRM ontology since this ontology has been widely used in the areas of GLAM and Humanities. The annotation scheme envisages two main layers: the first one is the Named Entity (NE) layer - 16 types, and the second one is the event layer where each event is connected to its participants – 39 event labels.

View resource description in French

Le Corpus d’évènements en bulgare est un corpus de 324 905 tokens adéquats pour l’entraînement de modèles de reconnaissance d’entités nommées (« Named Entity Recognition – NER »), de relations entre entités nommées (« Named Entity Linking – NEL ») et de reconnaissance d’évènements dans un contexte multi-domaine dans le cadre des sciences sociales et humaines : articles scientifiques, documents d’archives, documents populaires et articles Wikipédia dans les domaines d’intérêt.

Le schéma d’annotation reflète le raisonnement derrière l’ontologie CIDOC-CRM puisque cette ontologie a été largement employée dans les domaines du GLAM et des sciences humaines. Le schéma d’annotation envisage deux couches principales, la première au niveau de l’entité nommée avec 16 types correspondants et la seconde au niveau de l’évènement où chaque événement est connecté à ses participants avec 39 étiquettes d’événements.

MEMBERacademiccommercial
Licence: Attribution, Share Alike - CC-BY-SA-3.0
0.00 € submit
0.00 € submit
NON MEMBERacademiccommercial
Licence: ? - CC-BY-SA-3.0
0.00 € submit
Licence: Attribution, Share Alike - CC-BY-SA-3.0
0.00 € submit
03/10/2022
People who looked at this resource also viewed the following: