Bitext Lexical Dataset - Arabic (MSA)

View resource name in all available languages

Base de données lexical Bitext - arabe (MSA)

034-867-750-463-4

ID:

ELRA-L0136

The series of Bitext Lexical Datasets includes Lemmas, POS tagging, Frequency, Named Entities and Offensive features. Depending on the dataset and language, other syntactic and morphological features are also provided. The Bitext Lexical Dataset - Arabic (MSA) consists of 22,000 lemmas (17,000,000 forms) as well as the following extra features: Voice, Tense, Mood, Person, Number, Gender, Case, Definiteness and Pronominal Clitics.

View resource description in French

La série de bases de données lexicales Bitext comprend les lemmes, l'étiquetage en partie du discours, la fréquence, les entités nommées et l'indication si le terme contient la notion d'agressivité ou non. En fonction de l'ensemble de données et de la langue, d'autres informations synatiques et lexicales sont également fournies. La base de données lexicale Bitext - arabe (MSA) consiste en 22,000 lemmes (17,000,000 formes) ainsi que les informations supplémentaires suivantes: voix, temps, mode, personne, nombre, genre, cas, défini/indéfini et les clitiques pronominaux.

MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
85000.00 € submit
NON MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
85000.00 € submit
17/07/2023
People who looked at this resource also viewed the following: