Bitext Lexical Dataset - Portuguese – ELRA Catalogue

Last view: 2025-06-30

28 Last view: 2025-06-30

Bitext Lexical Dataset - Portuguese

View resource name in all available languages

Base de données lexical Bitext - portugais

ISLRN: 984-017-567-921-2

ID:

ELRA-L0148

The series of Bitext Lexical Datasets includes Lemmas, POS tagging, Frequency, Named Entities and Offensive features. Depending on the dataset and language, other syntactic and morphological features are also provided. The Bitext Lexical Dataset - Portuguese consists of 40,000 lemmas (3,500,000 forms) as well as the following extra features: Tense, Mood, Person, Number, Gender and Pronominal Clitics.

View resource description in French

La série de bases de données lexicales Bitext comprend les lemmes, l'étiquetage en partie du discours, la fréquence, les entités nommées et l'indication si le terme contient la notion d'agressivité ou non. En fonction de l'ensemble de données et de la langue, d'autres informations synatiques et lexicales sont également fournies. La base de données lexicale Bitext - portugais consiste en 40,000 lemmes (3,500,000 formes) ainsi que les informations supplémentaires suivantes: temps, mode, personne, nombre, genre et clitiques pronominaux.

MEMBER	academic	commercial
Licence: Commercial Use - ELRA VAR		67000.00 €

NON MEMBER	academic	commercial
Licence: Commercial Use - ELRA VAR		67000.00 €

DistributionAvailability start date 17/07/2023 Contact Person

Valérie Mapelli

text

Lexical Conceptual Resource General Information

Computational Lexicon

Monolingual text lexicalConceptualResourceLanguages

Portuguese

Linguality

Linguality type: Monolingual

Size

40,000 Entries

Metadata

Created: 07/17/2023

Last Updated: 07/17/2023

Metadata Language: French, English (fr, en)

People who looked at this resource also viewed the following: