TRAD Arabic-French Mailing lists Parallel corpus - Development set

View resource name in all available languages

Corpus TRAD parallèle arabe-français - listes de discussion - Données de développement

333-026-450-858-0

ID:

ELRA-W0107

This is a parallel corpus of 10,000 words in Arabic and a reference translation in French. The source texts are emails collected from Wikiar-I, a mailing list for discussions about the Arabic Wikipedia. The collected emails are dated from 2004 to 2007.

The translation has been conducted following a strict protocol aimed at producing high quality translations.

The content is also translated into English (see ELRA-W0108).

This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA). It was used as a development set for the 2014 TRAD MT evaluation campaign.

View resource description in French

Il s’agit d’un corpus parallèle de 10,000 mots en arabe et de la traduction de référence en français. Les textes sources sont extraits de la liste de diffusion Wikiar-l, une liste permettant de discuter du Wikipedia en langue arabe. Les courriels collectés ont été écrits sur la période 2004-2007.

La traduction a été réalisée en suivant un protocole rigoureux permettant de produire des traductions de bonne qualité.

Le contenu a également été traduit vers l’anglais (voir ELRA- W0108).

Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA). Il a été utilisé en tant que corpus de développement lors de la campagne d’évaluation TRAD 2014.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
150.00 € submit
500.00 € submit
Licence: Commercial Use - ELRA VAR
500.00 € submit
500.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
300.00 € submit
1000.00 € submit
Licence: Commercial Use - ELRA VAR
1000.00 € submit
1000.00 € submit
14/10/2016
Resources from the same project