TRAD Arabic-English Mailing lists Parallel corpus - Test set
View resource name in all available languages
Corpus TRAD parallèle arabe-anglais - listes de discussion - Données de test
ID:
ELRA-W0106
This is a parallel corpus of 10,000 words in Arabic and 2 reference translations in English. The source texts are emails collected from Wikiar-I, a mailing list for discussions about the Arabic Wikipedia. The collected emails are dated from 2010 to 2012.
The translation has been conducted by two different translation teams following a strict protocol aimed at producing high quality translations.
The content is also translated into French (see ELRA-W0105).
This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA). It was used as a test set for an internal MT evaluation campaign.
View resource description in
French
Il s’agit d’un corpus parallèle de 10,000 mots en arabe et de 2 traductions de référence en anglais. Les textes sources sont extraits de la liste de diffusion Wikiar-l, une liste permettant de discuter du Wikipedia en langue arabe. Les courriels collectés ont été écrits sur la période 2010-2012.
La traduction a été réalisée par deux équipes de traduction différentes en suivant un protocole rigoureux permettant de produire des traductions de bonne qualité.
Le contenu a également été traduit vers le français (voir ELRA-W0105).
Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA). Il a été utilisé en tant que données de test lors d'une campagne d’évaluation sur la traduction automatique interne au projet.
MEMBER | academic | commercial |
---|---|---|
Licence: Non Commercial Use - ELRA END USER |
150.00 €
|
500.00 €
|
Licence: Commercial Use - ELRA VAR |
500.00 €
|
500.00 €
|
NON MEMBER | academic | commercial |
---|---|---|
Licence: Non Commercial Use - ELRA END USER |
300.00 €
|
1000.00 €
|
Licence: Commercial Use - ELRA VAR |
1000.00 €
|
1000.00 €
|