TRAD Arabic-English Parallel corpus of transcribed Broadcast News Speech

View resource name in all available languages

Corpus TRAD parallèle arabe-anglais (transcriptions d’actualités télédiffusées)

812-050-111-234-9

ID:

ELRA-W0102

This is a parallel corpus of 10,000 words in Arabic and 2 reference translations in English. The source texts are transcriptions of broadcast news in Arabic recorded on France 24. The translation has been conducted by two different translation teams following a strict protocol aimed at producing high quality translations.

The content is also translated into French (see ELRA-W0101).

This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA). It was used as a test set for an internal evaluation campaign.

View resource description in French

Il s’agit d’un corpus parallèle de 10,000 mots en arabe et 2 traductions de référence en anglais. Les données sources sont constituées de la transcription d’enregistrements d'émissions diffusées en arabe sur France 24. La traduction a été réalisée par deux équipes de traduction différentes en suivant un protocole rigoureux permettant de produire des traductions de bonne qualité.

Le contenu a également été traduit vers le français (voir ELRA-W0101).

Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA). Il a été utilisé en tant que données de test lors d’une campagne d’évaluation de la traduction automatique interne au projet.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
150.00 € submit
500.00 € submit
Licence: Commercial Use - ELRA VAR
500.00 € submit
500.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
300.00 € submit
1000.00 € submit
Licence: Commercial Use - ELRA VAR
1000.00 € submit
1000.00 € submit
14/10/2016
Resources from the same project