TRAD Chinese-English Email Parallel corpus – Development Set

View resource name in all available languages

Corpus TRAD parallèle chinois-anglais (courriels) – données de développement

447-281-370-489-0

ID:

ELRA-W0113

This is a parallel corpus of 15,000 characters in Chinese (equivalent to 10,000 words) and a reference translation in English. The source texts are a selection of emails from the Speechocean King-NLP-001 corpus, a corpus of private emails collected from the daily life and business domains.

The content has also been translated into French (see ELRA-W0114).

This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA). It was used as a development set for MT systems.

View resource description in French

Il s’agit d’un corpus parallèle de 15,000 caractères en chinois (équivalent à 10,000 mots) et une traduction de référence en anglais. Les textes sources proviennent de courriels extraits du corpus King-NLP-001 de Speechocean, un corpus de courriels de la vie quotidienne et professionnelle collectés auprès de particuliers.

Le contenu a également été traduit vers le français (voir ELRA-W0114).

Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA). Il a été utilisé pour le développement de systèmes de traduction automatique.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
150.00 € submit
500.00 € submit
Licence: Commercial Use - ELRA VAR
500.00 € submit
500.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
300.00 € submit
1000.00 € submit
Licence: Commercial Use - ELRA VAR
1000.00 € submit
1000.00 € submit
21/11/2016 Downloadable
People who looked at this resource also viewed the following:
Resources from the same project