TRAD Chinese-French Parallel Text - Blog

View resource name in all available languages

Corpus TRAD de textes parallèles chinois-français – blog

713-266-631-883-0

ID:

ELRA-W0125

TRAD Chinese-French Parallel Text - Blog was developed by ELDA as part of the PEA-TRAD project. It contains English translations of a subset of approximately 10,000 Chinese words from GALE Phase 1 Chinese Blog Parallel Text (available here: https://catalog.ldc.upenn.edu/LDC2008T06).

The PEA-TRAD project (Translation as a Support for Document Analysis) was supported by the French Ministry of Defense (DGA). Its purpose was to develop speech-to-speech translation technology for multiple languages (e.g., Arabic, Chinese, Pashto) from a variety of domains.

This release consists of 444 segments (translations units) from 17 documents. The source data is Chinese blog text collected and translated into English by LDC for the DARPA GALE (Global Autonomous Language Exploitation) program. Information about the ELDA translation team, translation guidelines and validation results is contained in the documentation accompanying this release.

The Chinese source file contains 15,809 characters and the French reference translation contains 11,769 words. The data is presented in two unicode-encoded XML files along with an associated DTD.

Click here for licensing instructions: https://catalog.ldc.upenn.edu/LDC2018T02.

View resource description in French

Corpus TRAD de textes parallèles chinois-français – blog a été développé par ELDA dans le cadre du projet PEA-TRAD. Il contient les traductions en français d’un sous-ensemble d’environ 10000 mots en chinois provenant du corpus de textes parallèles de blogs de GALE Phase 1 (disponible ici: https://catalog.ldc.upenn.edu/LDC2008T06).

Le projet PEA-TRAD (traduction comme support à l’analyse documentaire) a été réalisé avec le soutien de la Direction Générale de l'Armement (DGA). Son objectif a été de développer des technologies pour la traduction parole-parole dans plusieurs langues (par ex. arabe, chinois, pachto) dans plusieurs domaines.

Cette publication consiste en 444 segments (unités de traduction) de 17 documents. Les données source proviennent de textes de blogs en chinois collectés et traduits en anglais par le LDC pour le programme GALE (“Global Autonomous Language Exploitation”) du DARPA. Les informations concernant l’équipe de traduction ELDA, les instructions de traduction et les résultats de validation sont contenus dans la documentation fournie avec les données.

Le fichier source en chinois contient 15809 caractères et la traduction de référence en français contient 11769 mots. Les données sont présentées dans deux fichiers XML codés en Unicode fournis avec la DTD associée.

Veuillez cliquer ci-après pour les instructions sur les licences: https://catalog.ldc.upenn.edu/LDC2018T02.

MEMBERacademiccommercial
Licence: Non Commercial Use - Non Standard Licence Terms
NON MEMBERacademiccommercial
Licence: Non Commercial Use - Non Standard Licence Terms
24/01/2018
People who looked at this resource also viewed the following: