CHIEDE Corpus: a spontaneous child language corpus of Spanish

View resource name in all available languages

Corpus CHIEDE: corpus de langage spontané d’enfants en espagnol

153-476-889-389-7

ID:

ELRA-S0294

The spontaneous child language corpus, CHIEDE, consists of 58,163 words, in 30 texts, with 7 hours and 53 minutes of recordings and 59 child participants. About a third of the whole corpus is formed by child language and the remaining two thirds by adult speech. The main feature of CHIEDE is the interactions spontaneity: texts are recordings of communicative situations in their natural context. The resource is presented in different formats: an orthographic transcription, an automatic phonological transcription, a XML tagged version and the text-sound alignment. Results obtained after the extraction of data from the annotated texts, through statistical methods, are also provided.

The corpus presents a final design formed by two kinds of interactions: spontaneous collective conversations, recorded at a daily activity in classroom, and personal interviews, made by an adult to a single child, where the conversation loses spontaneity, as it is guided with questions.

View resource description in French

Le corpus de langage spontané d’enfants CHIEDE comprend 58 163 mots, répartis sur 30 textes et 7 heures 53 minutes d’enregistrements réalisés par 59 enfants. Environ un tiers du corpus complet est composé de langage d’enfant, tandis que les deux tiers restants sont composés de parole d’adultes. La principale particularité de CHIEDE est la spontanéité des interactions : les textes sont des enregistrements de situations de communication dans leur contexte naturel. Cette ressource est présentée sous différents formats : une transcription orthographique, une transcription phonologique automatique, un version étiquetée en XML et l’alignement texte-son. Les résultats obtenus après l’extraction de données à partir des textes annotés, effectuée au moyen de méthodes statistiques, sont également fournis.

Le corpus consiste en une présentation finale de deux types d’interaction: des conversations collectives spontanées, enregistrées lors d’activités quotidiennes en salle de classe, et des entretiens personnels, réalisés par un adulte auprès d’un seul enfant, où la conversation perd de sa spontanéité, puisqu’elle est guidée par des questions.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
100.00 € submit
3000.00 € submit
Licence: Commercial Use - ELRA VAR
3000.00 € submit
3000.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
200.00 € submit
5000.00 € submit
Licence: Commercial Use - ELRA VAR
5000.00 € submit
5000.00 € submit
11/12/2008
People who looked at this resource also viewed the following: