BABEL Estonian Database

View resource name in all available languages

Base de données BABEL de l'estonien

534-335-125-202-0

ID:

ELRA-S0086

The BABEL Database is a speech database that was produced by a research consortium funded by the European Union under the COPERNICUS programme (COPERNICUS Project 1304). The project began in March 1995 and was completed in December 1998. The objective was to create a database of languages of Central and Eastern Europe in parallel to the EUROM1 databases produced by the SAM Project (funded by the ESPRIT programme).
The BABEL consortium included six partners from Central and Eastern Europe (who had the major responsibility of planning and carrying out the recording and labelling) and six from Western Europe (whose role was mainly to advise and in some cases to act as host to BABEL researchers). The five databases collected within the project concern the Bulgarian, Estonian, Hungarian, Polish, and Romanian languages.
The Estonian database consists of the basic "common" set which is:
- Many Talker Set: 30 males, 30 females; each to read 50 numbers, 1-2 connected passages, 1 block of "filler" sentences, and 1 block of syllables.
- Few Talker Set: 4 males, 4 females; each to read 50 numbers, 10 connected passages, 1 block of "filler" sentences, and 2-3 blocks of syllables.
- Very Few Talker Set: 1 male, 1 female; each to read 2 blocks of 50 numbers, 40 connected passages, 4 blocks of "filler" sentences, and 9 blocks of syllables.
And the extension part: a short description of Estonian sound system.

View resource description in French

BABEL est une base de données qui a été produite par un consortium de recherche financé par la Commission européenne dans le cadre du programme COPERNICUS (Projet COPERNICUS 1304). Le projet a débuté en mars 1995 et s'est terminé en décembre 1998. Son objectif était de créer une base de données des langues d'Europe Centrale et de l'Est en parallèle à EUROM1 produit dans le cadre du projet SAM (financé par le programme ESPRIT) pour les langues de l'Union Européeenne.

Le consortium de BABEL comprenait six partenaires d'Europe Centrale et de l'Est (ayant pour charge de planifier et réaliser l'enregistrement et l'annotation) et six partenaires de l'Europe de l'Ouest (dont le rôle principal a été de conseiller, et dans certains cas, d'héberger des chercheurs de BABEL). Les cinq bases de données collectées au cours de ce projet concernent les langues suivantes : bulgare, estonien, hongrois, polonais et roumain.

La base de données estonienne est composée d'un ensemble générique "commun":

* Grand groupe de locuteurs : ensemble comportant 30 hommes et 30 femmes. Chaque locuteur a lu 50 nombres, 1-2 passages connectés, un bloc de phrases complémentaire et un bloc de syllabes.
* Petit groupe de locuteurs : ensemble comportant 4 hommes et 4 femmes. Chaque locuteur a lu 50 nombres, 10 passages connectés, un bloc de phrases complémentaire et 2-3 blocs de syllabes.
* Très petit groupe de locuteurs : ensemble comportant 1 homme et 1 femme. Chaque locuteur a lu 2 blocs de 50 nombres, 40 passages connectés, 4 blocs de phrases complémentaires et 9 blocs de syllabes.

Cette base comporte une extension qui comprend un courte description du système sonore estonien.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
300.00 € submit
4000.00 € submit
Licence: Commercial Use - ELRA VAR
4000.00 € submit
4000.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
600.00 € submit
6000.00 € submit
Licence: Commercial Use - ELRA VAR
6000.00 € submit
6000.00 € submit
10/10/2000
People who looked at this resource also viewed the following:
Resources from the same project