The FAME! Speech Corpus
View resource name in all available languages
Corpus oral FAME!
ID:
ELRA-S0391
The components of the Frisian data collection are speech and language resources gathered for building a large vocabulary ASR system for the Frisian language.
Firstly, a new broadcast database is created by collecting recordings from the archives of the regional broadcaster Omrop Fryslân, and annotating them with various information such as the language switches and speaker details.
The second component of this collection is a language model created on a text corpus with diverse vocabulary.
Thirdly, a Frisian phonetic dictionary with the mappings between the Frisian words and phones is built to make the ASR viable for this under-resourced language.
Finally, an ASR recipe is provided which uses all previous resources to perform recognition and present the recognition accuracies.
The Corpus consists of 203 audio segments of approximately 5 minutes long extracted from various radio programs covering a time span of almost 50 years (1966-2015), adding a longitudinal dimension to the database.
The content of the recordings are very diverse including radio programs about culture, history, literature, sports, nature, agriculture, politics, society and languages.
The total duration of the manually annotated radio broadcasts sums up to 18 hours, 33 minutes and 57 seconds. The stereo audio data has a sampling frequency of 48 kHz and 16-bit resolution per sample. The available meta-information helped the annotators to identify these speakers and mark them either using their names or the same label (if the name is not known). There are 309 identified speakers in the FAME! Speech Corpus, 21 of whom appear at least 3 times in the database. These speakers are mostly program presenters and celebrities appearing multiple times in different recordings over years. There are 233 unidentified speakers due to lack of meta-information. The total number of word- and sentence-level code-switching cases in the FAME! Speech Corpus is equal to 3837.
Music portions have been replaced by noise, except where these overlap with speech.
View resource description in
French
La collection de données en frison est composée de ressources linguistiques de parole rassemblées afin de concevoir un système de reconnaissance automatique de la parole sur large vocabulaire pour la langue frisonne.
Tout d’abord, une base de données télé-radio-diffusées a été créée en collectant des enregistrements des archives de la chaîne régionale Omrop Fryslân, et en les annotant avec des informations variées telles que les changements de langue et les details des locuteurs.
Le deuxième composant de cette collection est un modèle de langage créé sur la base d’un corpus textuel avec un vocabulaire divers.
Le troisième composant est un dictionnaire phonétique du frison comprenant les correspondances entre les mots et phones frisons qui a été constitués afin de rendre le système de reconnaissance viable pour cette langue peu fournie en ressources.
Enfin, une formule pour le système de reconnaissance automatique a été fournie. Elle utilise les ressources précédemment citées afin de réaliser le travail de reconnaissance et de ressortir des résultats avec exactitude.
Le corpus comprend 203 segments audio d’environ 5 minutes chacun, extraits de divers programmes radio couvrant un éventail temporel de près de 50 ans (1966-2015), permettant d’ajouter une dimension longitudinale à la base de données.
Le contenu des enregistrements est très varié et inclut des programmes radio sur la culture, l’histoire, la littérature, le sport, la nature, l’agriculture, la politique, la société et les langues.
La durée totale des annotations manuelles des enregistrements radio totalise 18 heures, 33 minutes et 57 secondes. Les données audio stéréo ont une fréquence d’échantillonnage de 48 kHz et une résolution de 16-bit par échantillon. La méta-information disponible a permis aux annotateurs d’identifier les locuteurs et de les marquer en indiquant leurs noms ou en ajoutant une étiquette si le nom n’était pas connu. 309 locuteurs sont identifiés dans le corpus oral FAME!, dont 21 apparaissant au moins 3 fois dans la base de données. Ces locuteurs sont principalement des présentateurs de programmes ou des célébrités apparaissant plusieurs fois dans différents enregistrements sur plusieurs années. 233 locuteurs n’ont pu être identifiés à cause du manque de méta-information. Les cas de changements de code au niveau du mot et de la phrase se montent à 3837.
Les portions de musique ont été remplacées par du bruit, excepté lorsqu’elles se trouvent superposées à la parole.
MEMBER | academic | commercial |
---|---|---|
Licence: Non Commercial Use - ELRA END USER |
0.00 €
|
1500.00 €
|
Licence: Commercial Use - ELRA VAR |
1500.00 €
|
1500.00 €
|
NON MEMBER | academic | commercial |
---|---|---|
Licence: Non Commercial Use - ELRA END USER |
0.00 €
|
3500.00 €
|
Licence: Commercial Use - ELRA VAR |
3500.00 €
|
3500.00 €
|