Shanghai Dialect Speech Data by Mobile Phone - 1,030 Hours

View resource name in all available languages

Base de données orales en dialecte de Shanghai par téléphone portable - 1 030 heures

847-433-695-199-5

ID:

ELRA-S0477

It collects 2.956 speakers from Shanghai and is recorded in quiet indoor environment. The recorded content includes multi-domain customer consultation, short messages, numbers, Shanghai POI, etc. The corpus has no repetition and the average sentence length is 12.68 words. Recording devices are mainstream Android phones and iPhones.

Format:16kHz, 16bit, uncompressed wav, mono channel
Recording Environment:quiet indoor environment, without echo
Recording Content (read speech):generic category, human-machine interaction category, numbers, Shanghai POI.
Speaker:2,956 people, 1,921 females, accounting for 65%
Device:Android mobile phone and iPhone
Language:Shanghai dialect
Transcription content:text, 4 noise symbols, special identifiers
Accuracy rate:95% (the accuracy rate of noise symbols and other identifiers is not included)
Application scenarios:speech recognition, voiceprint recognition

View resource description in French

Ce corpus regroupe 2 956 locuteurs de Shanghai et a été enregistré dans un environnement intérieur calme. Le contenu enregistré comprend des consultations clients multi-domaines, des messages courts, des nombres, des points d'intéret de Shanghai, etc. Le corpus ne comporte aucune répétition et la longueur moyenne des phrases est de 12,68 mots. Les supports d'enregistrement sont des téléphones Android et iPhones grand public.

Format:16kHz, 16bit, wav non compressé, canal mono
Environnement d'enregistrement:environnement intérieur silencieux, sans écho
Contenu des enregistrements (parole lue):catégorie générique, catégorie d'interaction homme-machine, nombres, points d'intéret de Shanghai
Locuteurs:2 956 personnes, dont 1 921 femmes représentant 65 % du corpus
Supports d'enregistrement : téléphone mobile Android et iPhone
Langue : dialecte de Shanghai
Contenu de la transcription : texte, 4 symboles de bruit, identifiants spéciaux
Taux de précision : 95 % (le taux de précision des symboles de bruit et autres identifiants n'est pas inclus)
Applications : reconnaissance vocale, reconnaissance d'empreintes vocales

MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
88065.00 € submit
88065.00 € submit
NON MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
88065.00 € submit
88065.00 € submit

Special offer:

06/10/2022
People who looked at this resource also viewed the following: