ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : S0280
    Corpus SVC (SmartWeb Video Corpus)
    La collection de données SMARTWEB UMTS a été produite dans le cadre du projet SmartWeb financé par le gouvernement allemand de 2004 à 2006. Il comprend une collection de questions utilisateurs posées à une interface web de parole naturelle et avec comme thème principal la coupe du monde de football 2006. La collection comprend des enregistrements de champs via un appareil portable UMTS (une personne, corpus SHC-SmartWeb Handheld, réf. ELRA-S0278), des enregistrements de champs avec une capture vidéo d’un locuteur premier et d’un locuteur secondaire (corpus SVC-SmartWeb Video, réf. ELRA-S0279), ainsi que des enregistrements via des téléphones portables réalisés sur une moto BMW (un locuteur, corpus SMC-SmartWeb Motorbike, réf. ELRA-S0280).

    Ce corpus multimodal correspond aux captures vidéo d’un locuteur premier et d’un locuteur secondaire (SmartWeb Video) et contient 99 enregistrements de dialogues personne-personne-machine : un locuteur (qui est enregistré) interagit avec un partenaire humain ainsi qu’avec un système de dialogue via un smartphone (système SmartWeb).

    Le locuteur utilise un système de dialogue client-serveur (SmartWeb) pour accéder vocalement au contenu d’internet dans un environnement naturel (bureau, hall d’entrée, rue, parc, bar, etc.). La parole a été enregistrée via un micro-casque Bluetooth et transférée vers le serveur via une ligne cellulaire UMTS ; un deuxième micro collier a été utilisé sur un lecteur enregistreur portable iRiver afin de produire un signal de référence sans distortion de haute qualité. Le visage du locuteur a été filmé par la caméra du smartphone. Le signal de parole a été une première fois segmenté en requêtes (automatiquement réalisé par le système de prompt) et une deuxième fois en tours de parole, puis transcrit selon le standard de transcription Verbmobil. Le signal vidéo a été étiqueté manuellement en situations OnView / OffView (selon si le locuteur regarde ou non la caméra) et – partiellement – segmenté au niveau spatial pour la détection du visage.

    L’objectif moteur pour la constitution de ce corpus était de collecter des données multimodales réalistes (parole + visage) dans une interaction humaine réaliste, mais également de les collecter dans autant de situations OffTalk que possible (l’OffTalk étant composé de toutes les données de parole prononcées par le locuteur mais n’ayant pas pour but d’être utilisées comme entrées du système).

    Le corpus comprend :
    - nombre de dialogues / locuteurs enregistrés : 99
    - nombre de tours segmentés : 2218
    - durée totale : 971 minutes
    - formats :
    o micro collier : WAV 44,1kHz, 16 bit
    o canal Bluetooth/UMTS : ALAW 8kHz 8bit
    o video : 176x144, 24bpp, 15fps, 3GPP + MPEG1
    o transcription Verbmobil (TRS), format de partition BAS (BPF), graphe d’annotation ATLAS (XML)
    o méta-données : locuteur et protocole d’enregistrement (XML)
    - segmentation : segmentation automatique en requêtes d’entrée de système par le système de prompt ; segmentation manuelle en tours de parole ; étiquetage OffTalk ; étiquetage OffView, segmentation spatiale du visage (en partie manuelle)
    - distribution : 5 DVD-R

    Voir aussi ELRA-S0278 et ELRA-S0279.
    Production
    Projet : SmartWeb Date de création : 2004-2006
    Applications
    Applications existantes : Spoken dialogue systems
    Informations techniques
    Support de distribution : DVD
    Format de fichiers : wav
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
     Video 
     
    Prix Membres
    Academic - Commercial 1635.00 EUR
    Academic - Research 635.00 EUR
    Commercial - Commercial 1635.00 EUR
    Commercial - Research 1635.00 EUR
    Prix Non Membres
    Academic - Commercial 2275.00 EUR
    Academic - Research 1275.00 EUR
    Commercial - Commercial 2275.00 EUR
    Commercial - Research 2275.00 EUR

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0