How2Sign Dataset

View resource name in all available languages

Ensemble de données How2Sign




The How2Sign dataset consists of a parallel corpus of speech and transcriptions of instructional videos and their corresponding American Sign Language (ASL) translation videos and annotations. It has been produced by recording 11 persons (6 males and 5 females) with various hearing status (5 self-identified as hearing, 4 as deaf, 2 as hard of hearing). During the study the upper body was recorded (face, mouth, arms and Hands). The video has been recorded at 30 fps in MPEG format. A total of 80 hours of Multiview American Sign Language videos were collected, as well as gloss annotations and a coarse video categorization.

The data is available directly at the following link:

View resource description in French

L'ensemble de données How2Sign se compose d'un corpus parallèle de parole et de transcriptions de vidéos pédagogiques et les vidéos correspondantes contenant la traduction et les annotations en langue des signes américaine (ASL). Le corpus a été produit en enregistrant 11 personnes (5 de sexe masculin et 6 de sexe féminin) avec divers statuts auditifs (5 se sont identifiés comme entendants, 4 comme sourds, 2 comme malentendants). Durant l’étude le haut du corps a été enregistré (visage, mains, bras et mains). La vidéo a été enregistrée en 30 images par seconde au format MPEG. Au total, 80 heures de vidéos prises selon plusieurs angles de vues en langue des signes américaine ont été collectées, ainsi que des annotations et une catégorisation grossière des vidéos.

Le corpus est uniquement disponible au lien suivant :

Licence: Attribution, Non Commercial Use - CC-BY-NC-4.0
NON MEMBERacademiccommercial
Licence: Attribution, Non Commercial Use - CC-BY-NC-4.0
People who looked at this resource also viewed the following: