ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Catalogue de Ressources Linguistiques

    ELRA met à disposition des Ressources Linguistiques gratuites. mise à jour Jeudi 24 Janvier 2013


    Le Catalogue de Ressources Linguistiques d’ELRA présente un répertoire des Ressources Linguistiques (RL) mises à disposition par ELRA.


    (voir l’image pleine page)

    Un nombre croissant de RL couvrant différents domaines des technologies de la langue (voir illustration à gauche) sont distribuées par ELDA, le corps opérationnel d’ELRA, grâce aux contributions de divers acteurs de la communauté des technologies de la langue.

    Notre objectif, à travers ce répertoire, est de mettre des ressources linguistiques à la disposition de la communauté pour éviter aux chercheurs et aux développeurs de perdre du temps à produire des ressources qui existent déjà, mais aussi pour les aider à identifier ces ressources et à y accéder.

    D’autres ressources identifiées, mais non disponibles via ELRA, sont présentées dans le Catalogue Universel.

    Pour toute suggestion ou commentaire, ou pour toute demande d’information sur ELRA et son Catalogue de Ressources Linguistiques, rendez-vous à la section Contactez-nous.

    ELRA est partenaire de OLAC (Open Language Archives Community). Le catalogue ELRA peut être visualisé sous la forme d’une archive OLAC.

    Nouvelles ressources
  • ELRA-S0366 : Corpus LECTRA (LECture TRAnscriptions in European Portuguese)
    Ce corpus est constitué des données
    audio et transcriptions manuelles en
    portugais provenant de sept cours d’un
    semestre universitaire. Le corpus
    contient un total de 28 heures de parole
    audio qui ont été transcrites
    manuellement par plusieurs annotateurs
    formés à cette tâche. Le corpus est
    composé de cours techniques
    universitaires.

  • ELRA-S0367 : Corpus CORAL
    Le corpus CORAL est une est la
    collection de dialogues parlés en
    portugais européen. Il comprend 56
    dialogues sur un sujet prédéterminé: des
    cartes. L’un des participants (“giver”)
    a une carte avec des points de repères
    et un chemin tracé entre les points de
    repère; l’autre participant (“follower”)
    a également un carte avec des points de
    repères mais pas de chemin et doit donc
    le reconstruire. Seule une transcription
    orthographique a été faite sur la
    totalité du corpus. Un enregistrement
    pilote a été annoté à différents
    niveaux.

  • ELRA-S0370 : Corpus de parole et de bruit MoveOn
    Le corpus de parole et de bruit MoveOn a
    été produit dans le cadre du projet
    MoveOn. Il s’agit d’un corpus enregistré
    dans des conditions extrêmes au sein
    d’un environnement sonore associé à la
    moto. Les énoncés sont en anglais
    britannique. Il s’agit de systèmes de
    dialogue types, de systèmes de commande
    et de contrôle orientés, entre autres,
    vers le domaine de la Police. Une grande
    partie du corpus contient de la parole
    en milieu bruité et du bruit de fond
    enregistrés depuis une moto. L’autre
    partie du corpus contient une version
    propre, enregistrée dans un
    environnement de bureau suivant les
    mêmes spécifications (incluant le casque
    du motard).

  • ELRA-S0368 : Corpus oral népalais
    Le corpus oral népalais contient des
    enregistrements audio provenant de
    différentes activités sociales réalisées
    dans leur environnement naturel autant
    que possible. Il comprend les textes
    transcrits et annotés au niveau
    phonologique, ainsi que les informations
    sur les participants. 17 types
    d’activités ont été enregistrés. La
    durée temporelle totale du matériel
    enregistré se monte à 31 heures et 26
    minutes.

  • ELRA-S0369 : CLIPS_MT_MANUAL
    CLIPS_MT_MANUAL est un sous-corpus du
    corpus d’origine italien CLIPS (Corpora
    e Lessici dell'Italiano Parlato e
    Scritto). Ce corpus contient 3228
    fichiers-signal WAV inspectés et
    partiellement réparés, chacun comprenant
    un tour de dialogue (*.wav), 3228
    fichiers d’annotations d’origine CLIPS
    corrigés (*.acs, *.phn, *.std, *.wrd),
    3228 fichiers “Partitur” BAS contenant
    les couches d’annotation ORT, KAN et SAP
    (*.par), 3228 fichiers d’annotation de
    la base de données EMU (*.vot, *.hlb),
    l’ensemble couvrant 30 dialogues de type
    « maptask » réalisés par 30 locuteurs
    (chaque paire de locuteur a réalisé deux
    différentes « maptask »), et enregistré
    dans 15 lieux différents d’Italie en
    2000-2004.

  • (dernière mise à jour : juillet 2014)

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0