ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Catalogue de Ressources Linguistiques

    ELRA met à disposition des Ressources Linguistiques gratuites. mise à jour Jeudi 24 Janvier 2013


    Le Catalogue de Ressources Linguistiques d’ELRA présente un répertoire des Ressources Linguistiques (RL) mises à disposition par ELRA.


    (voir l’image pleine page)

    Un nombre croissant de RL couvrant différents domaines des technologies de la langue (voir illustration à gauche) sont distribuées par ELDA, le corps opérationnel d’ELRA, grâce aux contributions de divers acteurs de la communauté des technologies de la langue.

    Notre objectif, à travers ce répertoire, est de mettre des ressources linguistiques à la disposition de la communauté pour éviter aux chercheurs et aux développeurs de perdre du temps à produire des ressources qui existent déjà, mais aussi pour les aider à identifier ces ressources et à y accéder.

    D’autres ressources identifiées, mais non disponibles via ELRA, sont présentées dans le Catalogue Universel.

    Pour toute suggestion ou commentaire, ou pour toute demande d’information sur ELRA et son Catalogue de Ressources Linguistiques, rendez-vous à la section Contactez-nous.

    ELRA est partenaire de OLAC (Open Language Archives Community). Le catalogue ELRA peut être visualisé sous la forme d’une archive OLAC.

    Nouvelles ressources
  • ELRA-S0371 : Corpus PortMedia français et italien
    Le corpus comprend 700 dialogues
    transcrits d’environ 140 locuteurs
    français et 604 dialogues transcrits
    d’environ 150 locuteurs italiens
    (plusieurs dialogues par locuteur). La
    méthode choisie pour la construction du
    corpus est celle d’un système « magicien
    d’Oz ». Elle consiste à simuler un
    dialogue homme-machine en langage
    naturel. Le scénario est construit pour
    le domaine de l’information touristique
    et la réservation. Une transcription et
    une annotation sémantique manuelles sont
    fournies avec les fichiers wave
    correspondants.

  • ELRA-B0015 : Package d’évaluation MEDIA
    Corpus PortMedia français et italien
    Le corpus comprend 700 dialogues
    transcrits d’environ 140 locuteurs
    français et 604 dialogues transcrits
    d’environ 150 locuteurs italiens
    (plusieurs dialogues par locuteur). La
    méthode choisie pour la construction du
    corpus est celle d’un système « magicien
    d’Oz ». Elle consiste à simuler un
    dialogue homme-machine en langage
    naturel. Le scénario est construit pour
    le domaine de l’information touristique
    et la réservation. Une transcription et
    une annotation sémantique manuelles sont
    fournies avec les fichiers wave
    correspondants.

  • ELRA-S0366 : Corpus LECTRA (LECture TRAnscriptions in European Portuguese)
    Ce corpus est constitué des données
    audio et transcriptions manuelles en
    portugais provenant de sept cours d’un
    semestre universitaire. Le corpus
    contient un total de 28 heures de parole
    audio qui ont été transcrites
    manuellement par plusieurs annotateurs
    formés à cette tâche. Le corpus est
    composé de cours techniques
    universitaires.

  • ELRA-S0367 : Corpus CORAL
    Le corpus CORAL est une est la
    collection de dialogues parlés en
    portugais européen. Il comprend 56
    dialogues sur un sujet prédéterminé: des
    cartes. L’un des participants (“giver”)
    a une carte avec des points de repères
    et un chemin tracé entre les points de
    repère; l’autre participant (“follower”)
    a également un carte avec des points de
    repères mais pas de chemin et doit donc
    le reconstruire. Seule une transcription
    orthographique a été faite sur la
    totalité du corpus. Un enregistrement
    pilote a été annoté à différents
    niveaux.

  • ELRA-S0370 : Corpus de parole et de bruit MoveOn
    Le corpus de parole et de bruit MoveOn a
    été produit dans le cadre du projet
    MoveOn. Il s’agit d’un corpus enregistré
    dans des conditions extrêmes au sein
    d’un environnement sonore associé à la
    moto. Les énoncés sont en anglais
    britannique. Il s’agit de systèmes de
    dialogue types, de systèmes de commande
    et de contrôle orientés, entre autres,
    vers le domaine de la Police. Une grande
    partie du corpus contient de la parole
    en milieu bruité et du bruit de fond
    enregistrés depuis une moto. L’autre
    partie du corpus contient une version
    propre, enregistrée dans un
    environnement de bureau suivant les
    mêmes spécifications (incluant le casque
    du motard).

  • (dernière mise à jour : septembre 2014)

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0