Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Informations
Procédure & Conditions d'achat
Prix et licences d'utilisation
Comment promouvoir vos ressources ?
Contactez-nous
Référence Catalogue : E0022
Package d’évaluation EQueR
Le package d’évaluation EQueR a été produit dans le cadre du projet national français EQueR (« Evaluation en Question-Réponse »), issu du programme Technolangue, financé par le Ministère français délégué à la Recherche et aux Nouvelles Technologies (MRNT). Le projet EQueR a permis de réaliser une campagne d'évaluation des systèmes de question-réponse pour le français.
Ce package comprend l’ensemble des données utilisées lors de la campagne d’évaluation EQueR. Il regroupe des ressources, des protocoles, des outils de notation, les résultats de la campagne officielle, etc., qui ont été utilisés ou produits pendant la campagne. Le but de ce « package » d’évaluation est de permettre à tout acteur externe de pouvoir évaluer son propre système et ainsi, de pouvoir comparer ses résultats à ceux obtenus pendant la campagne.
La campagne se décompose en deux actions :
1) Une tâche générique : consiste à évaluer les performances des systèmes de question-réponse sur une collection hétérogène de textes.
2) Une tâche spécialisée : consiste à évaluer les performances des systèmes de question-réponse sur une collection de textes du domaine médical.
Le package d’évaluation EQueR contient les données et outils suivants :
1) Deux collections textuelles:
- corpus général : environ 1,5 Go de données composées d’articles de presse de plusieurs années des journaux Le Monde et Le Monde Diplomatique, de dépêches de presse et de rapports d’information du Sénat français portant sur des sujets très variés.
- corpus médical : environ 140 Mo de données composées principalement d’articles scientifiques et de recommandations de bonne pratique médicale, sélectionnés par le CISMeF (Catalogue et Index des Sites Médicaux Francophones) du Centre Hospitalier Universitaire de Rouen.
2) Deux corpus de questions :
- 500 questions pour la tâche générique et 200 questions pour la tâche spécialisée.
- pour chaque question des deux corpus, les 100 premiers identifiants sont fournis (par le moteur de recherche Pertimm).
3) Deux sous-corpus Pertimm créés à partir des identifiants de documents renvoyés par le moteur de recherche.
4) L’ensemble des résultats fournis aux participants.
5) Logiciel d’aide à l’évaluation des résultats dans le cadre d’une évaluation de systèmes de question-réponse (avec documentation détaillée).
Une description du projet est disponible à l'adresse suivante :
http://www.technolangue.net/article.php3?id_article=195
Production
Projet :
EVALDA
Contenus
Cliquer sur la flèche afin d'afficher les informations des contenus.
written corpus
Nombre de langues
: Monolingual
Langue(s) :
français
Fichiers complémentaires
Echantillons
- Le Monde Diplomatique
Echantillons
- Le Monde
Echantillons
- Le Sénat
Echantillons
- SDA
Prix Membres
Academic - Evaluation 150.00 EUR
Commercial - Evaluation 500.00 EUR
Prix Non Membres
Academic - Evaluation 300.00 EUR
Commercial - Evaluation 1000.00 EUR
samedi 31 juillet, 2010
5266527 requêtes depuis le lundi 27 septembre, 2004
Copyright © 2008
ELRA
ELRACatalogue 0.8.0