Metalogue Multi-Issue Bargaining Dialogue

View resource name in all available languages

Corpus de dialogue de négociation multi-thème Metalogue

217-906-813-531-9

ID:

ELRA-S0394

INTRODUCTION

Metalogue Multi-Issue Bargaining Dialogue was developed by the Metalogue Consortium (http://cordis.europa.eu/project/rcn/110655_en.html) under the European Community's Seventh Framework Programme for Research and Technological Development (https://ec.europa.eu/research/fp7/index_en.cfm). This release consists of approximately 2.5 hours of semantically annotated English dialogue data that includes speech and transcripts.

The goal of the Metalogue project was to develop a dialogue system with flexible dialogue management to enable the system's behavior in setting goals, choosing strategies and monitoring various processes. Participants were involved in a multi-issue bargaining scenario in which a representative of a city council and a representative of small business owners negotiated the implementation of new anti-smoking regulations. The negotiation involved four issues, each with four or five options. Participants received a preference profile for each scenario and negotiated for an agreement with the highest value based on their preference information. Negotiators were not allowed to accept an agreement with a negative value or to share their preference profiles with other participants.

DATA

Six unique subjects (undergraduates between 19 and 25 years of age) participated in the collection. The dialogue speech was captured with two headset microphones and saved in 16kHz, 16-bit mono linear PCM FLAC format. Speech signal files are of two types: full dialogue session; and segmented speech signal, cut per speaker and roughly per turn.

Transcripts were produced semi-automatically, using an automatic speech recognizer followed by manual correction.

Seven types of annotation were performed manually using the Anvil tool (http://www.anvil-software.org): dialogue act annotations; discourse structure acts; contact management acts; task management dialogue acts; negotiation moves; rhetorical relations; and disfluencies in speech production. More information about the annotation process is included in the documentation.

All text is presented in UTF-8 as either plain text or XML.

View resource description in French

INTRODUCTION

Le corpus de dialogue de négociation multi-thème Metalogue a été développé par le consortium Metalogue (http://cordis.europa.eu/project/rcn/110655_en.html) dans le cadre du septième Programme-Cadre pour la recherche et le développement technologique de la Communauté européenne (https://ec.europa.eu/research/fp7/index_en.cfm). Cette publication contient environ 2,5 heures de données de dialogue annotées au niveau sémantique en anglais et comprend les données de parole et les transcriptions.

L’objectif du project Metalogue est de développer un système de dialogue avec une gestion flexible des dialogues afin de permettre au comportement du système de définir des buts, choisir des stratégies et contrôler les divers processus. Les participants ont pris part dans un scénario de négociation multi-thème au cours duquel un représentant du conseil municipal et un représentant d’une PME négocient la mise en œuvre d’un nouveau règlement anti-tabac. La négociation prend en compte quatre thèmes, chacun comprenant quatre ou cinq options. Les participants reçoivent un profil de préférence pour chaque scénario et négocient dans le but d’obtenir un accord avec la valeur la plus haute basée sur leur préférence. Les négociateurs ne sont pas autorisés à accepter un accord avec une valeur négative, ni de partager leurs profils de préférence avec d’autres participants.

DONNEES

Six sujets uniques (étudiants entre 19 et 25 ans) ont participé à la collecte. Les données audio de dialogue ont été captées via deux micro-casques et sauvegardées au format FLAC en 16kHz, 16-bit mono linéaire PCM. Les fichiers de signaux de parole sont de deux types: une session de dialogue complète et le signal de parole segmenté, coupé par locuteur et par tour de parole (approximativement).

Les transcriptions ont été produites de façon semi-automatique, en utilisant un système de reconnaissance de parole automatique, suivi par une correction manuelle.

Sept types d’annotation ont été réalisées manuellement en utilisant l’outil Anvil (http://www.anvil-software.org): annotations d’actes de dialogue; actes de structure de discours; actes de gestion de contact; actes de dialogue de gestion de tâche; tours de négociation; relations rhétoriques; et les "disfluences" dans la production de parole. Plus d’informations sur le procédé d’annotation sont incluses dans la documentation.

Tous les textes sont présentés en UTF-8 soit en texte plein soit en XML.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
0.00 € submit
0.00 € submit
Licence: Commercial Use - ELRA VAR
0.00 € submit
0.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
250.00 € submit
250.00 € submit
Licence: Commercial Use - ELRA VAR
250.00 € submit
250.00 € submit
17/01/2018
People who looked at this resource also viewed the following: