Sequential dialogue act recognition for Arabic argumentative debates : Reconocimiento de acto de diálogo secuencial para debates argumentativos árabes

Ben Dbabis, Samira (ANLP Research Group, MIRACL Laboratory, University of Sfax, Tunisia) ; Ghorbel, Hatem (School of Engineering – HE-Arc Ingénierie, HES-SO // University of Applied Sciences Western Switzerland) ; Hadrich Belguith, Lamia (ANLP Research Group, MIRACL Laboratory, University of Sfax, Tunisia)

Dialogue act recognition remains a primordial task that helps user to automatically identify participants’ intentions. In this paper, we propose a sequential approach consisting of segmentation followed by annotation process to identify dialogue acts within Arabic politic debates.To perform DA recognition, we used the CARD corpus labeled using the SADA annotation schema. Segmentation and annotation tasks were then carried out using Conditional Random Fields probabilistic models as they prove high performance in segmenting and labeling sequential data. Learning results are notably important for the segmentation task (F-score=97.9%) and relatively reliable within the annotation process (fscore=63.4%) given the complexity of identifying argumentative tags and the presence of disfluencies in spoken conversations.

El reconocimiento del acto de diálogo sigue siendo una tarea primordial que ayuda al usuario a identificar automáticamente las intenciones de los participantes. En este documento, proponemos un enfoque secuencial que consiste en la segmentación seguida de un proceso de anotación para identificar actos de diálogo dentro de los debates políticos árabes. Para realizar el reconocimiento DA, utilizamos el corpus CARD etiquetado utilizando el esquema de anotación SADA. Las tareas de segmentación y anotación se llevaron a cabo utilizando modelos probabilísticos de Campos aleatorios condicionales, ya que demuestran un alto rendimiento en la segmentación y el etiquetado de datos secuenciales. Los resultados de aprendizaje son especialmente importantes para la tarea de segmentación (F-score = 97.9%) y relativamente confiables dentro del proceso de anotación (f-score = 63.4%) dada la complejidad de identificar etiquetas argumentativas y la presencia de disfluencias en las conversaciones habladas.


Keywords:
Article Type:
scientifique
Faculty:
Ingénierie et Architecture
School:
HE-Arc Ingénierie
Institute:
Aucun institut
Subject(s):
Ingénierie
Date:
2018-03
Pagination:
8 p.
Published in:
Procesamniento del lenguaje
Numeration (vol. no.):
2018, n° 60, pp. 53-60
DOI:
ISSN:
1135-5948
Appears in Collection:



 Record created 2019-05-28, last modified 2019-06-11

Fulltext:
Download fulltext
PDF

Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)