Structured Emotion Analysis from Arabic Text
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Setif 1 University - Ferhat ABBAS , Faculty of Sciences
Abstract
In the field of Natural Language Processing (NLP), emotion analysis aims to map textual content with a predefined set of human emotions, typically including joy, anger, fear, surprise, disgust, and sadness. Current state-of-the-art research mainly focuses on identifying emotions in text using categories inspired by psychological theories, such as Ekman’s (1992) basic emotions. Despite the importance of emotion detection, most analyses are shallow and insufficient for tasks that require a deeper understanding of emotional meaning in context. Such applications necessitate addressing key questions, including identifying the cause that triggered the emotion (Cause), determining who experienced it (Experiencer), and more generally addressing structural questions such as who did what (Cue), to whom (Target), why (Cause), and how (Manner). This doctoral thesis aims to propose original and effective solutions to address the lack of resources and models dedicated to the structural analysis of emotions in Arabic text. To achieve this, we introduce a novel approach for analyzing the argument structure of emotions in Arabic, leveraging recent advances in Transformer-based architectures and, in particular, the capabilities of large language models (LLMs) for Arabic.
The main contributions of this thesis are multifold. The first contribution consists of the construction and annotation of the first Arabic corpus dedicated to structured emotion analysis, named ‘AraERL’. The thesis also provides an in-depth examination of the impact of each semantic argument on the performance of emotion identification. In addition, it explores the use of ChatGPT for annotating Arabic texts with seman- tic roles and emotions through an interlingual annotation projection approach. The work further evaluates ChatGPT’s ability to accurately translate English semantic and emotional annotation into Arabic. Finally, it offers a comprehensive comparison of the performance of open large language models for these tasks.
Description
Dans le domaine du traitement automatique des langues (TAL), l’analyse des émotions vise à associer un contenu textuel à un ensemble prédéfini d’émotions humaines, incluant généralement la joie, la colère, la peur, la surprise, le dégoût et la tristesse. Les recherches récentes se concentrent principalement sur l’identification des émotions dans les textes en s’appuyant sur des catégories inspirées par les théories psychologiques, telles que les émotions de base proposées par Ekman (1992). Malgré l’importance de la détection des émotions, la majorité des analyses restent superficielles et insuffisantes pour des tâches nécessitant une compréhension plus approfondie du sens émotionnel en contexte. De telles applications exigent de répondre à des questions clés, notamment l’identification de la cause ayant déclenché l’émotion (Cause), la détermination de la personne qui l’a ressentie (Expérient), et, plus généralement, la prise en compte d’informations structurelles telles que qui a fait quoi (Indice), à qui (Cible), pourquoi (Cause) et comment (Manière).
Cette thèse doctorale vise à proposer des solutions originales et efficaces pour pallier le manque de ressources et de modèles dédiés à l’analyse structurelle des émotions dans les textes arabes. Pour ce faire, nous introduisons une nouvelle approche d’analyse de la structure argumentaire des émotions en arabe, en tirant parti des avancées récentes des modèles fondés sur les Transformers et, en particulier, des capacités des grands modèles de langue (LLMs) pour l’arabe.
Les principales contributions de cette thèse sont multiples. La première contribution consiste en la construction et l’annotation du premier corpus arabe dédié à l’analyse structurée des émotions, nommé ”AraERL”. La thèse propose également une étude approfondie de l’impact de chaque argument sémantique sur la performance de l’identification des émotions. Elle explore ensuite l’utilisation de ChatGPT pour annoter des textes arabes avec des rôles sémantiques et des émotions à travers une approche de projection interlinguale. Ce travail évalue également la capacité de ChatGPT à projeter avec précision en arabe les annotations sémantiques et émotionnelles issues de l’anglais. Enfin, il offre une comparaison complète des performances des modèles ouverts de grande taille (open-LLMs) pour ces différentes tâches
