Structured Emotion Analysis from Arabic Text
| dc.contributor.author | SENATOR , Ferial | |
| dc.contributor.author | Abdelaziz , LAKHFIF Supervisor | |
| dc.contributor.author | Chahrazed , MEDIANI Co-Supervisor | |
| dc.date.accessioned | 2026-06-18T08:34:06Z | |
| dc.date.issued | 2026 | |
| dc.description | Dans le domaine du traitement automatique des langues (TAL), l’analyse des émotions vise à associer un contenu textuel à un ensemble prédéfini d’émotions humaines, incluant généralement la joie, la colère, la peur, la surprise, le dégoût et la tristesse. Les recherches récentes se concentrent principalement sur l’identification des émotions dans les textes en s’appuyant sur des catégories inspirées par les théories psychologiques, telles que les émotions de base proposées par Ekman (1992). Malgré l’importance de la détection des émotions, la majorité des analyses restent superficielles et insuffisantes pour des tâches nécessitant une compréhension plus approfondie du sens émotionnel en contexte. De telles applications exigent de répondre à des questions clés, notamment l’identification de la cause ayant déclenché l’émotion (Cause), la détermination de la personne qui l’a ressentie (Expérient), et, plus généralement, la prise en compte d’informations structurelles telles que qui a fait quoi (Indice), à qui (Cible), pourquoi (Cause) et comment (Manière). Cette thèse doctorale vise à proposer des solutions originales et efficaces pour pallier le manque de ressources et de modèles dédiés à l’analyse structurelle des émotions dans les textes arabes. Pour ce faire, nous introduisons une nouvelle approche d’analyse de la structure argumentaire des émotions en arabe, en tirant parti des avancées récentes des modèles fondés sur les Transformers et, en particulier, des capacités des grands modèles de langue (LLMs) pour l’arabe. Les principales contributions de cette thèse sont multiples. La première contribution consiste en la construction et l’annotation du premier corpus arabe dédié à l’analyse structurée des émotions, nommé ”AraERL”. La thèse propose également une étude approfondie de l’impact de chaque argument sémantique sur la performance de l’identification des émotions. Elle explore ensuite l’utilisation de ChatGPT pour annoter des textes arabes avec des rôles sémantiques et des émotions à travers une approche de projection interlinguale. Ce travail évalue également la capacité de ChatGPT à projeter avec précision en arabe les annotations sémantiques et émotionnelles issues de l’anglais. Enfin, il offre une comparaison complète des performances des modèles ouverts de grande taille (open-LLMs) pour ces différentes tâches | |
| dc.description.abstract | In the field of Natural Language Processing (NLP), emotion analysis aims to map textual content with a predefined set of human emotions, typically including joy, anger, fear, surprise, disgust, and sadness. Current state-of-the-art research mainly focuses on identifying emotions in text using categories inspired by psychological theories, such as Ekman’s (1992) basic emotions. Despite the importance of emotion detection, most analyses are shallow and insufficient for tasks that require a deeper understanding of emotional meaning in context. Such applications necessitate addressing key questions, including identifying the cause that triggered the emotion (Cause), determining who experienced it (Experiencer), and more generally addressing structural questions such as who did what (Cue), to whom (Target), why (Cause), and how (Manner). This doctoral thesis aims to propose original and effective solutions to address the lack of resources and models dedicated to the structural analysis of emotions in Arabic text. To achieve this, we introduce a novel approach for analyzing the argument structure of emotions in Arabic, leveraging recent advances in Transformer-based architectures and, in particular, the capabilities of large language models (LLMs) for Arabic. The main contributions of this thesis are multifold. The first contribution consists of the construction and annotation of the first Arabic corpus dedicated to structured emotion analysis, named ‘AraERL’. The thesis also provides an in-depth examination of the impact of each semantic argument on the performance of emotion identification. In addition, it explores the use of ChatGPT for annotating Arabic texts with seman- tic roles and emotions through an interlingual annotation projection approach. The work further evaluates ChatGPT’s ability to accurately translate English semantic and emotional annotation into Arabic. Finally, it offers a comprehensive comparison of the performance of open large language models for these tasks. | |
| dc.description.sponsorship | في مجاﻝ معالجة ﺍللغاﺕ ﺍلطبيعية، يهدﻑ تحليل ﺍلانفعالاﺕ ﺇلى ﺭبط ﺍلمحتوﻯ ﺍلنصي بمجموعة محدﺩﺓ مسبقًا من ﺍلانفعالاﺕ ﺍلبشر ية، ﻭﺍلتي تشمل عاﺩﺓً ﺍلفرﺡ ﻭﺍلغضب ﻭﺍلخوﻑ ﻭﺍلدهشة ﻭﺍلاشمئزﺍﺯ ﻭﺍلحزﻥ. تركز ﺍلأبحاﺙ ﺍلحديثة بشكل ﺃساسي على تحديد ﺍلانفعالاﺕ في ﺍلنصوﺹ باستخدﺍﻡ تصنيفاﺕ مستوحاﺓ من ﺍلنظرياﺕ ﺍلنفسية، مثل ﺍلانفعالاﺕ ﺍلأساسية ﺍلتي ﺍقترحها ﺇيكماﻥ .(1992) ﻭﺭغم ﺃهمية ﺍلـكشف عن ﺍلانفعالاﺕ، فإﻥ معظم ﺍلتحليلاﺕ ﺍلمتوفرﺓ تبقى سطحية ﻭغير كافية للمهاﻡ ﺍلتي تتطلب فهمًا ﺃعمق للمعنى ﺍلانفعالي في ﺍلسياﻕ. ﻭتتطلّب مثل هذﻩ ﺍلتطبيقاﺕ ﺍلإجابة عن ﺃسئلة ﺃساسية، من بينها تحديد ﺍلسبب ﺍلذﻱ ﺃﺩﻯ ﺇلى حدﻭﺙ ﺍلانفعاﻝ )ﺍلسبب(، ﻭتحديد ﺍلشخص ﺍلذﻱ ﺍختبرﻩ )ﺍلمجرُِّﺏ(، ﻭبشكل ﺃﻭسع معالجة ﺍلمعلوماﺕ ﺍلبنيو ية مثل من قاﻡ بماﺫﺍ )ﺍلدليل(، ﻭلمن )ﺍلمستهدﻑ(، ﻭلماﺫﺍ )ﺍلسبب(، ﻭكيف )ﺍلطر يقة.( تهدﻑ هذﻩ ﺍلأطرﻭحة ﺇلى ﺍقترﺍﺡ حلوﻝ ﺃصيلة ﻭفعّالة لسدّ ﺍلنقص في ﺍلموﺍﺭﺩ ﻭﺍلنماﺫﺝ ﺍلمخصّصة للتحليل ﺍلبنيوﻱ للانفعالاﺕ في ﺍلنصوﺹ ﺍلعربية. ﻭلتحقيق ﺫلك، نقدّﻡ منهجًا جديدًﺍ لتحليل ﺍلبنية ﺍلحجاجية للانفعالاﺕ في ﺍللغة ﺍلعربية، بالاعتماﺩ على ﺍلتقدّﻡ ﺍلمحرﺯ في ﺍلنماﺫﺝ ﺍلقائمة على Transformers، ﻭخاصة قدﺭﺍﺕ ﺍلنماﺫﺝ ﺍللغو ية ﺍلضخمة LLMs ﺍلخاصة بالعربية. تتعدّﺩ ﺍلإسهاماﺕ ﺍلرئيسية لهذﻩ ﺍلأطرﻭحة. فهي تبدﺃ بتقديم بناﺀ ﻭﻭسم AraERL، ﻭهو ﺃﻭﻝ مدﻭنة عربية مخصّصة للتحليل ﺍلبنيوﻱ للانفعالاﺕ. كما تقدّﻡ ﺍلأطرﻭحة ﺩﺭﺍسة معمّقة لتأثير كل حجة ﺩلالية على ﺃﺩﺍﺀ تحديد ﺍلانفعالاﺕ. ﻭتستكشف كذلك ﺍستخدﺍﻡ ChatGPT في ﻭسم ﺍلنصوﺹ ﺍلعربية بالأﺩﻭﺍﺭ ﺍلدلالية ﻭﺍلانفعالاﺕ من خلاﻝ منهجية ﺍلإسقاﻁ بين ﺍللغاﺕ. ﻭ يقيّم هذﺍ ﺍلعمل ﺃيضًا قدﺭﺓ ChatGPT على نقل ﺍلوسوﻡ ﺍلدلالية ﻭﺍلانفعالية من ﺍلإنجليز ية ﺇلى ﺍلعربية بدقة. ﻭﺃخيرًﺍ، تقدّﻡ ﺍلأطرﻭحة مقاﺭنة شاملة لأﺩﺍﺀ ﺍلنماﺫﺝ ﺍللغو ية ﺍلمفتوحة ﺍلضخمة في هذﻩ ﺍلمهاﻡ. | |
| dc.identifier.uri | https://repository.univ-setif.dz/handle/123456789/1057 | |
| dc.language.iso | en | |
| dc.publisher | Setif 1 University - Ferhat ABBAS , Faculty of Sciences | |
| dc.subject | Arabic | |
| dc.subject | NLP | |
| dc.subject | SRL | |
| dc.subject | Cross-Lingual Annotation Projection | |
| dc.subject | LLMs | |
| dc.subject | ChatGPT | |
| dc.subject | Emotion Analysis | |
| dc.subject | Structural emotions | |
| dc.title | Structured Emotion Analysis from Arabic Text | |
| dc.type | Thesis |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- E-TH2548 Structured Emotion Analysis from Arabic Text Senator, Ferial.pdf
- Size:
- 6.02 MB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
Loading...
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed to upon submission
- Description:
