Loading…
L’analyse du discours et l’intelligence artificielle pour réaliser une écriture inclusive : le projet EMIMIC
Cet article présente le projet E-MIMIC, une application qui vise à éliminer les préjugés et la non-inclusion dans les textes administratifs rédigés dans les pays européens, à commencer par ceux qui sont rédigés dans les langues romanes. Il présente une méthodologie conçue à partir de critères discur...
Saved in:
Published in: | SHS web of conferences 2022, Vol.138, p.1007 |
---|---|
Main Authors: | , , , , , , |
Format: | Article |
Language: | English |
Subjects: | |
Citations: | Items that this one cites |
Online Access: | Get full text |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: | Cet article présente le projet E-MIMIC, une application qui vise à éliminer les préjugés et la non-inclusion dans les textes administratifs rédigés dans les pays européens, à commencer par ceux qui sont rédigés dans les langues romanes. Il présente une méthodologie conçue à partir de critères discursifs inspirés de l’analyse du discours française et utilisés pour étiqueter un corpus de documents institutionnels, qui sont utilisés pour l’apprentissage profond des réseaux neuronaux. Des architectures de modélisation profonde du langage sont exploitées pour identifier automatiquement les extraits de texte non inclusifs, suggérer des formes alternatives et produire des reformulations inclusives. Une évaluation préliminaire menée sur un ensemble de données de référence pour la langue italienne montre des résultats prometteurs, qui poussent à finaliser l’application et à la réaliser également pour d’autres langues, tel le français.
Discourse Analysis and Artificial Intelligence to empower inclusive writing: the project E-MIMIC.
This paper presents the EMIMIC project, an application that aims to eliminate non-inclusive, prejudiced language forms in administrative texts written in European countries, starting with those written in Romance languages. It presents a methodology based on discourse criteria inspired by French discourse analysis and used to label a corpus of institutional documents, which are used for the deep learning of neural networks. Deep Language Modelling architectures are exploited to automatically identify non-inclusive text snippets, suggest alternative forms, and produce inclusive text rephrasing. A preliminary evaluation conducted on a benchmark dataset in Italian shows promising results and encourages us to finalise the application and to implement it also for other languages, such as French. |
---|---|
ISSN: | 2261-2424 2416-5182 2261-2424 |
DOI: | 10.1051/shsconf/202213801007 |