E-MIMIC - PRIN 2022

Empowering a Multilingual Inclusive Communication

E-MIMIC (Empowering Multilingual Inclusive Communication), is a joint effort of the Deep Learning Natural Language Understanding (from Politecnico di Torino) and Linguistics research communities (from the University of Bologna and the University of Rome 2 – Tor Vergata) with the goal of promoting and ensuring equality and inclusion in communication, thus contributing to a more inclusive, innovative, and reflective society. The project has the support of the Italian Ministry of Education, University and Research (Research Projects of National Interest – PRIN 2022). The project aims to create and test the application Inclusively (Italian and French versions) for the identification and reformulation of discriminatory forms of language in administrative texts.

E-MIMIC relies on an innovative use of deep-learning methods for natural language processing trained on a new corpora of formal communication produced by Italian and French linguists in this project. The approach is groundbreaking because for the first time, high-risk concepts such as linguistic and discursive criteria for inclusive communication, data labeling of new corpora of formal communication, and strong human involvement in the data-driven methods are integrated into the core of deep-learning methods for natural language processing to automatically identify non-inclusive text snippets, suggest alternative forms, and produce inclusive text reformulations. These criteria are being used by a large group of linguists to characterize a new corpora of formal communication that various institutions (our universities and public administrations) provide us, and to propose alternative reformulations that reflect the color nuances of our society. Using E-MIMIC, we aim to make inclusive communication accessible to a wide range of users. E-MIMIC suggests inline textual corrections by performing an intra-linguistic translation from the discriminative form to the inclusive form. To this end, it is important to recognize that the use of language can be sexist, racist, or biased. Therefore, E-MIMIC explores innovative approaches to defusing language in ways that meet required inclusivity standards.

Il progetto Empowering Multilingual Inclusive Communication (E-MIMIC) del Politecnico di Torino (capofila) e dell’Università di Bologna Alma Mater (dipartimento DIT) è stato inaugurato nel 2019 e dal 2022 è supportato da un finanziamento ministeriale PRIN 2022 nel quale è coinvolta anche l’Università di Roma 2 – Tor Vergata. Il progetto ha come obiettivo la realizzazione e la sperimentazione dell’applicativo Inclusively per l’identificazione e la riformulazione delle forme discriminatorie del linguaggio nei testi amministrativi. L’applicativo, che si compone di un modello di encoding per rintracciare e segnalare le forme non inclusive e di un modello di encoding-decoding per generare testo inclusivo, è attualmente in fase di rilascio dei dati della versione 1.0 per l’italiano. La versione successiva, che sarà Multitask, prevede l’acquisizione di criteri discorsivi per il miglioramento delle performance complessive.

I criteri d’inclusione, tratti dall’attuale normativa europea e dalle letterature nazionali nel settore, concernono non solo la questione di genere ma anche il problema della carenza di accessibilità dei testi per le persone ipovedenti, l’eliminazione di stereotipi etnici, religiosi, legati all’età, ecc.

Il progetto riguarda l’italiano (d’Italia), il francese (di Francia) e lo spagnolo (di Spagna), tenendo conto del rispetto delle varianti diatopiche delle lingue. Il finanziamento PRIN 2022 è funzionale allo sviluppo dell’applicazione in italiano e a dei casi di studio per avviare i lavori dell’applicativo in francese. Nell’ambito di una convenzione quadro tra l’Università di Bologna (dipartimento DIT) e il Politecnico di Torino, è in fase di sviluppo la versione spagnola dell’applicativo grazie a un finanziamento ALMArie SUpER 2022.

Duration/Durata: 2023-2025

Research team / Team di ricerca:  Tania Cerquitelli (DAUIN, Politecnico di Torino) - P.I.; Rachele Raus (DIT, Alma Mater Studiorum – University of Bologna) - Co-P.I.; Valeria Zotti (LILEC, Alma Mater Studiorum – University of Bologna); Stefania Cavagnoli, Francesca Dragotto (University of Rome 2) - Co-P.I.