
A4LL logo designed by Sidonie Tosser – Licence: CC-BY-NC 4.0
Pourquoi mon professeur d'anglais ne souligne-t-il jamais que les fautes dans mes rédactions ? Pourquoi la correction de ma rédaction prend-elle tant de temps ?

Description
Le projet A4LL développera un système innovant d'analyse de l'apprentissage des langues conçu pour aider les enseignants et les apprenants grâce à des rapports objectifs reliant les compétences aux caractéristiques linguistiques. Thomas Gaillat, le coordinateur, propose une approche reposant sur des mesures textuelles opérationnalisant la complexité globale et structurelle, la phraséologie, la cohésion du discours et la fluidité. Ces mesures soutiendront la création automatique de rapports graphiques utilisés par les enseignants pour diagnostiquer les productions de leurs apprenants. L'ambition d'A4LL est de créer le premier système d'analyse L2 (langue seconde) entièrement automatisé au service des apprenants, des enseignants et des chercheurs universitaires via un flux de données intégré, de l'ingestion à l'analyse.
Questions de recherche
Le projet A4LL fournira un système d'analyse de la L2 pour les apprenants et les enseignants d'anglais au niveau universitaire. Le projet abordera 3 questions de recherche principales visant à découvrir certaines des caractéristiques de l'interlangue, c'est-à-dire le système linguistique instable démontré par les apprenants d'une seconde langue : i) quelles sont les caractéristiques de la langue qui sont liées à des niveaux de compétence spécifiques ? ii) comment ces caractéristiques peuvent-elles être mesurées automatiquement ? iii) comment les mesures peuvent-elles être converties en analyses significatives pour un retour descriptif et des décisions d'enseignement ?
L'interlangue peut être considérée comme un système multifactoriel complexe qui rend difficile l'identification des critères de compétence. Avec le temps et la pratique, le système se stabilise progressivement. Cependant, il n'est pas évident de savoir quels facteurs sont en jeu à un moment donné. Pour comprendre comment l'interlangue se développe, les recherches actuelles montrent que les approches combinant des mesures linguistiques et des statistiques au sein de modèles informatiques permettent de mettre en évidence certaines caractéristiques de l'interlangue (Ballier et al., 2020 ; Yannakoudakis et al., 2018). Cependant, les métriques actuelles de l'état de l'art manquent de sens linguistique et nuisent ainsi à l'interprétabilité.
Objectif
L'objectif est de développer un système informatique qui génère automatiquement des diagnostics linguistiques des écrits des apprenants. Ces diagnostics seront ainsi visualisés par les enseignants à travers MOODLE, l'un des principaux LMS open-source en France et dans le monde.Ces diagnostics aideront les enseignants à formuler des conseils à leurs élèves et à adapter leurs objectifs pédagogiques en fonction des profils de leurs groupes. Le développement du système impliquera un travail de recherche pour identifier les corrélations entre les caractéristiques linguistiques et les métadonnées, y compris les types de tâches, les compétences, les habitudes d'apprentissage et les capacités d'écriture.
Le système collectera, analysera automatiquement et fournira un retour d'information linguistique spécifique pour les écrits soumis dans MOODLE (voir figure 1).
En exploitant les métriques lexicales, syntaxiques et sémantiques, le système mettra en évidence les dimensions qui requièrent une attention particulière dans chaque texte.Des visualisations graphiques montreront les domaines linguistiques à améliorer pour atteindre un niveau de compétence donné.Le système s'appuiera sur une approche d'apprentissage supervisé avec des données d'apprenants collectées dans les deux centres de langues (en charge de 20 000 étudiants apprenant l'anglais à des fins spécifiques) des deux universités de Rennes. il sera modulaire pour permettre l'intégration ultérieure d'autres langues.
A4LL entend tirer parti de la force de deux prototypes précédemment développés auxquels le coordinateur a participé.
Le premier prototype, développé en 2019 (Gaillat, Simpkin, et al., 2021), permet une classification automatique des écrits des apprenants selon les niveaux du CECR.
Le second prototype, appelé VizLing (Gaillat, Knefati, et al., 2021), et développé en 2019, se concentre sur la génération automatique de graphiques pour visualiser la complexité linguistique dans les écrits.A4LL se développera dans la même voie, mais s'appuiera sur une sélection de métriques significatives et linguistiquement descriptives pour l'analyse des langues secondes. A4LL unifiera les tâches de traitement du langage naturel dans un cadre unique produisant des visualisations dans MOODLE.Il s'appuiera sur les métadonnées de l'apprenant afin de permettre aux enseignants d'établir le profil de leurs apprenants et de personnaliser le retour d'information.
L'objectif d'A4LL est donc :
- d'offrir à la communauté des enseignants de langues des outils d'analyse de données permettant de positionner les apprenants en fonction de leurs compétences et des aspects de leur langue.
- de modéliser le langage de l'apprenant afin de mettre en correspondance les caractéristiques linguistiques avec les compétences et, à terme, les étapes interlangues. A4LL entend apporter une solution aux centres de langues universitaires, en France et à l'étranger, qui ont en charge des millions d'étudiants qui étudient les langues à des fins professionnelles.
Partenaires
Établissement | Nom | Prénom | Fonction |
---|---|---|---|
Rennes 2 University | GAILLAT | Thomas | PI & Associate Professor |
Rennes 2 university | MALLART | Cyriel | Research Engineer |
Rennes 2 University | LI | Jen-Yu | Ph.D. candidate |
Rennes 2 University | FAUGERE | Anatole | Research Assistant and Computer programmer |
University of Paris Cité | BALLIER | Nicolas | Professor of Linguistics |
University of Paris Cité |
LISSON | Paula | Research Engineer |
University of Galway | SIMPKIN | Andrew | Associate professors in Statistics |
University of Galway | STEARNS | Bernardo | Research Associate |
Le Mans University | VENANT | Rémi | Associate Professor |
IRISA / INSA Rennes | SÉBILLOT | Pascale | Professor of Computer Science |
IRISA / CNRS | GRAVIER | Guillaume | Senior Research Scientist |
Projet Partenaire
Deep Learning for Language Assessment (DLLA)
Annotateurs experts
Annotation CEFR
Établissement | Expert | Fonction | Structure |
---|---|---|---|
Rennes 2 University | Joanne Ward-Henry | English teacher | Centre de Langues |
Rennes 2 University | Francoise Le Roux | English teacher | Centre de Langues |
University of Rennes | Benedicte Dumont | English teacher | SCELVA |
University of Rennes | Pascale Janvier | English teacher | SCELVA |
Annotation linguistique
- Membres de l'équipe : Paula, Nicolas et Thomas
- Université Paris Cité - CLILLAC-ARP : Jessica Tayeh
Conférences et publications
Livrables
Logiciels
- Gitlab LIDILE: L'outil A4LL est disponible pour telechargement et installation sur un serveur dédié (Technologie Docker). L'outil se décompose en deux paquets : A4LL_MLpipeline and A4LL_Tool
- Un outil pour la collecte de corpus d'apprenants : L'interface utilisateur CELVA.SP pour MOODLE
- Le Google Colab pour l'atelier « Enrichissement linguistique des données textuelles » , une introduction à Python pour les experts en sciences humaines.
Soutenu par Rennes Métropole et ANR
Ensembles de données et corpus
Corpus d'apprenants de la langue à des fins spécifiques : trois ensembles de données sur Nakala :
- Un avec l'annotation du CECR de Dialang
- Deux lots avec annotation CECR par des experts humains : 2018-2022 et 2023-2024
Remerciements : Un grand merci aux enseignants de langues des universités de Rennes pour leur implication.