Linguistique Ingénierie et Didactique des Langues
Type d'article
Projets

ANR A4LL : Analytics for Language Learning

ANR-22-CE38-0015-01
Chercheur principal : Thomas Gaillat
Début : Janvier 2023 - Fin : Décembre 2024

Logo A4LL
Légende

A4LL logo designed by Sidonie Tosser – Licence: CC-BY-NC 4.0

Pourquoi mon professeur d'anglais ne souligne-t-il jamais que les fautes dans mes rédactions ? Pourquoi la correction de ma rédaction prend-elle tant de temps ?

A4LL Flow module

Description

Le projet A4LL développera un système innovant d'analyse de l'apprentissage des langues conçu pour aider les enseignants et les apprenants grâce à des rapports objectifs reliant les compétences aux caractéristiques linguistiques. Thomas Gaillat, le coordinateur, propose une approche reposant sur des mesures textuelles opérationnalisant la complexité globale et structurelle, la phraséologie, la cohésion du discours et la fluidité. Ces mesures soutiendront la création automatique de rapports graphiques utilisés par les enseignants pour diagnostiquer les productions de leurs apprenants. L'ambition d'A4LL est de créer le premier système d'analyse L2 (langue seconde) entièrement automatisé au service des apprenants, des enseignants et des chercheurs universitaires via un flux de données intégré, de l'ingestion à l'analyse.

Questions de recherche

Le projet A4LL fournira un système d'analyse de la L2 pour les apprenants et les enseignants d'anglais au niveau universitaire. Le projet abordera 3 questions de recherche principales visant à découvrir certaines des caractéristiques de l'interlangue, c'est-à-dire le système linguistique instable démontré par les apprenants d'une seconde langue : i) quelles sont les caractéristiques de la langue qui sont liées à des niveaux de compétence spécifiques ? ii) comment ces caractéristiques peuvent-elles être mesurées automatiquement ? iii) comment les mesures peuvent-elles être converties en analyses significatives pour un retour descriptif et des décisions d'enseignement ?

L'interlangue peut être considérée comme un système multifactoriel complexe qui rend difficile l'identification des critères de compétence. Avec le temps et la pratique, le système se stabilise progressivement. Cependant, il n'est pas évident de savoir quels facteurs sont en jeu à un moment donné. Pour comprendre comment l'interlangue se développe, les recherches actuelles montrent que les approches combinant des mesures linguistiques et des statistiques au sein de modèles informatiques permettent de mettre en évidence certaines caractéristiques de l'interlangue (Ballier et al., 2020 ; Yannakoudakis et al., 2018). Cependant, les métriques actuelles de l'état de l'art manquent de sens linguistique et nuisent ainsi à l'interprétabilité.

Objectif 

L'objectif est de développer un système informatique qui génère automatiquement des diagnostics linguistiques des écrits des apprenants. Ces diagnostics seront ainsi visualisés par les enseignants à travers MOODLE, l'un des principaux LMS open-source en France et dans le monde.Ces diagnostics aideront les enseignants à formuler des conseils à leurs élèves et à adapter leurs objectifs pédagogiques en fonction des profils de leurs groupes. Le développement du système impliquera un travail de recherche pour identifier les corrélations entre les caractéristiques linguistiques et les métadonnées, y compris les types de tâches, les compétences, les habitudes d'apprentissage et les capacités d'écriture.
Le système collectera, analysera automatiquement et fournira un retour d'information linguistique spécifique pour les écrits soumis dans MOODLE (voir figure 1).

En exploitant les métriques lexicales, syntaxiques et sémantiques, le système mettra en évidence les dimensions qui requièrent une attention particulière dans chaque texte.Des visualisations graphiques montreront les domaines linguistiques à améliorer pour atteindre un niveau de compétence donné.Le système s'appuiera sur une approche d'apprentissage supervisé avec des données d'apprenants collectées dans les deux centres de langues (en charge de 20 000 étudiants apprenant l'anglais à des fins spécifiques) des deux universités de Rennes. il sera modulaire pour permettre l'intégration ultérieure d'autres langues.

A4LL entend tirer parti de la force de deux prototypes précédemment développés auxquels le coordinateur a participé.

Le premier prototype, développé en 2019 (Gaillat, Simpkin, et al., 2021), permet une classification automatique des écrits des apprenants selon les niveaux du CECR. 

Le second prototype, appelé VizLing (Gaillat, Knefati, et al., 2021), et développé en 2019, se concentre sur la génération automatique de graphiques pour visualiser la complexité linguistique dans les écrits.A4LL se développera dans la même voie, mais s'appuiera sur une sélection de métriques significatives et linguistiquement descriptives pour l'analyse des langues secondes. A4LL unifiera les tâches de traitement du langage naturel dans un cadre unique produisant des visualisations dans MOODLE.Il s'appuiera sur les métadonnées de l'apprenant afin de permettre aux enseignants d'établir le profil de leurs apprenants et de personnaliser le retour d'information.

L'objectif d'A4LL est donc :

  1. d'offrir à la communauté des enseignants de langues des outils d'analyse de données permettant de positionner les apprenants en fonction de leurs compétences et des aspects de leur langue.
  2. de modéliser le langage de l'apprenant afin de mettre en correspondance les caractéristiques linguistiques avec les compétences et, à terme, les étapes interlangues. A4LL entend apporter une solution aux centres de langues universitaires, en France et à l'étranger, qui ont en charge des millions d'étudiants qui étudient les langues à des fins professionnelles.

Partenaires

Établissement Nom Prénom Fonction
Rennes 2 University GAILLAT Thomas PI & Associate Professor
Rennes 2 university MALLART Cyriel Research Engineer
 
Rennes 2 University LI Jen-Yu Ph.D. candidate
Rennes 2 University FAUGERE Anatole Research Assistant and Computer programmer
 
University of Paris Cité BALLIER Nicolas Professor of Linguistics
University of Paris Cité
 
LISSON Paula Research Engineer
 
University of Galway SIMPKIN Andrew Associate professors in Statistics
University of Galway STEARNS Bernardo Research Associate
Le Mans University VENANT Rémi Associate Professor
IRISA / INSA Rennes SÉBILLOT Pascale Professor of Computer Science
IRISA / CNRS GRAVIER Guillaume Senior Research Scientist

Projet Partenaire

Deep Learning for Language Assessment (DLLA)

Annotateurs experts

Annotation CEFR

Établissement Expert Fonction Structure
Rennes 2 University Joanne Ward-Henry English teacher Centre de Langues
Rennes 2 University Francoise Le Roux English teacher Centre de Langues
University of Rennes Benedicte Dumont English teacher SCELVA
University of Rennes Pascale Janvier English teacher SCELVA

 

Annotation linguistique

  • Membres de l'équipe : Paula, Nicolas et Thomas
  • Université Paris Cité - CLILLAC-ARP : Jessica Tayeh

Conférences et publications

Livrables

Logiciels

Soutenu par Rennes Métropole et ANR

Ensembles de données et corpus

Corpus d'apprenants de la langue à des fins spécifiques : trois ensembles de données sur Nakala :

  • Un avec l'annotation du CECR de Dialang
  • Deux lots avec annotation CECR par des experts humains : 2018-2022 et 2023-2024

Remerciements : Un grand merci aux enseignants de langues des universités de Rennes pour leur implication.

Contenus associés

v-siteslabos-1