Université Paris Nanterre
Journée d’étude APLV
Le verbe évaluer vient du latin valere, « valoir, avoir de la valeur », et désigne à la fois un acte de mesure et un processus d’attribution de valeur ou de jugement (CNRTL). Dans le champ éducatif, l’évaluation n’est pas un acte purement technique : elle engage des choix pédagogiques, institutionnels, éthiques et sociaux, qui façonnent le sens même de l’enseignement.
En langues vivantes, ces enjeux prennent une dimension particulière. Évaluer ne consiste pas seulement à vérifier des connaissances linguistiques, mais aussi à apprécier la capacité des apprenants à mobiliser ces ressources dans des contextes variés, intégrant une dimension pragmatique, socioculturelle et interculturelle (Conseil de l’Europe, 2018 ; Piccardo & North, 2019 ; Tardieu, 2008). L’évaluation de l’oral, en particulier, mobilise de multiples critères : fluidité, aisance, précision linguistique (lexicale, grammaticale, phonologique), prosodie, pertinence pragmatique, adéquation au contexte sociolinguistique et culturel, et capacité d’interaction et de co-construction du discours. Ces critères, dont la pondération varie selon les types de tâches (interaction spontanée, présentation, médiation…), visent à évaluer la performance communicative globale, tout en exposant enseignants et élèves à la subjectivité de l’évaluation, notamment dans le domaine oral, et à des facteurs affectifs tels que l’anxiété langagière (Dewaele & MacIntyre, 2014 ; Lemarchand-Chauvin & Schmoll, projet GIS EMO- Lang, 2024–2026). Il est donc nécessaire d’utiliser des outils d’évaluation adaptés pour rendre compte de la co-construction du sens dans l’interaction (Manoïlov, 2021).
Depuis 2001, le Cadre européen commun de référence pour les langues (CECRL) constitue un pilier des politiques linguistiques en Europe. Son échelle de niveaux (A1 à C2), enrichie en 2018, structure les programmes (Eduscol, 2020), les certifications (CLES, DELF, etc.), les concours de recrutement (CAPES, Agrégation), ainsi que les examens nationaux comme le baccalauréat. En complément de ce cadre, les évaluations conduites par la DEPP ou les enquêtes PISA mettent en lumière des écarts persistants entre les compétences visées par les politiques éducatives et celles effectivement maîtrisées par les élèves (OCDE, 2023).
Traduire ces référentiels institutionnels en pratiques d’évaluation effectives s’avère complexe. Claire Tardieu (2008, 2009) souligne le caractère encore fragile de l’articulation entre évaluation formative et sommative, alors que la note continue de dominer les pratiques, parfois au détriment de la dimension formative. La docimologie, science de la mesure en éducation (Bourdoncle, 2007), met en évidence les biais d’évaluation. Cette subjectivité est particulièrement manifeste dans l’évaluation de l’oral, comme l’ont montré Fulcher (2024) et Han (2016), qui analysent la variabilité des jugements et les limites des outils d’objectivation. L’essor de l’évaluation par compétences interroge plus que jamais le lien entre évaluation et notation, jugée parfois anxiogène ou réductrice (Marchadour, 2019 ; Castellotti, 2017).
Dans ce contexte, l’intelligence artificielle (IA) suscite de fortes attentes. Elle offre des perspectives nouvelles : correction automatisée, analyses linguistiques, feedback immédiat ou scoring prédictif (Xi, 2021). Si la recherche s’est déjà largement penchée sur les usages de l’IA dans l’évaluation éducative en général (Gardner & al., 2021 ; Jung & al., 2025), un manque subsiste concernant son application spécifique à l’évaluation des langues vivantes. Peu d’études abordent encore de manière approfondie les enjeux soulevés par l’usage de l’IA pour des tâches orales, interactionnelles ou pragmatiques, qui nécessitent une analyse fine des productions langagières humaines (Voss, 2024 ; Xi, 2021). Ces défis appellent aujourd’hui à repenser l’évaluation en langues vivantes à l’ère de l’intelligence artificielle. L’objectif n’est plus seulement de mesurer, mais de construire une évaluation plus juste, précise, valorisante et inclusive, au service de l’apprentissage et de la réussite des parcours. Comment articuler exigences institutionnelles, confiance des apprenants et innovations technologiques ? Comment l’IA peut-elle accompagner l’enseignant, sans se substituer à son expertise ni réduire la dimension humaine de l’évaluation ?
Telles sont les questions au cœur de cette Journée d’étude de l’APLV, articulant table ronde, communications scientifiques et retours d’expériences.
Cet appel s’adresse à tous les acteurs de l’enseignement des langues, du primaire à l’université.
Types de contributions attendues
Les communications scientifiques et retours d’expérience pourront s’articuler autour des quatre axes suivants, sans que cette liste soit exhaustive :
Axe 1 : Enjeux pédagogiques et institutionnels de l’évaluation en langues vivantes
Axe 2 : Théories, méthodologies et recherches en cours sur l’évaluation en langues vivantes
Axe 3 : Limites, défis et perspectives de l’IA dans l’évaluation en langues vivantes
Axe 4 : L’intelligence artificielle dans l’évaluation et l’accompagnement des
apprentissages
Posters : expérimentations, pratiques et innovations de terrain
Une session spécifique sera consacrée aux posters, permettant de valoriser des expériences concrètes, des dispositifs pédagogiques ou des outils d’évaluation, même menés à petite échelle (une classe, un projet, etc.). Les posters offrent une opportunité idéale de partage, sans nécessiter de communication orale formelle.
Tous les acteurs de l’enseignement des langues sont invités à y contribuer, qu’il s’agisse d’enseignants du primaire, du secondaire ou du supérieur, de formateurs, de stagiaires ou d’étudiants. Les posters pourront notamment présenter (liste non exhaustive):
Modalités de soumission
Les propositions (titre, résumé de 250 mots maximum, 3 à 5 mots-clés, références bibliographies) sont à envoyer avant le 15 octobre 2025 à : marie-claire.lemarchand-chauvin@univ-lorraine.fr
La journée d’étude donnera lieu à un numéro spécial dans la revue Les Langues Modernes de l’APLV.
Bibliographie indicative
Bourdoncle, R. (2007). Docimologie et évaluation des performances scolaires. Revue Française de Pédagogie.
Castellotti, V. (2017). Pour une didactique de l’appropriation. Didier.
Conseil de l’Europe. (2018). Cadre européen commun de référence pour les langues: Volume complémentaire. Strasbourg.
Dewaele, J. M., & MacIntyre, P. D. (2014). The two faces of Janus? Anxiety and enjoyment in the foreign language classroom. Studies in second language learning and teaching, 4(2), 237-274.
Eduscol. (2020). Évaluation et positionnement en langues vivantes. https://eduscol.education.fr/166/evaluation-et-positionnement-en-langues-vivantes
Fulcher, G. (2024). Practical Language Testing. Routledge.
Gardner, J., O’Leary, M., & Yuan, L. (2021). Artificial intelligence in educational assessment:‘Breakthrough? Or buncombe and ballyhoo?’. Journal of Computer Assisted Learning. 37(5), 1207-1216.
Han, Q. (2016). Rater cognition in L2 speaking assessment: A review of the literature. Teachers College. Columbia University Working Papers in TESOL & Applied Linguistics. 16 (1), 1-24.
Jung, J. Y., Tyack, L., & von Davier, M. (2025). Towards the implementation of automated scoring in international large-scale assessments: Scalability and quality control. Computers and Education: Artificial Intelligence. 8, 100375.
Lemarchand-Chauvin, M.-C., & Schmoll, C. (2024–2026). Projet GIS EMO-Lang. Université de Lorraine.
Manoïlov, P. (2021). Quels critères retenir pour l’évaluation de la dimension pragmatique des interactions orales en anglais langue étrangère? Évaluation des acquisitions langagières: du formatif au certificatif.
Marchadour, M. (2019). Évaluer sans dévaluer. Pluralité et subjectivité des élèves au sein de l’école française. Contextes et didactiques. Revue semestrielle en sciences de l’éducation. (13).
OCDE. (2023). Résultats de PISA 2022 : Compétences des élèves en compréhension de l’écrit et langues vivantes.
Piccardo, E., & North, B. (2019). The action-oriented approach: A dynamic vision of language education (Vol. 72). Multilingual Matters.
Tardieu, C. (2006). L’évaluation en langues : quelles perspectives?. Recherches en didactique des langues et des cultures. Les cahiers de l’Acedle. (2).
Tardieu, C. (2008). La didactique des langues en 4 mots clés : communication, culture, méthodologie, évaluation. Ellipses.
Tardieu, C. (2009). Corriger ou évaluer ? Les cahiers de l’APLIUT. Pédagogie et Recherche. 28(3), 9-25.
Voss, E. (2024). Artificial intelligence in language assessment. The Concise Companion to Language Assessment, Second Edition. Wiley-Blackwell. 112-125.
Xi, X. (2021). Validity and the automated scoring of performance tests. In The Routledge handbook of language testing (pp. 513-529). Routledge.