Catégories
Appels à contribution

Les corpus pour la didactique des langues : de la formation des enseignants à l’élaboration de systèmes automatiques. Date limite (résumé) : 31 octobre 2021

Simona Ruggia, CNRS, BCL, UMR 7320, Université Côte d’Azur

Thomas Gaillat, LIDILE EA 3874, Université de Rennes 2

L’apprentissage des langues étrangères et les méthodes employées dans l’enseignement des langues connaissent aujourd’hui une véritable révolution numérique. Du fait de l’accessibilité et de l’ubiquité des données, de nombreuses expérimentations sont mises en place afin de confronter les apprenants aux langues cibles. Les données linguistiques organisées en corpus permettent de mettre en regard formes et contextes afin de favoriser la réflexion métalinguistique nécessaire au processus d’acquisition. Dans ce sens, les recherches en didactique ont multiplié les usages de corpus, et notamment Fligelstone (1993) en a distingué trois : le « teaching about », le « exploiting to teach » et le « teaching to exploit ». Pour chaque type d’usage, le corpus acquiert un rôle différent. Dans le premier, le corpus est un « objet d’enseignement » (Cavalla, Loiseau, 2013 : 2), ce qui correspond à « l’enseignement de la linguistique de corpus ou de sa méthodologie » (Ib.), dans le deuxième il est un « support d’enseignement » (Ib.), autrement dit cela « correspond à l’enseignement de l’usage du corpus : quelles requêtes faire ? dans quelle situation en fonction du système d’interrogation disponible ? » (Ib.). Le troisième usage consiste à « exploiter les corpus et l’interprétation des résultats pour enseigner une langue » (Ib.). Un quatrième usage a ensuite été défini par Renouf (1997) : le « teaching to establish resources » pour former à la création de corpus. La notion de corpus s’est élargie dans la lignée de la linguistique de corpus à travers des expérimentations d’utilisation de corpus en classe de langue. Dans cette optique, le corpus est devenu un objet d’apprentissage pour l’apprenant, selon l’approche définie « data-driven learning » par Johns (par ex. 1988 ; Johns & King, 1991) qui mobilise des stratégies de découverte en développant la méta-compétence « apprendre à apprendre » (Holec, 1990). Selon cette approche, transposée en français « apprentissage sur corpus » (ASC) et développée notamment par Boulton et Tyne, « l’apprenant est amené à mettre à profit ses différentes observations de la langue à partir de données qui se présentent sous forme de corpus […] » (2014 : 6).

La perspective acquisitionnelle comprend aussi la question de l’analyse automatique de la langue pour l’élaboration de systèmes intelligents d’aide à l’apprentissage ou « intelligent Computer-aided Language Learning » (iCALL) (Swartz & Yazdani, 2012). Au cours de la dernière décennie, les méthodes d’apprentissage automatique ont ouvert la voie au développement d’outils de prise en charge de la langue d’apprenants. Ces outils reposent sur l’exploitation de corpus mêlant traitement automatique et modélisation (Meurers, 2012). Les corpus et le TAL se combinent pour l’analyse de la langue d’apprenants (Díaz-Negrillo et al., 2013). Les objectifs sont multiples allant de la détection d’erreurs à la classification par niveaux de compétence, et ont été repris dans le cadre de compétitions dites « shared-tasks » (Ballier et al., 2020, Settles et al., 2018). Ces outils permettent la production de données linguistiques de tout type (mesures textuelles, annotations linguistiques, etc.), véritable sous-ensemble des données transitant sur les plateformes d’apprentissage. Les corpus sont à la source du développement prochain des « learning analytics » en langue étrangère. Dans ce numéro de Corpus nous souhaitons faire un état des lieux des usages et exploitations des corpus dans le cadre de l’enseignement/apprentissage des langues étrangères et plus particulièrement de deux usages des corpus qui semblent se détacher en fonction des publics concernés par leur exploitation. Pour les futurs enseignants en langues étrangères, les corpus sont un outil privilégié d’analyse mais aussi de formation. Pour les apprenants de langues, les corpus, et notamment les corpus d’apprenants, sont la source d’analyses comparatives quantitavies et automatisées des usages. Leur exploitation en situation d’apprentissage peut reposer sur des méthodes d’analyse des données textuelles, de linguistique de corpus et de TAL.

Deux axes seront privilégiés pour le numéro :

Axe 1 : Les études portant sur l’exploitation de corpus pour la formation d’enseignants de langues

· La réflexion épistémologique sur les typologies des corpus numériques pour la formation de futurs enseignants.

· Les apports des corpus numériques pour l’enseignement/apprentissage de compétences ciblées.

 · Les méthodes et les outils pour explorer les corpus.

Axe 2 : Les études relatives à l’exploitation de corpus dans les dispositifs et systèmes d’apprentissage.

· Les outils de requêtes et de visualisation dans le cadre de situation d’apprentissage

· Les outils d’analyse automatique des productions d’apprenants permettant l’élaboration de feedback et/ou la prédiction de niveau de compétence.

· Les outils de constitution de jeux de données enrichies pour l’étude des L2 (extraction automatique de formes linguistiques, mesures de la complexité linguistique).

· Les méthodes de modélisation des productions d’apprenants pour des tâches telles que l’analyse d’erreur et la classification par niveau.

· La réflexion épistémologique sur l’utilisation des données d’apprenants dans des systèmes automatisés.

 La soumission se fait en deux temps

– Proposition de contributions : résumé de 500 mots, bibliographie non comprise

à envoyer à : Simona.Ruggia@univ-cotedazur.fr et thomas.gaillat@univ-rennes2.fr – date limite : 31 octobre 2021

– notification : 15 décembre 2021 2.

Soumission des articles : langue : français ou anglais

taille des articles : entre 25.000 et 35.000 signes espaces compris format .doc ou .dot, minimalement mis en forme (times new roman 12, titres apparents, citations apparentes, etc.)

à envoyer à : Simona.Ruggia@univ-cotedazur.fr et thomas.gaillat@univ-rennes2.fr

– date limite : 31 mars 2022

– notification : 31 mai 2022