L’impact des larges modèles de langue et des agents conversationnels sur les études du texte

Argumentaire

Depuis le lancement, en novembre 2022, du célèbre agent conversationnel de la société OpenAI, le grand public et les politiques ont découvert l’existence de grands modèles de langue (LLM) et l’apprentissage profond. Des projections plus ou moins fantasmées sont faites à propos de ce type d’outil, dont on relève à la fois les capacités inédites (surtout en matière de cohérence et même élégance du propos), et les incompréhensibles ratages (« hallucinations » comme celle au sujet des œufs de brebis). La question qui se pose est celle de l’apport véritable que de tels outils peuvent avoir dans différents secteurs.

La conférence organisée par le consortium Huma-Num ARIANE souhaite se concentrer sur les perspectives ouvertes par les grands modèles de langue, couplés ou non à des agents conversationnels, pour les études littéraires. On comprendra ces dernières dans un sens très large, portant aussi bien sur des textes reconnus pour leur valeur esthétique, qu’ils soient ou non inscrits dans un canon, et sur des textes qui n’ont pas une telle ambition, mobilisés dans des études d’histoire, de philosophie, de linguistique, etc. Nous vous invitons à déposer une proposition de communication si vous utilisez ou avez utilisé un LLM et/ou un agent conversationnel pour :

- rédiger un résumé, une synthèse, tout type de texte en lien avec vos travaux scientifiques ;

- annoter des textes, quel que soit le format de sortie des observables (xml, json, tableur, etc.)

- générer ou corriger du code informatique pour mener à bien vos travaux ;

- effectuer une étude de la littérature, ou un état de l’art ;

- analyser vos données, grâce à une étape supplémentaire d’apprentissage machine (fine-tuning) ;

etc.

Les communications devront se focaliser sur l’intérêt et les limites de l’utilisation des LLM/agents conversationnels, ainsi que sur les différentes étapes, ou les divers protocoles, qui ont dû être mis en place pour obtenir des résultats. Les présentations d’éventuelles expérimentations échouées sont tout aussi bienvenues, surtout si elles sont couplées avec l’exposé des alternatives adoptées : travail manuel, recours à des logiciels plus anciens, apprentissage machine traditionnel, etc.

Trois types de propositions sont attendues :

  1. Des communications d’une vingtaine de minutes, suivies de questions. Elles donnent lieu à des propositions de 1500 mots (hors bibliographie), y compris une brève présentation du ou des auteurs.
  2. Des tables rondes de 1h30 à 2h. Les tables rondes réunissent entre 4 et 8 participants (y compris le modérateur ou la modératrice). Elles donnent lieu à des présentations de 3000 mots (hors bibliographie), incluant une brève biographie de chaque intervenant.
  3. Des posters. Ils donnent lieu à des propositions de 500 mots (hors bibliographie), y compris une brève présentation de l’auteur principal.

Les communications doivent être déposées avant le 25 septembre 2024 (18h).
La réponse sera fournie pour le 30 septembre au plus tard.
Le colloque aura lieu le 26 et 27 novembre novembre 2024 au Campus Condorcet, Aubervilliers.

Comité scientifique

Ioana Galleron
Fatiha Idmhand
Sabine Loudcher
Nathalie Rousseau
Stéphanie Dord-Crouslé
Alexei Lavrentiev
Motasem Alrahabi
Anne-Emmanuelle Kahn

Comité d'organisation

Ioana Galleron
Fatiha Idmhand
Sabine Loudcher
Anaïs Chambat
Mathilde Le Meur
Andrés Felipe Echavarria

 

Personnes connectées : 1 Vie privée
Chargement...