Extraction de mots clés à partir d'articles scientifiques: comparaison entre modèles traditionnels et modèles de langue
Nacef Benmansour  1  , Motasem Alrahabi  2@  
1 : Sorbonne Université
Université Paris IV - Paris Sorbonne : Tutelle_incompleteLabo_fr_sans_tutelle, Tutelle_incompleteLabo_fr_sans_tutelle
2 : Sorbonne Université
Université Paris IV - Paris Sorbonne : Tutelle_incompleteLabo_fr_sans_tutelle, Tutelle_incompleteLabo_fr_sans_tutelle

L'extraction automatique des mots-clés est essentielle pour condenser le contenu des documents, améliorer la recherche d'informations et analyser les tendances. Traditionnellement, cette tâche utilise des méthodes statistiques comme TF-IDF et des modèles d'apprentissage automatique. Cependant, les modèles de langage de grande taille (LLM) comme GPT-4 offrent une compréhension plus contextuelle et nuancée des textes. Cette étude compare les approches traditionnelles et modernes d'extraction de mots-clés en utilisant des articles scientifiques de la base de données HAL. Les résultats montrent que les LLM surpassent les méthodes classiques en termes de précision et de pertinence, suggérant des améliorations pour les systèmes de recherche scientifique.

 

Personnes connectées : 1 Vie privée
Chargement...