Colloque du Consortium-HN ARIANE

FR EN

sciencesconf.org:csthn-ariane:582398

Extraction de mots clés à partir d'articles scientifiques: comparaison entre modèles traditionnels et modèles de langue

Nacef Benmansour 1 , Motasem Alrahabi 2, @

1 : Sorbonne Université

Université Paris IV - Paris Sorbonne : Tutelle_incompleteLabo_fr_sans_tutelle, Tutelle_incompleteLabo_fr_sans_tutelle

2 : Sorbonne Université

Université Paris IV - Paris Sorbonne : Tutelle_incompleteLabo_fr_sans_tutelle, Tutelle_incompleteLabo_fr_sans_tutelle

L'extraction automatique des mots-clés est essentielle pour condenser le contenu des documents, améliorer la recherche d'informations et analyser les tendances. Traditionnellement, cette tâche utilise des méthodes statistiques comme TF-IDF et des modèles d'apprentissage automatique. Cependant, les modèles de langage de grande taille (LLM) comme GPT-4 offrent une compréhension plus contextuelle et nuancée des textes. Cette étude compare les approches traditionnelles et modernes d'extraction de mots-clés en utilisant des articles scientifiques de la base de données HAL. Les résultats montrent que les LLM surpassent les méthodes classiques en termes de précision et de pertinence, suggérant des améliorations pour les systèmes de recherche scientifique.

Type :	:	Communications
Thématiques	:	Analyser
PDF version	:	PDF version

Vie privée | Accessibilité