Une Méthode De Résumé Automatique Basée Sur l’Apprentissage Approfondi

Abstract:

Cet article s’inscrit dans le cadre des travaux sur le résumé automatique et se propose de développer une méthode de résumé des documents multiples basée sur l’apprentissage profond. Toutefois, les corpus existants traitant les résumés de textes ne sont pas pour autant de taille importante pour l’étape d’apprentissage. Afin d’obtenir un corpus étendu de documents sources/extrait, nous nous sommes basés sur un corpus initial traitant les documents multiples issus de la conférence DUC’2004. L’expansion de ce corpus est assurée par un algorithme génétique dont la fonction objec-tif est de déterminer l’extrait qui corrèle le mieux avec les résumés de références. La suppression graduelle des phrases de ces extraits à partir des textes sources, nous permet de construire de nou-veaux extraits en réitérant le processus de corrélation avec les résumés de références. Les résultats obtenus après la phase d’apprentissage sont intéressants et présentent une nette amélioration par rap-port aux résultats officiels que nous avons enregistrés lors de notre participation à ladite conférence.