Al Lakas El’eli: Un Système de Résumé Automatique de Documents Arabes

Abstract:

Dans cet article, nous proposons un système de résumé automatique pour les articles de presse en arabe. La méthode sur laquelle repose notre système de résumé automatique est basée sur des critères linguistiques et sur des critères statistiques afin d’améliorer le contenu informationnel du résumé généré. Le principe de la méthode s’appuie ainsi sur deux piliers. Le premier pilier est le repérage des marqueurs linguistiques(1) porteurs de valeurs sémantiques et indépendants d’un domaine particulier tels que les annonces thématiques, les événements, les conclusions, etc. Le deuxième pilier est l’évaluation du degré de pertinence des phrases repérées en fonction de critères statistiques ayant fait leurs preuves pour d’autres langues (l'anglais, le français, etc.) tels que la fréquence des mots, les mots du titre et la position des phrases.