Exploitation de l’Arabe dans des Applications Industrielles en TALN

Abstract:

Par ses propriétés morphologiques, syntaxiques, phonétiques et phonologiques, la langue arabe est considérée comme faisant partie des langues difficiles à appréhender dans le domaine du traitement automatique du langage écrit et parlé. Dans le domaine du traitement automatique de l'arabe écrit, les recherches ont débuté vers les années 1970, avant même que les problèmes d'édition de textes arabes ne soient complètement maîtrisés. Les premiers travaux concernaient notamment les lexiques et la morphologie. Depuis une dizaine d'années, l'internationalisation du Web et la prolifération des moyens de communication en langue arabe, ont révélé un grand nombre d'applications du TALN arabe. Les travaux de recherche ont ainsi commencé à aborder des problématiques plus variées comme la syntaxe, la traduction automatique, l'indexation automatique des documents, la recherche d'information translinguistique, etc.