Grammaire TAG pour l’Analyse Syntaxique de Textes en Arabe comme un Problème de Classification

Abstract:

Cet article présente une approche d’analyse syntaxique de textes en langue arabe qui se base sur l’application d’une procédure de classification et l’utilisation du formalisme grammatical TAG. Le corpus d’apprentissage est, alors, représenté suivant la grammaire TAG. Il consiste en un ensemble de paires : phrase et arbre d’analyse. Le classifieur doit attribuer à un mot donné dans un contexte bien déterminé l’arbre élémentaire correct correspondant en s'appuyant sur des informations à la fois morphosyntaxiques, sémantiques et surtout compositionnelles (la portion de l’arbre d’analyse déjà construite) extraites du contexte TAG utilisé. Ces différents types d’informations servent à construire de manière simultanée l’arbre d’analyse relative à toute une phrase d’une façon déterministe et incrémentale.