Application d’une Methode Numerique a base d’Apprentissage pour la Segmentation Conceptuelle de l’Oral Arabe Spontane

Abstract:

Notre travail s’int`egre dans le cadre de la r´ealisation du serveur vocal arabe SARF [1]. En effet, nous visons l’am´elioration du module de la compr´ehension litt´erale du syst`eme SARF par l’application d’une approche num´erique `a base de l’apprentissage `a la place de l’approche symbolique actuellement adopt´ee dans SARF. Ainsi, dans cet article, nous proposons une m´ethode num´erique `a base d’apprentissage pour la segmentation conceptuelle des ´enonc´es oraux arabes spontan´es. Cette m´ethode permet, `a partir d’un ´enonc´e pr´etrait´e et ´etiquet´e, de traiter les mots Hors-Vocabulaire (HV) et d’extraire l’ensemble de segments conceptuels composant l’´enonc´e. Aussi, nous proposons une impl´ementation de la m´ethode propos´ee sous forme de module de segmentation conceptuelle (CSM : Conceptual Segmentation Module). CSM est test´e `a travers le module de la compr´ehension litt´erale du syst`eme SARF. Les exp´eriences ont approuv´e que l’utilisation de la technique de l’apprentissage permet d’aboutir `a des r´esultats encourageants vis-`a-vis aux difficult´es de l’oral arabe spontan´e.