Abstract:
Nos travaux s’inscrivent dans le cadre de la compr´ehension automatique de la parole arabe spontan´ee, plus pr´ecis´ement, la compr´ehension litt´erale. En effet, nous proposons, dans cet article, une m´ethode hybride pour la compr´ehension litt´erale des ´enonc´es oraux arabes spontan´es. Notre m´ethode repose sur deux parties. La premi`ere est une partie symbolique compos´ee de trois´etapes `a savoir, la segmentation conceptuelle, le traitement de disfluences (i.e.,simples et complexes) et la g´en´eration de sch´emas s´emantiques. La deuxi`eme partie est num´erique bas´ee sur l’apprentissage pour extraire des r`egles permettant le traitement de mots hors-vocabulaire (i.e., inconnus et mal-reconnus). Pour l’impl´ementation de la m´ethode propos´ee, nous avons r´ealis´e le module AOCSM (Arabic Oral Conceptual Segmentation Module) qui a ´et´e int´egr´e par
la suite dans le syst`eme SARF [1] afin de l’´evaluer. Les r´esultats de l’´evaluation sont encourageants. Nous avons obtenus les taux de rappel, de pr´ecision et de F-mesure qui ´egalent, respectivement `a, 0.769%, 0.892% et 0.826%. Aussi, le taux de compr´ehension acceptable du syst`eme SARF est am´elior´e de 9.30%. Mots cl´es. Compr´ehension de l’oral arabe spontan´e, segmentation conceptuelle, mots hors-vocabulaire, disfluences, m´ethode hybride.