Nous proposons dans cet article une approche pour l'indexation et la recherche d'information pour un corpus trilingue: arabe, français et anglais. Le système proposé est fondé sur un formalisme de représentation de connaissances, plus précisément les graphes sémantiques [4] qui supportent une ontologie de domaine.
Les documents et les requêtes sont aussi représentés dans ce formalisme. L'ontologie du domaine constitue le noyau du système et est utilisée aussi bien pour l'indexation que pour la recherche. Le système d'indexation utilise une méthode d'extraction qui est basée sur le calcul de segments répétés en utilisant des filtres linguistiques. Quant au système de recherche, il est fondé sur la comparaison de graphes de requêtes et de graphes de documents.
-
Votre commentaire
Votre commentaire s'affichera sur cette page après validation par l'administrateur.
Ceci n'est en aucun cas un formulaire à l'adresse du sujet évoqué,
mais juste un espace d'opinion et d'échange d'idées dans le respect.
Posté Le : 14/10/2022
Posté par : einstein
Ecrit par : - Aliane Hassina - Boucham Souhila
Source : Revue de l'Information Scientifique et Technique Volume 23, Numéro 2, Pages 16-24 2016-12-16