LexCrawl

Un robot d'exploration qui repère et indexe les pages pertinentes pour un domaine spécifique sur le web ou un intranet.

LexCrawl est un robot web qui examine le contenu de sites internet pré-sélectionnés par vous. Parmi les contenus web, LexCrawl identifie, recueille et catégorise les pages pertinentes à partir des paramètres qui lui sont fournis. Une fois les pages pertinentes identifiées, LexCrawl suit leur évolution et porte à l'attention de l'usager les changements subséquents apportées à ces pages. De cette façon l'usager peut, par exemple, suivre la progression d'un projet de loi ou l'évolution de tout texte dont le contenu est appelé à changer dans le temps.

LexCrawl peut être configuré indépendamment pour chacun des sites à surveiller. Des règles d'inclusion et d'exclusion permettent de restreindre la surveillance à certaines sections des sites. De la même façon, la profondeur du balayage peut être spécifiée.

LexCrawl utilise des listes de mots-clés et expressions-clés qui sont construits à partir de vos besoins de façon à classer l'information recueillie par pertinence. De plus, certains champs peuvent être prédéfinis pour l'ensemble des documents provenant d'un site particulier. Par exemple, LexCrawl peut balayer tout le contenu du site du Gouvernement du Canada mais ne faire ressortir que les pages où apparaît l'expression « propriété intellectuelle ». Les pages identifiées pourraient être organisées d'après leur juridiction, langue, etc. tout dépendant des champs prédéfinis par l'usager.

Ce que LexCrawl peut faire pour vous...

  • Recevez de l'information à jour provenant d'un vaste ensemble de sites web reliés à votre domaine d'activité.
  • Filtrez les pages web pertinentes et enregistrez-les dans une base de données.
  • Suivez continuellement les changements apportés aux contenus qui vous intéressent.
  • Offrez à vos gestionnaires de contenu et à vos usagers un outil de veille informationnelle efficace.

L'avantage LexCrawl

  • Mode de comparaison côte-à-côte permettant d'identifier les changements survenus entre deux versions subséquentes d'un même document.
  • Interfaces conviviales permettant d'ajuster les paramètres pour chaque site surveillé.