Manuals - eCATALOGsolutions

5.9.22.5. *.prj (fichiers de projet)

5.9.22.5.2. Recherche plein texte: indexation de PDF et d'autres documents

Les documents présents dans les catalogues peuvent être indexés et intégrés dans l'index de recherche plein texte.

Pour ce faire, les colonnes correspondantes contenant des documents PDF et autres doivent être indiquées dans la clé VARSEARCHINDEXDOCUMENT (soit dans le dir.prj du catalogue, soit dans les fichiers prj individuels).

VARSEARCHINDEXDOCUMENTVARIABLES=<List of columns to index>

Pour indexer un projet de document, la clé VARSEARCHINDEXDOCUMENT doit être définie sur "YES".

VARSEARCHINDEXDOCUMENT=YES

Pour pouvoir lire le contenu des images dans les documents PDF, le logiciel de reconnaissance de texte "Tesseract" doit être installé et le chemin d'installation doit être indiqué par un fichier config.

$CADENAS_SETUP/partsol.cfg

[INDEX:OCR]
TesseractPath=
TesseractDataPath=

Il existe également deux réglages optionnels :

DPI=600
ImageFormat=

Précédent	Niveau supérieur	Suivant
5.9.22.5.1. Recherche plein texte: inclure des mots-clés dans le fichier de projet	Sommaire	5.10. Adapter les dérivations 2D