Les documents présents dans les catalogues peuvent être indexés et intégrés dans l'index de recherche plein texte.
Pour ce faire, les colonnes correspondantes contenant des documents PDF et autres doivent être indiquées dans la clé VARSEARCHINDEXDOCUMENT (soit dans le dir.prj du catalogue, soit dans les fichiers prj individuels).
VARSEARCHINDEXDOCUMENTVARIABLES=<List of columns to index>
Pour indexer un projet de document, la clé VARSEARCHINDEXDOCUMENT doit être définie sur "YES".
VARSEARCHINDEXDOCUMENT=YES
Pour pouvoir lire le contenu des images dans les documents PDF, le logiciel de reconnaissance de texte "Tesseract" doit être installé et le chemin d'installation doit être indiqué par un fichier config.
[INDEX:OCR] TesseractPath= TesseractDataPath=
Il existe également deux réglages optionnels :
DPI=600 ImageFormat=