La GED ou GEIDE au service des entreprises

 

La compression des images en GED


Les images numérisées subissent plusieurs traitements électroniques avant d'être stockées. Ceux-ci sont fonction de l'utilisation qui sera faite des documents ainsi convertis. Mais il faut tout d'abord et impérativement les compresser pour réduire la taille du fichier. Cette compression réduit la place occupée sur les supports d'archivage mais permet aussi de transférer plus rapidement un fichier sur des réseaux locaux ou de type intranet/internet. Les techniques et méthodes de compression sont diverses. Elles diffèrent en fonction de la nature des originaux et la méthode de numérisation utilisée. Pour les documents textuels numérisés sous forme d'images bitonales, c'est la compression CCITT G3/G4 (tiff) qui est utilisée dans la majeure partie des logiciels de GED. Basée sur des techniques conçues à l'origine pour la télécopie, elle fait appel à des algorithmes normalisés et n'induit pas de pertes lors du traitement, ce qui préserve l'intégrité du document original. De création plus récente, la compression JBIG (Joint Bi-level Image Group) fait son apparition dans les applications GED. Le JBIG, normalisé au niveau de l'ISO, entraîne également une réduction de la taille des documents sans perte du contenu. Son mode de traitement assure une compression plus élevée que le CCITT G3/G4 et offre quelques avantages tels que la création automatique de variantes d'une même image ou d'une imagette. Les documents couleurs ou à niveaux de gris numérisés sont généralement compressés en utilisant l'algorithme JPEG (Joint Picture Expert Group) normalisé par l'ISO. Avec JPEG, l'utilisateur dispose d'une grande latitude dans le choix du taux de compression. Il dépend du compromis à trouver entre le résultat attendu et la taille du fichier. JPEG induit des pertes dans le contenu des images lorsqu'on utilise de très forts taux de compression. Par expérience, ces pertes sont perceptibles au delà d'un ratio de 1/25 et varient en fonction de la nature de l'image. Il est également possible d'utiliser JPEG pour compresser une image couleur, sans dégradation de l'image mais en acceptant un taux de compression plus faible.

Nous avons cité là les méthodes normalisées de compression des images fixes mais il en existe de nombreuses autres faisant appel à des algorithmes propres à une société et dont le résultat est parfois surprenant (fractales, ondelettes, etc.). Toutefois, dans un souci de pérennité et de transfert éventuel des documents vers d'autres programmes, la majorité des fournisseurs GED ont choisi d'utiliser des techniques normalisées et universellement employées. Cette largeur d'esprit a cependant des limites. C'est ainsi que l'on trouve souvent dans les logiciels de GED des entêtes de fichiers propriétaires qui ne permettent pas de porter les images vers un logiciel concurrent. Il convient donc de vérifier par des tests les possibilités d'exportation ou de conversion des images si l'on veut être sûr de pouvoir relire les documents numérisés en cas de changement de fournisseur de logiciel de GED.

La compression des images numérisées peut être réalisée soit par logiciels, soit à l'aide d'une carte accélératrice intégrant des processeurs de traitement conçus à cet effet. Aujourd'hui la puissance de calcul des micro-ordinateurs ou des stations de travail rend possible la compression des images à l'aide d'un logiciel intégré aux programmes GED. Cette méthode est bien adaptée à des traitements quotidiens peu nombreux. Lorsqu'on utilise des numériseurs rapides ou recto/verso, il faut faire appel à une ou plusieurs cartes additionnelles conçues à cet effet. En général, ces cartes servent à deux choses : à interfacer le scanner au micro-ordinateur et à compresser grâce aux processeurs de traitement intégrés qui sont capables de traiter en temps réel des images immédiatement après leur saisie. Ces cartes existent en différentes versions et assurent la compression aux normes CCITT G3/G4 ou en JBIG. Les images couleurs nécessitent en général une carte dotée d'un processeur de traitement JPEG. Dans les prochaines années, toutes ces fonctions de compression seront réunies sur une même carte quand existeront les processeurs universels capables d'utiliser les différents algorithmes de compression.

(Photos : carte Dunord d'interfaçage de balayeurs optiques et de traitement d'images numérisées et carte ImageAccel de Cornerstone Imaging pour l'affichage et la décompression des images numérisées)

Les autres traitements optionnels

Les images peuvent être appelées à subir d'autres traitements avant la compression. Tous ceux-ci sont programmables par logiciel et peuvent se faire sans intervention humaine lorsqu'ils ont été préalablement paramétrés. Par exemple, l'amélioration du rendu des images numérisées se fait par application de plusieurs filtres et autres outils du même genre (VRS, par exemple). Ils ont pour effet d'augmenter le contraste entre les noirs et les blancs ou d'éliminer un fond gris résultant de la numérisation d'un document dont l'original est imprimé sur un papier de couleur. De même, des filtres permettent de réduire le nombre de défauts, des points noirs ou des rayures, présents sur un original de mauvaise qualité. Lorsque l'application prévoit la reconnaissance optique des caractères, on peut intégrer de nombreux logiciels complémentaires pour faciliter cette reconnaissance, par exemple en éliminant les cadres ou les cases utilisées dans un formulaire pour délimiter les zones à remplir. Ces informations de forme, utiles lors de l'établissement du document original, sont inutiles, voire nuisibles, au traitement ultérieur et sont automatiquement éliminées par des logiciels spéciaux. Tous ces filtres permettent au final une meilleure reconnaissance optique de caractères, qualité qui elle-même conditionne l'acquisition de données soit d'indexation, soit d'enrichissement des applicatifs ou de bases de données.