Suite

Analyse dimensionnelle/problème de conversion : échelle de la carte en résolution d'image (dpi)


Étant donné une échelle de carte de 1:17 200 et un raster dont la taille de cellule est de 6 pouces, quelle résolution (points par pouce) dois-je choisir lors de l'exportation de la carte vers une image afin de conserver la résolution native du raster (1 cellule = 1 point) . Besoin d'un rappel rapide sur les formules de conversion.


J'ai trouvé cette formule sur le blog ESRI Mapping Center :

1/x = 1 / (taille au sol des pixels [m/pixel] × densité de pixels [pixels/m]), de sorte que 1 mètre sur la carte représente x mètres au sol

Lequel, réarrangé pour résoudre la densité de pixels (résolution) est :

densité de pixels [pixels/m] = x / taille de pixel au sol [m/pixel]

En branchant mes numéros/unités, c'est :

densité de pixels [pixels/pouce] = 17 200 / 6 pouces = 2866.67 pixels/pouce

Ça va être un gros dossier...


Résolution spatiale, taille de pixel et échelle

Pour certains instruments de télédétection, la distance entre la cible imagée et la plate-forme joue un rôle important dans la détermination du détail des informations obtenues et de la surface totale imagée par le capteur. Les capteurs embarqués sur des plates-formes éloignées de leurs cibles, voient généralement une zone plus large, mais ne peuvent pas fournir beaucoup de détails. Comparez ce qu'un astronaute à bord de la navette spatiale voit de la Terre à ce que vous pouvez voir depuis un avion. L'astronaute peut voir toute votre province ou votre pays d'un seul coup d'œil, mais ne peut pas distinguer les maisons individuelles. En survolant une ville ou une ville, vous pourriez voir des bâtiments et des voitures individuels, mais vous verriez une zone beaucoup plus petite que l'astronaute. Il existe une différence similaire entre les images satellites et les photos aériennes.

Le détail discernable dans une image dépend de la résolution spatiale du capteur et se réfère à la taille de la plus petite caractéristique possible qui peut être détectée. La résolution spatiale des capteurs passifs (nous verrons plus loin le cas particulier des capteurs hyperfréquence actifs) dépend principalement de leur Champ de vision instantané (IFOV). L'IFOV est le cône angulaire de visibilité du capteur (A) et détermine la zone à la surface de la Terre qui est « vue » depuis une altitude donnée à un moment donné (B). La taille de la zone visualisée est déterminée en multipliant l'IFOV par la distance entre le sol et le capteur (C). Cette zone au sol s'appelle le cellule de résolution et détermine la résolution spatiale maximale d'un capteur. Pour qu'une caractéristique homogène soit détectée, sa taille doit généralement être égale ou supérieure à la cellule de résolution. Si la caractéristique est plus petite que cela, elle peut ne pas être détectable car la luminosité moyenne de toutes les caractéristiques de cette cellule de résolution sera enregistrée. Cependant, des caractéristiques plus petites peuvent parfois être détectables si leur réflectance domine dans une cellule de résolution articulaire permettant une détection de sous-pixel ou de cellule de résolution.

Comme nous l'avons mentionné au chapitre 1, la plupart des images de télédétection sont composées d'une matrice d'éléments d'image, ou pixels, qui sont les plus petites unités d'une image. Les pixels de l'image sont normalement carrés et représentent une certaine zone sur une image. Il est important de faire la distinction entre la taille des pixels et la résolution spatiale - ils ne sont pas interchangeables. Si un capteur a une résolution spatiale de 20 mètres et qu'une image de ce capteur est affichée en pleine résolution, chaque pixel représente une zone de 20 mx 20 m au sol. Dans ce cas, la taille des pixels et la résolution sont les mêmes. Cependant, il est possible d'afficher une image avec une taille de pixel différente de la résolution. De nombreuses affiches d'images satellites de la Terre ont leurs pixels moyennés pour représenter des zones plus grandes, bien que la résolution spatiale d'origine du capteur qui a collecté les images reste la même.

On dit que les images où seules de grandes caractéristiques sont visibles ont résolution grossière ou faible. Dans fine ou haute résolution images, de petits objets peuvent être détectés. Les capteurs militaires, par exemple, sont conçus pour afficher autant de détails que possible, et ont donc une résolution très fine. Les satellites commerciaux fournissent des images avec des résolutions variant de quelques mètres à plusieurs kilomètres. De manière générale, plus la résolution est fine, moins la surface totale au sol est visible.

Le rapport entre la distance sur une image ou une carte et la distance réelle au sol est appelé échelle. Si vous aviez une carte à l'échelle 1:100 000, un objet de 1 cm de long sur la carte serait en fait un objet de 100 000 cm (1 km) de long au sol. Les cartes ou les images avec de petits "rapports carte-sol" sont appelées à petite échelle (par exemple 1:100 000), et celles avec des rapports plus grands (par exemple 1:5 000) sont appelées à grande échelle.


6 réponses 6

"Je veux un Bitmap d, c'est-à-dire en niveaux de gris. Je vois un constructeur qui inclut System.Drawing.Imaging.PixelFormat, mais je ne comprends pas comment l'utiliser."

ÉDITER: Pour convertir en niveaux de gris

Version plus rapide de switchonthecode suivez le lien pour une analyse complète :

De cette façon, il conserve également le canal alpha.
Prendre plaisir.

Il existe une méthode statique dans la classe ToolStripRenderer, nommée CreateDisabledImage . Son utilisation est aussi simple que :

Il utilise une matrice un peu différente de celle de la réponse acceptée et la multiplie en plus par une transparence de valeur 0,7, de sorte que l'effet est légèrement différent de l'échelle de gris, mais si vous voulez simplement que votre image soit grisée, c'est le plus simple et meilleure solution.

Aucun des exemples ci-dessus ne crée d'images bitmap 8 bits (8bpp). Certains logiciels, comme le traitement d'images, ne prennent en charge que 8bpp. Malheureusement, les bibliothèques MS .NET n'ont pas de solution. Le format PixelFormat.Format8bppIndexed semble prometteur, mais après de nombreuses tentatives, je n'ai pas pu le faire fonctionner.

Pour créer un véritable fichier bitmap 8 bits, vous devez créer les en-têtes appropriés. En fin de compte, j'ai trouvé la solution de bibliothèque Grayscale pour créer des fichiers bitmap 8 bits (BMP). Le code est très simple :


Analyse dimensionnelle/Problème de conversion : Échelle de la carte en résolution d'image (dpi) - Systèmes d'Information Géographique

pour le
netteté de l'image
séries

Netteté et détail de l'image

La netteté d'un système d'imagerie photographique ou d'un composant du système (objectif, film, capteur d'image, scanner, grossissant, etc.) est caractérisée par un paramètre appelé Fonction de transfert de modulation (MTF), également connu sous le nom de réponse en fréquence spatiale. Nous présentons une explication visuelle unique de la MTF et de son lien avec la qualité de l'image. Un exemple est montré sur la droite. Le sommet est une cible composée de bandes de fréquence spatiale croissante, représentant 2 à 200 paires de lignes par mm (lp/mm) sur le plan image. Ci-dessous, vous pouvez voir les effets cumulatifs de l'objectif, du film, de l'objectif + film, du scanner et de l'algorithme de netteté, basés sur des modèles informatiques précis dérivés de données publiées. Si cela vous intéresse, lisez la suite. Cela devient un peu technique, mais je m'efforce de le garder lisible.

  • Cette page présente la MTF et la relie aux mesures de résolution traditionnelles. illustre son effet sur le film et les lentilles. se poursuit avec des scanners (capteurs d'images) et des algorithmes de netteté.
  • La partie 3 traite des imprimantes et des impressions, et comment caractériser leur netteté et leur résolution.
  • La partie 4 présente les résultats détaillés des tests d'impression.
  • La partie 5 traite des tests de lentilles à l'aide d'une nouvelle cible téléchargeable avec une fréquence spatiale variable en continu.
  • La partie 6 traite de la profondeur de champ (DOF), en mettant l'accent sur la netteté aux limites de l'échelle DOF. compare les appareils photo numériques avec le film et répond à la question « Combien de pixels faut-il pour qu'un capteur numérique surpasse un film 35 mm ? »
  • La partie 8 compare le grain et la netteté de trois scanners avec une impression agrandie bien conçue, et nous examinons les solutions logicielles et d'alias de grain.

Introduction à la fonction de transfert de modulation (MTF)

La fréquence spatiale est généralement mesurée en cycles ou en paires de lignes par millimètre (lp/mm), ce qui est analogue aux cycles par seconde (Hertz) dans les systèmes audio. Lp/mm est le plus approprié pour les appareils photo argentiques, où les formats sont relativement fixes (c. appareils photo numériques, qui ont une grande variété de tailles de capteurs.

La plupart d'entre nous connaissent la fréquence du son, qui est perçue comme la hauteur et mesurée en cycles par seconde, maintenant appelée Hertz. Les composants audio—, les amplificateurs, les haut-parleurs, etc.— se caractérisent par courbes de réponse en fréquence. MTF est aussi une réponse en fréquence, sauf qu'elle implique spatial fréquence— cycles (paires de lignes) par distance (millimètres ou pouces) au lieu de temps. Les mathématiques sont les mêmes. Les tracés de ces pages ont des fréquences spatiales qui augmentent continuellement de gauche à droite. Les hautes fréquences spatiales correspondent aux détails fins de l'image. La réponse des composants photographiques (film, objectifs, scanners, etc.) a tendance à s'atténuer à des fréquences spatiales élevées. Ces composants peuvent être considérés comme des filtres passe-bas— qui laissent passer les basses fréquences et atténuent les hautes fréquences.

Paires de lignes ou lignes ?
Toutes les cartes MTF et plus les cartes de résolution affichent la fréquence spatiale dans cycles ou alors paires de lignes par unité de longueur (mm ou pouce). Mais il y a des exceptions. Une ancienne norme pour mesurer la résolution TV utilise la ligne largeurs à la place de paires , où il y a deux largeurs de ligne par paire, sur la hauteur totale de l'affichage. Lorsque dpreview.com recommande de multiplier les valeurs du graphique dans ses tests d'objectif par 100 pour obtenir le nombre total de lignes verticales dans l'image, ils se réfèrent à la ligne largeurs , ne pas paires . Déroutant, mais j'essaie de le garder droit. Imatest SFR affiche la MTF en cycles (paires de lignes) par pixel, les largeurs de lignes par hauteur d'image (LW/PH dérivées des mesures TV) et les paires de lignes par distance (mm ou in).

La signification essentielle de MTF est assez simple. Supposons que vous ayez un motif composé d'un son pur (une onde sinusoïdale). Aux fréquences où la MTF d'un système d'imagerie ou d'un composant (film, objectif, etc.) est de 100 %, le motif n'est pas atténué et conserve un contraste total. À la fréquence où MTF est de 50 %, le contraste est égal à la moitié de sa valeur d'origine, et ainsi de suite. MTF est généralement normalisé à 100 % aux très basses fréquences. Mais il peut aller au-dessus de 100% avec des résultats intéressants.

Des niveaux de contraste de 100 % à 2 % sont illustrés à droite pour un modèle sinusoïdal à fréquence variable. Le contraste est modérément atténué pour MTF = 50 % et sévèrement atténué pour MTF = 10 %. Le motif à 2 % n'est visible que parce que les conditions de visualisation sont favorables : il est entouré de gris neutre, il est silencieux (sans grain) et le contraste d'affichage des écrans cathodiques et de la plupart des écrans LCD est relativement élevé. Il pourrait facilement devenir invisible dans des conditions moins favorables.

Comment la MTF est-elle liée à la résolution des lignes par millimètre ? L'ancienne mesure de résolution "lp/mm distinguable" correspond à peu près aux fréquences spatiales où la MTF est comprise entre 5% et 2% (0,05 à 0,02). Ce nombre varie avec l'observateur, dont la plupart l'étirent aussi loin qu'ils le peuvent. Une MTF de 9 % est impliquée dans la définition de la limite de diffraction de Rayleigh.

La figure ci-dessous représente une configuration sinusoïdale (fréquences pures) avec des fréquences spatiales de 2 à 200 cycles (paires de lignes) par mm sur une bande de film de 0,5 mm. La moitié supérieure du motif sinusoïdal présente un contraste uniforme. La moitié inférieure illustre les effets du Provia 100F sur le MTF. Le contraste du motif diminue de moitié à 42 cycles/mm.

VB La luminance minimale (ou valeur de pixel) pour les zones noires — aux basses fréquences spatiales. La fréquence doit être suffisamment basse pour que le contraste ne change pas s'il est réduit.
VW La luminance maximale pour les zones blanches — à basses fréquences spatiales.
Vmin La luminance minimale pour un motif proche de la fréquence spatiale F (une "vallée" ou "pic négatif").
Vmax La luminance maximale pour un motif proche de la fréquence spatiale F (un pic").
C(0) = (VW-VB)/(VW+VB) est le contraste basse fréquence (noir-blanc).
C( F ) = (Vmax-Vmin)/(Vmax+Vmin) est le contraste à la fréquence spatiale F . Normaliser le contraste de cette manière — en divisant par Vmax+Vmin (VW+VB à basses fréquences spatiales) — minimise les erreurs dues aux non-linéarités liées au gamma lors de l'acquisition du motif.
MTF( F ) = 100% * C( F )/C(0)

Systèmes d'imagerie

Les systèmes d'imagerie sur film se composent d'un objectif, d'un film, d'un développeur, d'un scanner, d'un éditeur d'images et d'une imprimante (pour les impressions numériques) ou d'un objectif, d'un film, d'un développeur, d'un objectif d'agrandissement et de papier (pour les impressions traditionnelles en chambre noire). Les systèmes d'imagerie basés sur un appareil photo numérique se composent d'un objectif, d'un capteur d'image numérique, d'un programme de dématriçage, d'un éditeur d'images et d'une imprimante. Chacun de ces composants a une réponse en fréquence caractéristique MTF est simplement son nom en photographie. La beauté de travailler dans le domaine fréquentiel est que la réponse de l'ensemble du système (ou groupe de composants) peut être calculée en multipliant les réponses de chaque composant.

Les fréquences MTF typiques à 50 % se situent aux alentours de 40 à 80 lp/mm pour les composants individuels (objectifs, films, scanners) et souvent aussi basses que 30 lp/mm pour l'ensemble des systèmes d'imagerie — beaucoup plus bas que les lignes 80-160 nombres /mm typiques des anciennes mesures de résolution. Il faut un certain temps pour s'y habituer si vous avez grandi avec les anciennes mesures.

  1. Convertissez le signal dans le domaine fréquentiel à l'aide d'une opération mathématique connue sous le nom de transformée de Fourier, qui est rapide et facile à exécuter sur des ordinateurs modernes à l'aide de l'algorithme FFT (Fast Fourier Transform). Le résultat de la transformation est appelé le composantes fréquentielles ou alors FFT du signal. Les images diffèrent des fonctions temporelles comme le son en ce qu'elles sont deux dimensions. Le film a le même MTF dans toutes les directions, mais pas les objectifs.
  2. Multipliez les composants de fréquence du signal par la réponse en fréquence (ou MTF) du composant ou du système.
  3. Inverse transformer le signal dans le domaine temporel ou spatial.

Un graphique virtuel pour visualiser MTF

Le rouge courbe est la réponse spatiale du motif de barre au film + lentille. Le bleu est la MTF combinée, c'est-à-dire la réponse spatiale en fréquence du film + objectif, exprimé en pourcentage de réponse basse fréquence, indiqué sur l'échelle de gauche. (Il dépasse les 100% (10 2 ).) Le mince bleu la courbe en pointillés est la MTF de l'objectif uniquement.

Les bords du motif des barres ont été élargis et il y a de petits pics de chaque côté des bords. La forme du bord est inversement liée à la réponse MTF : plus la réponse MTF est étendue, plus le bord est net (ou étroit). L'amplification des fréquences moyennes de la réponse MTF est liée aux petits pics de chaque côté des bords.

La courbe MTF est liée à la réponse impulsionnelle par une opération mathématique connue sous le nom de transformée de Fourier ( F ), bien connue des ingénieurs et des physiciens.

Réponse MTF = F(réponse impulsive)
réponse impulsionnelle = F -1 (réponse MTF)

L'image ci-dessus ne représente que 0,5 mm de film, mais occupe environ 5 pouces (13 cm) sur mon moniteur. À ce grossissement (260 x ), une image plein format de 35 mm (24 x 36 mm) mesurerait 240 pouces (6,2 mètres) de haut et 360 pouces (9,2 mètres) de large. Un peu excessif, mais si vous vous éloignez de l'écran, vous ressentirez les effets de l'objectif, du film, du scanner (ou de l'appareil photo numérique) et de la netteté sur des images réelles.

Liens vers des articles généraux sur MTF

Acuité visuelle humaine

À une distance de l'œil (qui a une focale nominale de 16,5 mm), cela correspond à des objets de longueur = (angle en radians)* = 0.000291*. Par exemple, pour un objet vu à une distance de 25 cm (environ 10 pouces), la distance que vous pourriez utiliser pour un examen minutieux d'un tirage photographique de 8 x 10 pouces, cela correspondrait à 0,0727 mm = 0,0029 pouces. Puisqu'une paire de lignes correspond à deux lignes de cette taille, la fréquence spatiale correspondante est de 6,88 lp/mm ou 175 lp/inch. Supposons maintenant que l'image a été imprimée à partir d'un cadre de 35 mm agrandi 8 x . La fréquence spatiale correspondante sur le film serait de 55 lp/mm.

Cela signifie que pour une impression 8 x 10 pouces, le MTF d'un appareil photo 35 mm (objectif + film, etc.) supérieur à 55 lp/mm, ou le MTF d'un appareil photo numérique supérieur à 2800 LW/PH (Largeurs de ligne par hauteur d'image) mesuré par Imatest SFR, possède non effet sur l'apparence de l'impression. C'est pourquoi les fréquences spatiales les plus élevées utilisées dans les cartes MTF du fabricant sont généralement de 40 lp/mm, ce qui fournit une excellente indication de la netteté perçue d'un objectif dans une impression de 8 x 10 pouces agrandie 8 x. Bien sûr, des fréquences spatiales plus élevées sont intéressantes pour les tirages plus grands.

Les échelles de profondeur de champ standard (DOF) sur les objectifs sont basées sur l'hypothèse, faite dans les années 1930, que la plus petite caractéristique d'importance, vue à 25 cm, est de 0,01 pouce & 3 fois plus grande. Il ne devrait pas être surprenant que la mise au point ne soit pas très nette aux limites du DOF. Voir la page DOF pour plus de détails.

L'affirmation selon laquelle l'œil ne peut pas distinguer les caractéristiques inférieures à une minute d'arc est, bien sûr, simpliste. L'œil a une réponse MTF, comme tout autre composant optique. Il est illustré à droite du document n° 9 : Perception visuelle humaine du cours EE368B de l'Université de Stanford - Compression d'images et de vidéos par le professeur Bernd Girod. L'axe horizontal est la fréquence angulaire en cycles par degré (CPD). La MTF est indiquée pour des pupilles de 2 mm (éclairage vif f/8) à 5,8 mm (éclairage tamisé f/2,8). À 30 CPD, correspondant à une minute d'une taille de caractéristique d'arc, la MTF passe de 0,4 pour la pupille de 2 mm à 0,16 pour la pupille de 5,8 mm. (Maintenant, vous connaissez la plage d'ouverture de votre œil. C'est similaire aux appareils photo numériques compacts.) Une autre page de Stanford contient des modèles informatiques Matlab de la MTF de l'œil.

Des explications supplémentaires sur l'acuité visuelle humaine peuvent être trouvées sur les pages du centre de ressources sur les tests non destructifs et de l'Université de Stanford. La page 3 de Stanford présente un tracé de la MTF de l'œil humain. Je crois que les unités de l'axe x (CPD) sont des cycles par degré, où une paire de caractéristiques de 1/60 degré correspond à 30 CPD.


Numéro spécial "Morphologie mathématique en géoinformatique"

La géoinformatique est la science qui traite de la capture, de l'analyse, de l'interprétation, de la diffusion et de l'utilisation de l'information géographique. L'information géographique est largement utilisée dans des applications telles que la cartographie de base, la gestion de l'environnement, les transports et les télécommunications ou la planification urbaine, la gestion de l'agriculture, la surveillance du changement climatique et bien d'autres.

Au cours des dernières décennies, de nombreux nouveaux systèmes d'acquisition évolués ont été développés. Ils fournissent une quantité toujours croissante de données extrêmement riches : systèmes Lidar, aériens ou terrestres, images hyper-spectrales avec un nombre croissant de canaux et une résolution améliorée, entre autres. Des techniques de traitement automatiques ou semi-automatiques sont nécessaires pour extraire de ces données des informations sémantiques utiles pour développer des applications pratiques.

La morphologie mathématique est une technique de traitement d'images non linéaire, basée sur la théorie des ensembles. Il décrit quantitativement le contenu de l'image en termes de forme et de taille, dans un cadre mathématique élégant. Elle s'est avérée être une technique extrêmement efficace dans de nombreuses applications et en particulier dans les applications géographiques et géoinformatiques.

Ce numéro spécial vise à fournir une vision de pointe des avancées de la morphologie mathématique pour les applications géoinformatiques.Des résultats expérimentaux et théoriques sont attendus.

Les sujets d'intérêt pour ce numéro spécial comprennent, sans s'y limiter, les suivants :

  • Segmentation des nuages ​​de points, classification.
  • Analyse et modélisation de scènes urbaines.
  • Filtrage d'images hyper-spectrales, segmentation, classification
  • Couverture de l'utilisation des terres
  • Détection de changement
  • Services géographiques satellitaires : surveillance forestière, humidité du sol, évaluation des dommages, &hellip

Les auteurs universitaires ou industriels travaillant dans les domaines de recherche ci-dessus ou étroitement liés sont encouragés à soumettre des manuscrits originaux qui n'ont pas été publiés et qui ne sont pas actuellement examinés par d'autres revues. Les auteurs potentiels doivent soumettre le manuscrit complet via le système en ligne (https://susy.mdpi.com/user/manuscripts/upload?journal=ijgi).

Dr Beatriz Marcotegui
Éditeur invité

Les manuscrits doivent être soumis en ligne sur www.mdpi.com en s'inscrivant et en se connectant à ce site Web. Une fois inscrit, cliquez ici pour accéder au formulaire de soumission. Les manuscrits peuvent être soumis jusqu'à la date limite. Les articles seront publiés en continu (dès leur acceptation) et seront répertoriés ensemble sur le site Web du numéro spécial. Les articles de recherche, les articles de synthèse ainsi que les communications sont invités. Pour les articles prévus, un titre et un court résumé (environ 100 mots) peuvent être envoyés au bureau éditorial pour annonce sur ce site.

Les manuscrits soumis ne doivent pas avoir été publiés auparavant, ni être à l'étude pour publication ailleurs (à l'exception des actes de conférence). Tous les manuscrits sont évalués par le biais d'un processus d'examen par les pairs. Un guide pour les auteurs et d'autres informations pertinentes pour la soumission de manuscrits sont disponibles sur la page Instructions pour les auteurs. ISPRS Journal International de Géo-Information est une revue mensuelle internationale à comité de lecture en libre accès publiée par MDPI.

Veuillez visiter la page Instructions pour les auteurs avant de soumettre un manuscrit. Les frais de traitement de l'article (APC) pour la publication dans ce numéro spécial sont de 150 CHF (francs suisses).


Systèmes de stockage sur disque de données optiques et d'imagerie numérique

Ces dernières années, les agences fédérales se sont de plus en plus intéressées à l'utilisation des technologies de l'information numérique pour stocker de grandes quantités d'informations de manière économique et efficace. Cela est particulièrement vrai des programmes conçus pour fournir des informations fédérales aux citoyens, car une réduction correspondante de la création de dossiers papier pourrait potentiellement réduire les coûts et améliorer la prestation des services au public. Cependant, les agences doivent s'assurer que toutes les technologies qu'elles utilisent pour stocker les informations sont capables de récupérer ces informations aussi longtemps que nécessaire.

En 1991, la National Archives and Records Administration (NARA), en collaboration avec la National Association of Government Archives and Records Administrators, a mené une étude sur les technologies d'imagerie numérique et de stockage de supports optiques aux niveaux des États et des gouvernements locaux. S'appuyant sur le rapport de 1991, la NARA a lancé une étude sur l'utilisation fédérale de ces deux technologies. Une équipe de projet du personnel de recherche technologique de la NARA a examiné quinze applications fédérales d'imagerie numérique et de stockage de données optiques numériques sur disque et a interviewé un certain nombre d'experts dans le domaine. Ce document d'information technique, qui formule des recommandations pour assurer un accès à long terme aux images numériques stockées sur des disques optiques de données numériques, est le résultat de cette étude.

En tant que gardien de la mémoire de la nation et en tant que gestionnaire des documents institutionnels du gouvernement fédéral, la NARA a pour mandat de fournir des conseils en matière de gestion des documents aux fonctionnaires fédéraux. Dans le même temps, nous invitons les archivistes, les gestionnaires de documents, les gestionnaires de ressources d'information et d'autres professionnels de l'information à partager leurs expériences et observations avec nous. Ensemble, nous pouvons développer des stratégies pour utiliser les nouvelles technologies pour stocker les informations fédérales tout en veillant à ce que les exigences de conservation et d'accès soient respectées.

TRUDY HUSKAMP PETERSON
Archiviste par intérim des États-Unis
Administration nationale des archives et des dossiers

Table des matières

  • Systeme d'intégration
  • Architecture des systèmes ouverts
  • Configuration du système d'imagerie numérique
  • Conversion des documents originaux
  • Scanners d'images numériques
    • Scanners de documents
    • Numérisation numérique et microformes
    • Configuration du système de disque optique de données numériques
    • Technologies d'enregistrement optique sur disque de données numériques
      • Systèmes WORM (Write Once Read Many).
      • Systèmes réinscriptibles
      • Postes de travail d'affichage d'images
      • Imprimantes d'images numériques
      • Logiciel d'applications de récupération
      • Rentabilité
      • Disposition des documents originaux
      • Admissibilité légale
      • Accès à long terme
      • Obstacles à l'accès
        • Instabilité des fournisseurs
        • Espérance de vie des supports/transfert de données et sauvegardes
        • Obsolescence du système

        • Agence pour le registre des substances toxiques et des maladies
        • Corps des ingénieurs de l'armée américaine (USACE)
        • Bureau de la gestion des terres (États de l'Est)
        • Commission de négociation des contrats à terme sur matières premières
        • Département de l'armée (Bureau du chef d'état-major)
        • Département de l'Armée (PERMS)
        • Agence de Protection de l'Environnement
        • Commission fédérale des communications
        • Bibliothèque du Congrès
        • Service de gestion des minéraux
        • L'administration nationale des océans et de l'atmosphère
        • Bureau des brevets et des marques
        • Administration de la sécurité sociale
        • Département d'Etat
        • Commission géologique des États-Unis

        En 1983, l'archiviste des États-Unis a ordonné que le personnel de recherche et d'évaluation des archives récemment créé lance un programme pour surveiller les développements dans les technologies d'imagerie numérique et de stockage de données optiques numériques sur disque. En 1985, le personnel avait lancé un programme de recherche qui comprenait plusieurs programmes clés. Un projet pilote d'imagerie numérique et de disques optiques de données numériques, achevé en 1989, a évalué la pertinence des technologies d'imagerie numérique et de disques optiques de données numériques pour les fonds des Archives nationales. Un autre programme a financé un projet de recherche de l'Institut national des normes et de la technologie (NIST) pour développer une méthodologie de test générique pour prédire l'espérance de vie des supports optiques WORM (Write Once Read Many). Cette étude du NIST a été achevée en 1990. Par la suite, un groupe international de normalisation sur la permanence de l'image s'est appuyé sur les résultats et les conclusions des travaux du NIST pour développer des normes d'espérance de vie pour les systèmes de stockage optiques sur disques de données numériques. Jusqu'à présent, ce groupe de normalisation a élaboré un projet de norme d'espérance de vie pour les supports CD-ROM et en élabore actuellement une similaire pour les disques optiques de données numériques réinscriptibles.

        Bien que le NIST ait développé et démontré une méthodologie de test générique réussie, elle n'est utile que comme indicateur général de l'espérance de vie des supports. Cela est dû au fait que des disques de données numériques optiques spécifiques peuvent tomber en panne à différentes périodes qui peuvent varier sur de nombreuses années. Même si cet indicateur est utile, peut-être en tant que guide général dans la sélection des supports, il ne peut pas indiquer quand recopier les données stockées sur un disque de données numériques optique particulier. Par conséquent, en 1990, la National Archives and Records Administration (NARA) a chargé le National Institute of Standards and Technology de traiter ce problème dans le cadre d'une étude plus large sur l'intégrité des données des supports optiques. Le personnel du programme NIST a organisé un groupe de travail qui a développé un ensemble de procédures pour surveiller et rapporter les résultats des codes de détection et de correction d'erreurs sur les lecteurs de disques optiques. Ces activités de détection et de correction d'erreurs sont exécutées automatiquement sans aucune action de la part des utilisateurs. Un problème existant est que la plupart des lecteurs de disques optiques ne fournissent pas de fonctionnalité pour surveiller et rapporter les résultats de la vérification des erreurs. Les résultats du groupe de travail NIST/industrie ont été utilisés comme base pour un projet de norme de l'Association for Information and Image Management (AIIM) qui stipule les techniques de surveillance et de rapport des erreurs de support pour la vérification des informations stockées sur des disques de données numériques optiques. Ce projet de norme AIIM est actuellement en cours de vote. L'étude d'intégrité des données du NIST comprend des recherches sur l'entretien et la manipulation des disques optiques de données numériques. Les résultats de ces expériences seront publiés dans un rapport du NIST attendu à l'automne 1994.

        Parallèlement, le personnel de recherche technologique de la NARA a lancé une étude sur l'utilisation des technologies d'imagerie numérique et des médias optiques dans les programmes d'archives publiques pour les gouvernements étatiques et locaux. Bien que l'impulsion de cette étude ait été une demande de l'Association nationale des administrateurs d'archives et de documents gouvernementaux (NAGARA), le plan de travail descriptif du projet indiquait qu'il s'agissait de la première étape d'un projet en deux étapes. Le projet aboutirait à un rapport sur la stratégie d'accès à l'information pour les agences fédérales. NARA et NAGARA ont publié le rapport de la première phase, l'étude des États et des gouvernements locaux, en décembre 1991. Peu de temps après, le personnel de recherche technologique de la NARA a commencé des recherches sur la deuxième phase et a produit ce rapport détaillant les stratégies d'accès à long terme pour les agences fédérales.

        En s'appuyant sur ce qui avait été appris dans le rapport des gouvernements étatiques et locaux, le personnel du projet a développé une méthodologie de recherche basée sur :

        • Un examen du marché de l'imagerie numérique et des disques de données numériques optiques et de la littérature technique (par exemple, des revues de l'industrie optique, des études spéciales et des rapports techniques) pour identifier les tendances émergentes,
        • Une évaluation des expériences des administrateurs de systèmes de l'industrie privée et des agences fédérales avec des projets d'imagerie numérique et de disques de données numériques optiques, et
        • Un examen sur site à l'échelle nationale de 15 applications d'imagerie numérique ou de disque optique de données numériques d'agence fédérale.

        L'objectif de cette analyse en trois parties était d'identifier les problèmes de gestion critiques et de les relier aux tendances techniques et aux expériences des utilisateurs. Ce rapport se compose d'un résumé, d'une liste de recommandations, d'un aperçu des défis liés à l'accès aux données à long terme, suivi de cinq sections qui décrivent la capture d'images numériques, les systèmes d'indexation, les systèmes optiques de stockage sur disque de données numériques, la recherche d'informations et politique de gestion de l'information. Chacune des cinq sections principales du rapport contient des problèmes de gestion, des tendances technologiques, des expériences utilisateur et des recommandations.

        La plupart des recommandations fournies dans ce rapport sont conformes à l'étude de l'État et des collectivités locales, bien qu'il y ait plusieurs écarts clairs. Généralement, ces départs tiennent compte d'une meilleure compréhension des enjeux et reflètent les évolutions des technologies de l'information numérique. Quatre annexes au rapport fournissent des descriptions détaillées des visites des agences, un résumé des normes techniques pertinentes, un glossaire des termes techniques et une bibliographie annotée. Pour aider les lecteurs de ce rapport, les auteurs ont choisi des caractères gras pour identifier les termes techniques qui sont ensuite définis dans l'annexe C, « Glossaire des termes ».

        Le personnel des Archives nationales chargé de préparer ce rapport sur les stratégies à long terme comprenait Charles Dollar, Barry Roginski, Peter Hirtle et Charles Obermeyer II. Barry Roginski avait la responsabilité principale de collecter les descriptions des visites des agences et d'organiser le rapport.

        Remerciements

        Le personnel de recherche technologique de la NARA aimerait profiter de cette occasion pour reconnaître l'aide spéciale fournie par les personnes et les agences fédérales dont les contributions ont rendu ce rapport possible. Les personnes suivantes ont généreusement participé à nos visites de sites et ont fourni une assistance éditoriale lors de la préparation des rapports de visites de sites :

        Tim Allard, Minerals Management Service Ray Buland, National Earthquake Information Center Ann Christy et Kristin Vajs, Library of Congress Malcolm Ewell, Social Security Administration James F. Gegen et Linda Brooks, Bureau of Land Management David Grooms, Patent and Trademark Office Sharon O. Jacobs, Agency for Toxic Substances and Disease Registry Rick Kanner, Federal Communications Commission Jacqui Lilly, Department of State Charles MacFarland, National Oceanic and Atmospheric Administration Gail Martin, Department of the Army Hunton G. Oliver, Commodity Futures Trading Commission Major Perkins, Department of l'armée Linda Worthington, US Army Corps of Engineers Charles Young, Environmental Protection Agency

        Des remerciements particuliers sont également dus aux personnes suivantes pour leurs contributions au cours des phases de collecte de données, d'analyse technique et de révision éditoriale de ce rapport :

        Robert M. Blatt, Groupe Telos Systems

        Eric Chaskes, Mary Donovan, Steven Puglia et Sandra Tilley, NARA

        Paul Conway, Université de Yale

        Marilyn Courtot, Littérature jeunesse

        Howard N. Greenhalgh et Eric E. Tolbert, Département de l'armée

        Richard Harrington, Bibliothèque d'État de Virginie

        Anne R. Kenney, Université Cornell

        Basil Manns, Bibliothèque du Congrès

        Lance W. Morgan, Science Applications International Corporation

        Fernando L. Podio, Institut national des normes et de la technologie

        William K. Saffady, Université d'État de New York à Albany

        Section 1 : Résumé exécutif

        La National Archives and Records Administration (NARA) a récemment terminé une étude sur les systèmes d'imagerie numérique et de stockage de données optiques numériques sur disque au sein du gouvernement fédéral. Ce rapport, préparé par le personnel de recherche technologique de la NARA, discute des conclusions de cette étude. Les principaux domaines identifiés sont les problèmes critiques de gestion de l'information, les tendances technologiques et les expériences utilisateur pertinentes. Les éléments de l'étude de recherche comprenaient l'analyse des développements technologiques des disques de données numériques optiques, l'examen de la littérature technique pertinente, l'évaluation des expériences de gestion de programmes des agences fédérales avec les systèmes de disques de données numériques optiques et des visites sur site de 15 projets de disques optiques des agences fédérales. Les annexes du rapport se composent de résumés descriptifs des visites de sites, d'une liste de normes techniques, d'un glossaire définissant les termes techniques et d'une bibliographie annotée.

        Les avantages potentiels des systèmes d'imagerie peuvent être mieux atteints lorsque le système de disque optique de données numériques prend en charge les besoins d'information de l'agence dans son ensemble et lorsque la technologie est utilisée pour améliorer le service - et pas simplement pour résoudre un problème unique et isolé. Les agents de gestion des documents des agences fédérales et les archivistes ont un intérêt vital pour les disques optiques de données numériques, mais ils doivent également être conscients des dangers de l'obsolescence technologique, des spécifications de performance des équipements incohérentes, des nouveaux produits incompatibles et du manque de normes techniques et administratives. Notez que le terme « valeur à long terme » (défini par les besoins de l'agence) n'est pas synonyme de « permanent », qui dénote une valeur historique et une conservation permanente par les Archives nationales. La politique actuelle des Archives nationales concernant les disques optiques de données numériques comme support de transfert d'informations de valeur permanente est décrite à la section 8, « Disposition des documents originaux ».

        Les directeurs de programme des agences fédérales responsables des documents ayant une valeur à long terme devraient trouver les recommandations de ce rapport utiles pour la conception et la mise en œuvre d'un système de disque optique de données numériques. Ce rapport n'est pas un aperçu complet de toutes les questions importantes concernant l'accès à long terme aux dossiers électroniques. Il est plutôt destiné à compléter les études techniques existantes et d'autres documents généralement disponibles concernant l'imagerie numérique et les technologies de disques de données numériques optiques. En particulier, ce rapport n'est pas destiné à fournir une analyse exhaustive des problèmes liés à l'indexation et à la récupération de bases de données, au développement de normes de disques optiques de données numériques ou à la technologie des disques compacts à mémoire morte (CD-ROM). Les disques compacts enregistrables (CD-R), par exemple, ont à la fois des normes formelles et de facto pour des facteurs tels que la structure des répertoires et le format physique et offrent une relative indépendance des données stockées par rapport aux mécanismes de récupération propriétaires. La rareté des systèmes CD-R observables au cours des 15 visites sur site a empêché une discussion approfondie des expériences des utilisateurs avec la technologie CD-R dans ce rapport.

        Les responsables des agences fédérales responsables de la sélection et de la gestion des systèmes de stockage optique doivent adopter comme objectif global le maintien de l'accès aux enregistrements de valeur à long terme stockés au format numérique. Pour atteindre cet objectif, ces fonctionnaires doivent :

        • Assurer la qualité des images numériques capturées grâce à un processus de conversion électronique,
        • Assurer la fonctionnalité continue des composants du système,
        • Surveiller et limiter la détérioration du stockage sur disque optique de données numériques, et
        • Anticiper et planifier les évolutions technologiques futures.

        L'utilisation à long terme des informations stockées numériquement, y compris les images de documents numérisés, les données numériques et les données d'index descriptifs, sera mieux assurée par la mise en œuvre d'une politique rationnelle de migration des données vers les générations technologiques futures, en respectant des formats d'en-tête de fichier image bien documentés, et surveiller la dégradation des médias. Les gestionnaires de système devraient créer l'infrastructure technique et administrative requise pour mettre en œuvre les normes de technologie de l'information pertinentes à mesure qu'elles sont élaborées.

        Assurer la qualité des images numériques signifie exercer un contrôle continu sur trois processus : conversion de l'image originale en données numériques amélioration de l'image numérique, si nécessaire et compression et/ou décompression des données numériques pour la transmission, le stockage et la récupération. Les inspections de contrôle de la qualité, soit au poste de travail du scanner de documents, soit en tant que tâche de suivi, doivent comparer les documents originaux aux images électroniques capturées et aux données d'index.

        S'assurer que les informations stockées sur des disques optiques de données numériques continueront de remplir la fonction pour laquelle elles étaient initialement destinées aussi longtemps qu'elles seront nécessaires :

        • Un engagement à long terme pour une architecture de systèmes ouverts et
        • Adoption d'une approche méthodique de la mise à niveau des composants du système et de la migration des données qui garantit l'interopérabilité des technologies actuelles avec celles à développer.

        Les administrateurs des agences fédérales peuvent utiliser des technologies de disque de données numériques optiques réinscriptibles ou à lecture unique (WORM) pour stocker des enregistrements de valeur à long terme. Les administrateurs qui utilisent des disques optiques de données numériques réinscriptibles doivent s'assurer que les privilèges de lecture/écriture sont méticuleusement contrôlés et qu'une piste d'audit des réécritures est maintenue. À moins qu'il n'existe des justifications spécifiques du programme, les administrateurs doivent sélectionner le format de stockage de disque de données numériques optiques de la taille la plus appropriée qui satisfasse les besoins du programme à long terme de l'agence tout en se conformant aux normes de l'industrie.

        La NARA reconnaît depuis longtemps les avantages potentiels de la technologie des disques optiques de données numériques pour le stockage et la récupération de grandes quantités d'informations. Il y a plusieurs années, en raison de l'état instable de la technologie des médias optiques et surtout de l'absence de normes, la NARA a publié un bulletin de politique des médias optiques. Ce bulletin informait les agences fédérales que la NARA ne pouvait pas accéder à des disques optiques de données numériques contenant des enregistrements de valeur permanente. Les enregistrements permanents stockés à l'origine sur des disques de données numériques optiques nécessitaient une conversion sur un support acceptable pour la NARA au moment du transfert sous la garde légale de la NARA. Un bulletin révisé répondant à ces préoccupations a été récemment publié par la NARA.

        La stabilité à long terme des disques de données numériques optiques nécessite la spécification d'une technologie de stockage/enregistrement fiable et une protection continue des supports contre les dommages et les abus dus à la manipulation et aux conditions environnementales défavorables. Bien que les disques optiques de données numériques semblent être plus durables et stables que le matériel et les logiciels requis pour maintenir l'accès, les affirmations des fournisseurs concernant la durabilité doivent être soigneusement examinées.Cet examen doit impliquer une évaluation des données de fabrication du disque de données numériques optiques, de la méthodologie et des procédures de test, et des résultats des tests basés sur les découvertes décrites dans le NIST SP-200. Cette évaluation doit prendre en charge une durée de conservation pré-écriture prévue de cinq ans et une espérance de vie post-écriture d'au moins vingt ans. Étant donné que les disques optiques de données numériques ne sont pas à l'abri des conditions de stockage hostiles, il est prudent de les stocker dans un environnement stable.

        A eux seuls, les systèmes d'imagerie numérique et de stockage de données numériques optiques sur disque ne peuvent pas résoudre les problèmes d'accès découlant des systèmes et pratiques d'information manuels ou informatisés existants inefficaces. En effet, l'automatisation de processus inefficaces peut simplement exacerber les lacunes existantes. Les administrateurs d'agence qui saisissent l'opportunité de réévaluer les procédures de fonctionnement du bureau lors de l'adoption de nouvelles technologies sont plus susceptibles de bénéficier d'une productivité administrative améliorée, de services aux utilisateurs améliorés et d'économies de coûts d'exploitation.

        L'accès à long terme aux enregistrements de valeur durable stockés sur des disques optiques de données numériques implique cependant plus que la qualité de l'image, la fonctionnalité du système et la stabilité du support. L'adoption du stockage numérique de l'information sur des disques optiques de données numériques lie effectivement l'agence à une évolution technologique qu'elle ne maîtrise pas. Les administrateurs doivent continuer à surveiller les tendances technologiques plan pour la maintenance systématique, la mise à niveau et la migration éventuelle vers des technologies plus récentes utiliser les normes existantes et émergentes soutenir le développement de normes d'échange de données et adopter des mesures prudentes de préservation des informations dans l'intervalle.

        Les administrateurs de l'agence, les responsables de la gestion de l'information, les analystes du développement de systèmes, les gestionnaires de documents et les historiens des agences doivent travailler ensemble pour développer et mettre en œuvre des politiques et des procédures régissant la gestion des documents des agences fédérales évalués comme permanents par la NARA.

        Section 2 : Liste des recommandations

        Cette section énumère les recommandations techniques et administratives importantes qui sont décrites plus en détail dans ce rapport. Pour faciliter la consultation des utilisateurs, l'organisation de base de cette section est conforme aux principales sections et sous-titres du reste de ce rapport.

        CAPTURE D'IMAGE NUMÉRIQUE

        Adoptez une architecture de systèmes ouverts pour les nouvelles applications de disques de données numériques optiques. ou alors

        Exiger un "pont" vers les systèmes avec des configurations non propriétaires.

        Configuration du système d'imagerie numérique

        Définissez clairement les besoins des utilisateurs et des agences lors de la phase d'analyse des besoins du projet d'imagerie.

        Vérifiez que le système d'imagerie a une flexibilité inhérente et a une conception ouverte, ou non propriétaire, qui accepte les futures mises à niveau matérielles et logicielles.

        Conversion des documents originaux

        Analysez le domaine des documents à numériser, identifiez les niveaux d'uniformité et envisagez l'utilisation d'un entrepreneur en conversion de documents lorsque les fonds d'archives sont importants.

        Mettre en œuvre un processus complet de comptabilité et de suivi des dossiers pendant la phase de conversion du projet.

        Investissez suffisamment de personnel ou de sous-traitants dans la préparation des documents pour augmenter la productivité de la numérisation.

        Le cas échéant, affectez le personnel expérimenté de l'agence aux processus de conversion qui bénéficient de leur connaissance des opérations existantes de l'agence.

        Avant l'acquisition du système, validez les déclarations des fournisseurs concernant les taux de traitement des documents, la qualité de l'image et la facilité d'utilisation à l'aide d'un échantillon représentatif des fonds de l'agence.

        Suivez les procédures de test standard décrites dans FIPS PUB 157 "Guideline for Quality Control of Image Scanners".

        Utilisez une résolution de numérisation d'au moins 300 ppp pour les documents bureautiques lorsque de futures applications (par exemple, OCR) pour les images numériques sont prévues.

        Spécifiez une résolution de numérisation plus élevée (entre 300 et 600 ppp ou plus) selon les besoins, pour les dessins techniques, les cartes et les documents contenant des informations détaillées sur les lignes fines et l'arrière-plan.

        Utilisez une technologie d'imagerie en niveaux de gris ou en couleur selon les besoins pour des images à tons continus appropriées telles que des photographies, des cartes et des enregistrements associés.

        Le cas échéant, utilisez la technologie d'image à échelle de gris de 8 bits par pixel pour capturer des photographies et/ou des négatifs en noir et blanc en tons continus, et le mode 24 bits pour obtenir un rendu des couleurs fidèles.

        Effectuez des tests de scanner à l'aide de documents sélectionnés pendant la phase de conception du système pour déterminer le besoin de modifications matérielles spéciales du scanner.

        Conservez les images numérisées non améliorées de documents de valeur intrinsèque.

        En-têtes de fichiers d'images numériques

        Utilisez des formats de fichiers qui favorisent/facilitent le transfert de données réseau, tels que Aldus/Microsoft TIFF version 5.0 qui répond à la définition standard de l'Internet Engineering Task Force pour l'échange d'images en noir et blanc sur Internet.

        Exiger l'utilisation d'une étiquette d'en-tête de fichier image non propriétaire. Ou Exiger un "pont" vers une étiquette d'en-tête de fichier image non propriétaire. Ou Exiger une définition détaillée de la structure d'étiquette d'en-tête de fichier image.

        Techniques de compression de données

        Utilisez un schéma de compression sans perte lorsqu'une fidélité continue à l'apparence exacte du document original est réalisable et souhaitée.

        Utilisez JPEG ou MPEG pour les images avec des qualités tonales continues lorsqu'une certaine perte de détails est acceptable.

        Pour les images numériques sans qualité tonale continue, exigez des techniques de compression standardisées, telles que CCITT Groupe 3, CCITT Groupe 4 ou JBIG.

        Si un système de compression propriétaire sans perte est utilisé, exigez que le fournisseur fournisse un moyen de décompresser les données dans leur format d'origine.

        Assurance qualité des images numériques

        Évaluez régulièrement les performances du scanner en fonction des procédures de contrôle qualité recommandées dans FIPS PUB 157 « Directive for Quality Control of Image Scanners ».

        Établir un consensus sur ce qui constitue la « meilleure » image pour les différents types de documents sources de l'agence surveiller la qualité d'image en cours à l'aide des écrans d'affichage et des imprimantes laser du système.

        Effectuez une évaluation de la qualité visuelle à 100 % de chaque image numérisée et les inspections de contrôle de la qualité des données d'indexation associées doivent être méticuleuses si les documents originaux ne sont pas conservés après la conversion.

        Vérifiez les informations telles que copiées lors du transfert d'images/données vers tout autre support à partir du disque dur magnétique d'origine ou du disque de données numériques optiques.

        Si les disques WORM sont le support de stockage de choix, n'écrivez définitivement les informations qu'après avoir effectué une inspection de contrôle qualité approfondie des images numérisées et des données d'indexation.

        SYSTÈMES D'INDEXATION

        Le cas échéant, assurez-vous que le logiciel de récupération d'informations est conforme à SQL.

        Quelle que soit la méthodologie de capture utilisée, effectuez une inspection de contrôle qualité à 100 % de toutes les données d'index.

        Stockez les données d'index magnétiquement pour des opérations améliorées et optiquement si la conservation à long terme est un problème.

        Indexation de la complexité de la base de données

        Les décisions relatives à la conception du système d'indexation et aux capacités doivent être fondées sur une analyse approfondie des opérations de l'agence et des besoins des utilisateurs.

        SYSTÈMES DE STOCKAGE SUR DISQUE DE DONNÉES NUMÉRIQUES OPTIQUES

        Technologies d'enregistrement optique sur disque de données numériques

        Des technologies WORM ou réinscriptibles peuvent être utilisées, la sélection réelle étant déterminée par les exigences d'application spécifiques de l'agence. Assurez-vous que les privilèges de lecture/écriture sont soigneusement contrôlés et qu'une piste d'audit des réécritures est maintenue lorsque la technologie réinscriptible est utilisée.

        Capacité de stockage de disque de données numériques optiques

        Sur la base d'une analyse des exigences et d'une étude de conception de systèmes des opérations d'une agence, sélectionnez le facteur de forme de stockage optique de la taille la plus appropriée qui satisfasse les besoins programmatiques à long terme de l'agence et se conforme aux normes de l'industrie.

        Lors de la sélection d'un juke-box à disques de données numériques optiques, tenez compte des facteurs suivants : les besoins généraux d'accès à l'information (personnel et public), les considérations budgétaires et d'approvisionnement, et les besoins en personnel d'exploitation existant.

        Détection et correction des erreurs

        Exiger que l'équipement soit conforme à la norme nationale proposée ANSI/AIIM MS59-199X, « Utilisation des techniques de surveillance et de rapport d'erreurs de support pour la vérification des informations stockées sur des disques de données numériques optiques ».

        Interface de petits systèmes informatiques

        Spécifiez la commande SCSI « Write and Verify » lors de l'écriture de données sur des disques de données numériques optiques.

        Exiger des fabricants de systèmes et des intégrateurs qu'ils fournissent une documentation complète sur la configuration spécifique du matériel et du logiciel SCSI (ou autre interface).

        Rétrocompatibilité des systèmes optiques

        Exiger des mises à niveau ou des systèmes de remplacement pour être rétrocompatibles avec les systèmes d'information existants.

        Convertissez les informations numériques existantes au nouveau format au moment de la mise à niveau ou de l'acquisition du système.

        Longévité des disques de données numériques optiques

        En plus d'effectuer une analyse minutieuse des méthodologies et procédures de test de la durée de vie des supports de chaque fabricant, il faut utiliser des disques de données numériques optiques avec une durée de conservation avant écriture d'au moins cinq ans.

        Exiger une durée de vie post-écriture minimale de vingt ans sur la base des tests d'espérance de vie des disques de données numériques optiques du fabricant conformes aux conclusions du NIST SP-200.

        Substrats de disques de données numériques optiques

        Des substrats de disques de données numériques optiques en polycarbonate ou en verre optique trempé sont acceptables.

        Environnements de stockage de disques de données numériques optiques

        Les disques optiques de données numériques doivent être stockés dans des zones avec des températures ambiantes stables et des plages d'humidité relative compatibles avec le stockage de supports de bande magnétique. Évitez les zones de stockage avec une humidité excessive et des températures élevées, et ne soumettez pas les disques optiques de données numériques à des températures extrêmes rapides.

        Si possible, n'utilisez pas les systèmes et ne stockez pas de disques optiques de données numériques dans des environnements contenant un excès de particules en suspension dans l'air.

        Les procédures de nettoyage des disques optiques de données numériques doivent être strictement conformes aux recommandations du fabricant du support.

        RÉCUPÉRATION DE L'INFORMATION

        Effectuer une analyse complète des besoins des utilisateurs finaux en matière d'accès à l'information et une étude de conception des systèmes avant d'acheter des composants de système d'imagerie.

        POLITIQUE DE GESTION DE L'INFORMATION

        Afin de maximiser la viabilité à long terme des systèmes, développer des applications d'imagerie numérique et de disque numérique optique de manière rentable.

        Dans la mesure du possible, lier la conception du système aux initiatives d'amélioration du gouvernement telles que l'examen national du rendement.

        Réexaminer les systèmes d'enregistrements papier existants avant la conversion en systèmes de disques de données numériques optiques afin de maximiser la productivité et d'améliorer la prestation des services d'information.

        Disposition des documents originaux

        Se conformer à la politique de la NARA concernant la disposition des enregistrements originaux lors de la conversion vers un système de disque optique de données numériques.

        Familiarisez-vous avec la façon dont les règles de preuve s'appliquent aux dossiers fédéraux et assurez-vous que les contrôles procéduraux qui protègent leur intégrité sont en place et respectés.

        Mettre en œuvre les recommandations fournies dans l'AIIM TR31, parties I et II, applicables aux projets d'agence utilisant des technologies d'imagerie numérique et de stockage optique de données numériques sur disque, soit dans la conversion de documents papier sous forme numérique, soit dans leur création initiale sous forme numérique.

        Élaborer un plan de migration des données et de reprise après sinistre à l'échelle de l'agence bien avant un tel événement pour le système d'imagerie numérique et de stockage de données optiques numériques sur disque.

        En cas d'apparition de signes avant-coureurs d'obsolescence imminente, les responsables doivent planifier immédiatement la migration de l'application vers un nouveau système.

        Exiger des fournisseurs qu'ils déposent une copie des codes du logiciel d'application du système informatique et de la documentation associée auprès d'une banque, d'archives ou d'un service d'enregistrement sécurisé en cas de défaillance de l'entreprise.

        Espérance de vie des supports/transfert de données et sauvegardes

        Recopiez les données stockées sur des disques de données numériques optiques sur la base des informations obtenues grâce à la vérification périodique de la dégradation des supports.

        Créez une copie de sauvegarde des informations stockées sur des disques de données numériques optiques à conserver dans une installation hors site, en utilisant le support de stockage approprié (optique, magnétique, papier ou microfilm) qui répond le mieux aux exigences de l'agence.

        Précisez que le fournisseur fournit un ensemble complet de documentation, y compris le code source avec des organigrammes, le code objet et les manuels d'exploitation et de maintenance en tant que livrable du contrat.

        Examiner et réviser périodiquement la documentation du système pour s'assurer que toutes les modifications et améliorations ultérieures du système sont décrites de manière adéquate.

        Mettre à niveau l'équipement au fur et à mesure que la technologie évolue et recopier périodiquement les disques de données numériques optiques au besoin. Ou Recopiez les disques optiques de données numériques sur la base d'une vérification périodique. Ou Transférer les données d'une génération presque obsolète de disques de données numériques optiques vers une nouvelle génération émergente, en contournant dans certains cas la génération intermédiaire qui est arrivée à maturité mais qui risque de devenir obsolète.

        Normes de technologie de l'information

        Surveiller régulièrement les tendances de l'environnement technologique conforme aux normes des systèmes ouverts.

        Spécifier les normes technologiques non propriétaires existantes et émergentes dans la conception du système. Dans la mesure du possible, les composants du système doivent être conformes aux pratiques non exclusives ou communément acceptées.

        Évaluer régulièrement la dégradation possible des données des informations stockées sur les disques de données numériques optiques et les fonctionnalités du système à l'aide des outils de surveillance et de rapport des erreurs de média décrits dans les normes proposées et en évolution telles que ANSI/AIIM MS59-199X.

        Soutenir le développement continu de normes non propriétaires pour l'échange de données et l'interopérabilité.

        Section 3 : Le défi de l'accès à long terme

        Les technologies d'imagerie numérique et de stockage de données numériques optiques sur disque sont disponibles sur le marché commercial depuis plus d'une décennie. L'imagerie numérique implique généralement la conversion de documents papier existants (par exemple, des formulaires, des rapports, des cartes, des dessins, de la correspondance), des photographies ou des microformes en une représentation électronique pour le stockage et la récupération informatisés. En raison des vastes capacités de stockage de données qu'ils offrent, les disques optiques de données numériques font souvent partie intégrante des systèmes d'imagerie numérique. Le lien entre l'imagerie numérique, qui génère des fichiers électroniques volumineux, et la capacité de stockage supérieure des disques optiques de données numériques a rendu les deux technologies de plus en plus attrayantes pour ceux qui recherchent une productivité améliorée du personnel et des services utilisateurs améliorés.

        Compte tenu des affirmations des fournisseurs sur la rentabilité des technologies d'imagerie numérique et de stockage optique, il n'est pas surprenant que l'intérêt pour ces deux technologies se multiplie. Des bulletins d'information, des revues et des périodiques relatifs à ces technologies décrivent régulièrement un nombre croissant d'applications d'imagerie numérique et de disques de données optiques numériques dans les services de santé, les banques, les compagnies d'assurance, les sociétés pharmaceutiques et les universités, pour n'en citer que quelques-unes. Deux facteurs sont à l'origine de l'utilisation des technologies de stockage de données numériques et optiques sur disque : la disponibilité d'une variété croissante d'appareils et la baisse des coûts. Par conséquent, il n'est pas surprenant que le nombre d'applications d'imagerie numérique et de disques de données numériques optiques planifiées ou réellement mises en œuvre à tous les niveaux de gouvernement (fédéral, étatique et local) continue de croître. Un examen récent des principales applications d'imagerie numérique et de supports optiques du gouvernement fédéral met en évidence l'énorme investissement financier consacré à ces deux technologies.

        De nombreux responsables de programmes d'agences fédérales considèrent les technologies d'imagerie numérique et de stockage de données optiques numériques comme des outils essentiels pour fournir des services améliorés et plus rentables. Cependant, il existe un autre groupe d'administrateurs gouvernementaux dont la principale préoccupation est l'impact de ces deux technologies sur la disposition des dossiers fédéraux. Les gestionnaires de documents, qui mettent en œuvre la disposition approuvée des documents fédéraux, et les archivistes, qui protègent et entretiennent des documents permanents de valeur, ont un intérêt vital dans la viabilité des systèmes d'imagerie numérique et de stockage de données numériques optiques sur disque. De nombreux gestionnaires de dossiers s'inquiètent de l'admissibilité légale des dossiers fédéraux devant un tribunal. Les gestionnaires de documents et les archivistes sont concernés par la longévité des supports de stockage et l'obsolescence des systèmes d'information.

        Ce rapport traite de ces problèmes ainsi que d'autres problèmes liés à l'administration des systèmes d'information sur disques optiques de données numériques. Le rapport identifie également les problèmes que les industries de l'imagerie numérique et des disques de données numériques optiques doivent aborder et résoudre si ces technologies doivent s'avérer viables pour les applications nécessitant un accès à long terme. À cet égard, on espère que les conseils fournis ici aideront à donner une impulsion aux fournisseurs et aux utilisateurs indispensables pour garantir que les considérations d'accès aux informations archivées sont prises en compte lors de l'analyse des exigences d'un système d'information, de la conception du système, du développement technique et des phases d'intégration.

        Aux fins du présent rapport, les systèmes de disques de données numériques optiques sont définis comme un amalgame de processus technologiques qui comprend, au minimum, l'imagerie numérique ou le stockage de données numériques sur des disques de données numériques optiques ou des supports optiques similaires. Basé sur un examen des problèmes de gestion centrale, des tendances techniques et des expériences des utilisateurs, le rapport couvre une gamme de sujets propres à ces technologies. Les tendances technologiques ont été identifiées grâce à des études de marché et à un examen minutieux des spécifications techniques, de la documentation sur les produits et des rapports analytiques publiés dans un large éventail de revues et de périodiques. Afin d'enrichir l'étude et de fournir un environnement approprié dans lequel « tester » des concepts et des idées clés, 15 applications de disque optique de données numériques du gouvernement fédéral ont été étudiées. Bien que ces 15 applications ne soient pas entièrement représentatives de tous les systèmes de stockage optique actuellement en service, elles fournissent des informations de base importantes pour visualiser la mise en œuvre des systèmes de stockage d'informations d'imagerie numérique et de disques de données optiques numériques au sein du gouvernement fédéral.

        Les responsables gouvernementaux chargés de sélectionner les systèmes d'imagerie numérique et de stockage de données optiques numériques sur disque doivent tenir compte de plusieurs facteurs critiques. Ils doivent, bien entendu, s'assurer que le système d'imagerie numérique et de stockage optique de données numériques sur disque qu'ils choisissent répond aux besoins immédiats de leur agence d'une manière rentable. Ils doivent également s'assurer que les enregistrements programmés comme permanents sont conservés dans leur format d'origine après la conversion ou sont convertis sur un support acceptable pour la NARA au moment du transfert aux Archives nationales.

        La décision d'acquérir ou de construire un système d'enregistrement d'images utilisant des disques optiques de données numériques avec des capacités système spécifiques doit être basée sur une analyse approfondie des besoins immédiats et à long terme de l'agence en matière de traitement de l'information. Dans le même temps, l'adoption des disques d'images numériques et de données numériques optiques n'est pas sans risques, en raison des nombreux défis résultant d'une évolution technologique rapide. Par exemple:

        • De nouveaux produits de stockage optique, souvent incompatibles les uns avec les autres, font constamment leur apparition
        • La rareté des normes techniques et administratives limite l'élaboration de critères objectifs de sélection des équipements
        • L'adoption rapide de la technologie optique par les agences gouvernementales augmente la pression pour agir
        • Une prolifération de fournisseurs aux niveaux national et local, avec des revendications concurrentes, peut compliquer la définition des spécifications de performance et
        • La longévité (durée de vie sur le marché) des produits de technologie d'imagerie numérique et de la communauté des fournisseurs fournissant des systèmes et des services techniques est volatile.

        Bien entendu, ces « écueils » sont les manifestations d'un problème plus répandu d'obsolescence technologique. Trop souvent, les implications de ces aléas sur l'accès à long terme, liées à la responsabilité de l'agence pour ses programmes, ne sont pas suffisamment prises en compte. L'accès à long terme ou la facilité d'utilisation des données d'images numériques ou de caractères doit être considéré distinctement du support sur lequel les informations sont stockées. Cette distinction permet un engagement continu envers l'information au format numérisé, tout en reconnaissant simultanément que les supports qui stockent ces données doivent éventuellement être remplacés en raison d'une obsolescence inévitable.

        Il ne suffit pas de s'engager à maintenir l'utilisabilité à long terme de l'information numérisée, par opposition aux médias eux-mêmes. Le maintien de cet engagement à long terme à utiliser les informations stockées numériquement nécessite également :

        La lisibilité des données fait référence à la capacité de traiter les informations sur un système informatique ou un appareil autre que celui qui a initialement créé les informations numériques ou sur lequel elles sont actuellement stockées. En règle générale, la non-lisibilité implique un aspect d'un ancien périphérique de stockage (une bande ou un disque) qui le rend physiquement incompatible avec l'équipement existant. Cette "obsolescence matérielle" se produit lorsque les périphériques et supports de stockage utilisés aujourd'hui deviennent incompatibles avec ceux qui seront développés à l'avenir. Par exemple, les bandes de stockage magnétique de 556 bits par pouce (bpi) couramment utilisées dans les années 1960 ne peuvent pas être lues par les lecteurs de bande actuels. Bien entendu, tant qu'une bande magnétique ou un lecteur de disque dur continue de fonctionner correctement et que des pièces de rechange sont disponibles, sa durée de vie peut être prolongée pendant un certain temps. De même, la durée de vie des disques optiques de données numériques peut être prolongée grâce à des pratiques de stockage et de maintenance appropriées.

        La récupérabilité des données, qui suppose la lisibilité telle qu'elle vient d'être définie, signifie que des enregistrements ou des parties d'enregistrements identifiables peuvent être sélectionnés et consultés. Une récupération précise nécessite des clés, ou des pointeurs, qui relient la structure logique des enregistrements (c'est-à-dire les champs de données, les chaînes de texte, les répertoires et les index) aux emplacements de stockage physique des données sur un disque. La structure logique du disque optique de données numériques peut avoir peu de relations avec le support et le format impliqués. Généralement, ces informations de liaison se trouvent dans un en-tête ou une étiquette de fichier. L'étiquette peut inclure des informations nécessaires pour localiser le début d'un fichier, pour indiquer le nombre d'octets que chaque enregistrement contient et où ces octets sont physiquement situés, et pour distinguer les diverses unités d'information des champs qui forment les enregistrements. En règle générale, l'interprétation de la structure logique de l'enregistrement est fonction du système d'exploitation de l'ordinateur (par exemple, MS-DOS). Garantir la récupération à long terme des enregistrements nécessite la fonctionnalité continue des systèmes d'exploitation ou des pilotes de périphérique d'origine, car ceux-ci sont également susceptibles de devenir obsolètes avec suffisamment de temps.

        L'intelligibilité des données signifie que les informations qu'un ordinateur récupère sont compréhensibles pour un autre système informatique ou un spectateur humain. L'intelligibilité peut se produire à trois niveaux. À son niveau le plus simple, l'intelligibilité se produit lorsque deux systèmes informatiques utilisent ou comprennent la même représentation numérique de l'information, et cette représentation est traduite sous une forme que les humains reconnaissent et comprennent. Un excellent exemple de forme compréhensible est un fichier texte American Standard Code for Information Interchange (ASCII). Le deuxième niveau se produit lorsque deux systèmes informatiques peuvent utiliser ou comprendre la même représentation de l'information (par exemple, ASCII), mais lorsque la représentation est présentée aux utilisateurs, elle ne contient pas suffisamment d'informations (par exemple, elle n'est pas autoréférentielle) pour un humain à comprendre. Habituellement, ce problème est associé à la fois aux données codées et numériques, et l'intelligibilité de ces informations ne peut être assurée que par une documentation définissant les valeurs représentées par les nombres et les codes. Le troisième niveau se produit lorsque deux applications logicielles différentes, fonctionnant dans des environnements informatiques différents, peuvent traiter les mêmes données numériques et obtenir des résultats identiques. Un exemple de ceci est un document texte intégré dans un système de traitement de texte qui peut être traité par un système de traitement de texte totalement différent sans perte d'informations ou de détails de mise en page tels que les polices de caractères et l'interligne. Ce manque d'intelligibilité devient particulièrement évident lorsqu'un schéma de cryptage propriétaire est rencontré ou lorsque des images numériques sont compressées sur la base d'une technique propriétaire.

        Des facteurs tels que les étiquettes d'en-tête de fichier propriétaires, les techniques de compression de données et l'obsolescence des logiciels sont des obstacles majeurs à l'obtention de l'intelligibilité au fil du temps. Les normes non exclusives peuvent commencer à traiter et à résoudre certaines de ces préoccupations. Malgré l'absence de normes de technologie de l'information dans certains domaines qui pourraient aider à assurer l'accessibilité des documents à long terme, les gestionnaires de système devraient créer l'infrastructure technique et administrative requise pour mettre en œuvre les normes de technologie de l'information pertinentes à mesure qu'elles sont élaborées.

        Une couche supplémentaire de complexité peut survenir avec la façon dont certains systèmes de stockage et de récupération de disques optiques de données numériques écrivent des informations de pointeur d'index. En outre, le logiciel de recherche et de récupération associé à un système d'application particulier nécessite généralement une plate-forme de système d'exploitation spécifique, telle que MS-DOS. Typiquement, une application logicielle de récupération ajoutera d'autres pointeurs à la structure logique des enregistrements. La récupérabilité de ces enregistrements est donc inextricablement liée à l'application logicielle. À moins que des chemins de migration de données intégrés ne soient établis ou que de nouvelles générations de logiciels soient installées et offrent une rétrocompatibilité, l'accès aux enregistrements sera impossible.

        L'accès à long terme aux informations stockées numériquement, y compris les images de documents numérisés et les données d'index descriptifs, peut être assuré grâce à la migration vers les générations technologiques futures. Afin de rendre cette migration possible, les applications doivent suivre certaines pratiques dans la capture d'image numérique initiale et son stockage sur des systèmes de stockage de disques optiques de données numériques. De plus, les systèmes d'indexation et de récupération en place doivent encore être utiles dans les nouveaux environnements technologiques. La mise en place d'une stratégie claire de migration des données doit être établie, et une politique de gestion de l'information avec des procédures administratives complètes pour les données et leur migration est également nécessaire. Ce rapport aborde chacun de ces domaines critiques à tour de rôle.

        En particulier, on espère que les conclusions du rapport aideront les gestionnaires de programme, les archivistes et les gestionnaires de documents à maintenir l'utilisabilité à long terme des informations stockées numériquement, y compris les documents numérisés et les images microformes, les fichiers de données électroniques et les bases de données d'index de caractères qui les accompagnent. La probabilité de lisibilité, de récupérabilité et d'intelligibilité à long terme sera augmentée si les programmes :

        • Assurer la qualité des images numériques capturées grâce à un processus de conversion électronique,
        • Assurer la fonctionnalité continue des composants matériels et logiciels du système au fil du temps,
        • Surveiller toute dégradation potentielle des données des disques de données numériques optiques, et
        • Anticiper les évolutions technologiques et planifier en conséquence.

        Ce rapport suppose que les agences fédérales ont décidé de mettre en œuvre une application de disque optique de données numériques après avoir approuvé les processus d'analyse des exigences, de conception de système et d'étude coûts-avantages et conformément aux réglementations de la NARA concernant la planification des enregistrements et le transfert des enregistrements permanents aux Archives nationales ( voir la section 8, « Disposition des documents originaux »). D'autres sources d'information facilement disponibles, dont certaines sont énumérées dans la bibliographie, examinent et révisent les approches du processus de prise de décision technologique. Ce rapport ne traite pas des compétences informatiques et de l'expertise technique requises du personnel de l'agence qui met en œuvre et exploite une application de disque optique de données numériques.

        Les Archives nationales reconnaissent les avantages potentiels de la technologie des disques optiques de données numériques pour le stockage et la récupération de grandes quantités d'informations numériques. Il y a plusieurs années, en raison de plusieurs facteurs, notamment l'état instable et en évolution rapide du marché de la technologie des médias optiques et l'absence de normes industrielles formellement adoptées, les Archives nationales ont informé les agences fédérales que les disques de données numériques optiques contenant des enregistrements de valeur permanente ne pouvaient pas être adhéré. Aux termes de cette notification, les enregistrements permanents stockés sur des disques de données numériques optiques doivent être convertis sur un support acceptable pour la NARA au moment du transfert sous la garde légale de la NARA. Les enregistrements non programmés convertis sur un support optique doivent être conservés dans leur format d'origine en attendant la programmation ou, s'ils sont ultérieurement déterminés comme étant permanents, doivent être convertis sur un support acceptable pour la NARA au moment du transfert. Les archives des agences fédérales ne peuvent être détruites sans l'autorisation de l'archiviste des États-Unis.

        La NARA continue de surveiller l'évolution de la technologie des disques optiques de données numériques et a récemment publié des bulletins d'orientation décrivant l'accession à des disques optiques de données numériques. Les administrateurs des agences fédérales sont encouragés à informer les Archives nationales des applications importantes pour la mise en œuvre de la technologie des disques optiques de données numériques.

        Les recommandations citées dans ce rapport sur les stratégies ne visent pas à établir des normes pour le développement de systèmes ou à déterminer l'achat de systèmes d'application de disques optiques de données numériques, et ne doivent pas non plus être considérées comme des normes d'archivage de facto. Elles sont plutôt présentées comme des conclusions raisonnées que des gestionnaires prudents de programmes impliquant des enregistrements de valeur à long terme peuvent trouver utiles dans la conception et la mise en œuvre de systèmes de stockage d'informations sur disques de données numériques optiques.

        Section 4 : Capture d'images numériques

        La transformation de documents papier en images électroniques stockées numériquement offre aux agences fédérales plusieurs avantages immédiats, notamment des coûts de traitement des enregistrements considérablement réduits, une efficacité opérationnelle améliorée et une efficacité accrue du traitement de l'information sur le lieu de travail. Étant donné que les documents sources originaux peuvent se détériorer (ou même disparaître) lorsqu'ils sont utilisés comme référence, dans de nombreux cas, il est prudent de les convertir sous une autre forme ou un autre support qui peut fournir une utilité égale ou supérieure sans endommager les originaux. Historiquement, la micrographie a été de loin le support le plus populaire sur lequel transférer des copies de référence de documents originaux. La technologie d'imagerie numérique a démontré sa capacité à convertir et à stocker des images électroniques de documents sur des disques optiques de données numériques et à récupérer automatiquement les informations sur un écran d'affichage ou une imprimante pour référence. La majorité des 15 agences fédérales visitées pour ce rapport utilisent la technologie d'imagerie numérique pour numériser les documents. La popularité de l'imagerie numérique est compréhensible, compte tenu du volume considérable d'informations des agences fédérales qui existent déjà sous forme papier. Les systèmes traditionnels de stockage et de récupération d'enregistrements sur papier sont souvent des processus laborieux et chronophages. Alternativement, une conversion numérique des documents du gouvernement fédéral implique des problèmes complexes tels que la conversion des fonds, les schémas d'en-tête de fichier, la compression des données et le contrôle de la qualité.

        Problèmes de gestion

        Un problème fondamental auquel sont confrontés les administrateurs d'agence est le compromis entre les coûts d'intégration des systèmes d'imagerie numérique et les avantages qui en découlent pour les utilisateurs du système. Les projets d'imagerie numérique à grande échelle nécessitent un engagement continu de l'agence envers un équipement hautement spécialisé, un personnel axé sur la technologie et des installations de conversion convenablement équipées. Les éléments de coût importants du projet de conversion peuvent inclure l'identification et la préparation des documents à convertir, la capture d'images, l'indexation, les inspections de qualité et le réarchivage des enregistrements. Une indexation sophistiquée au niveau de l'image-élément nécessite un investissement considérable en ressources humaines. L'imagerie offre de nombreux avantages potentiels aux utilisateurs, notamment un accès simultané multiple aux images, des récupérations rapides et précises, une communication économique des données d'image sur de grandes distances, un affichage d'images haute résolution sur un terminal de bureau et une sortie imprimée au laser.

        Une alternative de conversion possible est l'utilisation d'un bureau de service d'imagerie pour une conversion unique de fichiers antérieurs. Cette approche élimine le besoin d'établir une capacité interne d'équipement et de personnel d'exploitation pour un effort ponctuel. Étant donné que le personnel de l'agence fédérale possède une meilleure connaissance pratique des archives de l'agence, il fonctionne plus efficacement en tant que personnel de préparation des documents, inspecteurs du contrôle de la qualité ou contrôleurs des performances de l'entrepreneur. Dans ces circonstances, le personnel de l'entrepreneur est souvent affecté aux tâches plus répétitives de numérisation et de saisie de données. Les contrats de conversion sont facilités lorsque l'univers des documents est relativement statique, comme un ensemble d'actes fonciers historiques existants, et lorsque la conversion est effectuée en interne ou sur un site de conservation d'archives préétabli. Le contrôle de l'agence sur le site de conversion offre plusieurs avantages, notamment la réduction des coûts de transport des documents, l'amélioration de la sécurité des documents et la simplification du suivi des dossiers administratifs.

        Des coûts supplémentaires peuvent être encourus lorsque vous essayez d'augmenter la qualité technique de l'image à chaque étape du processus de conversion. Plusieurs approches pour améliorer la qualité d'image sont disponibles, selon les caractéristiques des documents originaux. Par exemple, la sélection d'une résolution de numérisation plus élevée améliore souvent la netteté de l'image. Alternativement, la spécification d'une résolution de numérisation inférieure combinée à une échelle de gris calculée peut également améliorer l'apparence de l'image. Ces avantages peuvent être compensés par des tailles de fichiers d'images numériques plus grandes et, très probablement, par des temps d'attente légèrement plus longs lors de la récupération d'images. Des images de meilleure qualité sont plus susceptibles d'avoir une valeur accrue à l'avenir, prolongeant la durée de vie effective des fichiers numériques et reportant le besoin de renumériser (en supposant que les documents originaux soient conservés). S'assurer que la meilleure représentation possible de chaque document original est capturée et préservée peut augmenter le niveau de confiance de la direction de l'agence dans le système d'imagerie.

        Actuellement, il n'y a pas d'indicateurs empiriques objectifs de qualité d'image acceptable pour les images numérisées. L'Association for Information and Image Management (AIIM) soutient les travaux visant à développer des approches indépendantes du document source pour évaluer la qualité des images capturées lors des conversions de documents. Une approche possible consiste à classer les documents en fonction des types de problèmes de numérisation perçus. Un comité d'examen impartial d'une agence pourrait comparer les documents originaux aux images numériques numérisées et parvenir à un consensus sur la capture de la « meilleure » image pour chaque catégorie de documents. Quelle que soit la norme de qualité choisie, le respect des procédures d'assurance qualité est une responsabilité de la direction. Cet élément critique ne doit pas être laissé à la seule discrétion du personnel des opérations de reconversion.

        Plusieurs problèmes doivent être résolus pendant les phases de planification et de budgétisation du système du programme : les exigences de maintenance des coûts initiaux du système et les demandes imprévues imposées au système en raison d'une utilisation créative. Les coûts initiaux du système incluent des facteurs tels que la capacité du système, les exigences de performances et les configurations logicielles d'équipement et d'applications. Les exigences de maintenance incluent la conformité avec les révisions du système, les mises à jour et les remplacements de composants nécessaires au fonctionnement continu du système. Dans le cadre de la maintenance du système, des repères spécifiques au système doivent également être établis et révisés en permanence pour s'assurer que le système installé répond aux exigences de l'agence. Enfin, une utilisation créative imprévue du système augmentera les demandes de services de référence supplémentaires pour les utilisateurs. Ces demandes supplémentaires nécessiteront du personnel hautement qualifié d'agence ou de fournisseur pour effectuer des services tels que l'intégration de composants système supplémentaires, la mise à niveau du système de gestion de base de données (SGBD) et l'amélioration des performances du réseau de communication de données du système d'imagerie.

        Systeme d'intégration

        La phase de développement du système d'un projet d'imagerie numérique ou de disque de données numériques optiques comprend généralement l'identification, la collecte et l'organisation des matériaux de l'agence fédérale à traiter. Les données d'images stockées sur des disques optiques de données numériques sont fréquemment créées par une conversion rétrospective de toutes les informations existantes dans les fichiers d'une agence ou, à l'inverse, par l'adoption d'un concept de conversion « aujourd'hui », dans lequel seuls les enregistrements les plus récents ou actifs sont convertis. De plus, il existe des applications système orientées vers les dossiers des agences fédérales qui n'ont jamais existé à l'origine au format papier et ne nécessitent pas de conversion de numérisation de documents.

        Une image raster numérisée numériquement est essentiellement une "photographie" électronique d'un document, divisée en une "grille" composée de milliers d'éléments d'image minuscules, ou pixels. La valeur de luminosité pour chaque pixel est convertie en une représentation numérique. Contrairement aux données alphanumériques, les images matricielles sont constituées de 1 et de 0 binaires qui en eux-mêmes ne contiennent aucune intelligence et ne peuvent donc pas être interrogés sur les informations que l'image représente. C'est pour cette raison qu'une indexation complète et précise des images numériques est obligatoire pour un accès efficace à la récupération par l'utilisateur. Des images numériques électroniques correctement indexées peuvent être affichées sur des écrans d'affichage à haute résolution, transmises à des sites d'utilisateurs distants ou distribuées sous forme de copie papier.

        Le marché de l'imagerie numérique et du stockage de données numériques optiques sur disque continuera à introduire de nouveaux produits qui varient en termes de configuration, de capacité et de coût. Ce processus reflète la diversité des besoins d'accès à l'information des utilisateurs. Les projets pionniers d'imagerie numérique étaient souvent des programmes pilotes de recherche ou des opérations autonomes sans lien direct avec les systèmes d'information existants. Ce concept subit un changement fondamental, car les administrateurs d'agence d'aujourd'hui et les utilisateurs finaux sont de plus en plus sophistiqués sur le plan technique et attendent des résultats tangibles. En réponse, les systèmes d'imagerie numérique et de stockage de données numériques optiques sur disque assument de plus en plus des rôles plus importants dans les agences, servant de catalyseurs pour les changements organisationnels.

        La direction des agences fédérales doit reconnaître l'impact potentiel que la technologie d'imagerie peut imposer sur les processus de flux de travail, y compris la conception et l'administration des formulaires de l'agence, la gestion et la supervision du personnel, la gestion des documents et des dossiers et les relations agence-patron. L'introduction d'un système d'imagerie sur le lieu de travail ne fournira pas nécessairement en soi une solution immédiate aux lacunes opérationnelles inhérentes, à moins que des efforts importants ne soient consacrés au contrôle et à l'indexation des documents. Les avantages maximaux sont obtenus lorsque les processus de flux de travail et les procédures opérationnelles existants sont adaptés à la nouvelle technologie.

        Les 15 systèmes d'agences fédérales visités pour ce rapport ont été intégrés à l'aide de l'une des différentes approches, et de nombreux systèmes utilisent des composants obtenus auprès de divers fabricants d'équipements, plutôt que de s'appuyer sur une seule source de produits. Environ un tiers des systèmes, y compris le système de gestion des dossiers électroniques du personnel (PERMS) du Département de l'armée de terre et les projets d'imagerie du Bureau of Land Management, ont été obtenus auprès d'un grand intégrateur ou fournisseur d'entreprise.Un autre tiers, y compris les projets du Minerals Management Service et de la Commodity Futures Trading Commission, a été obtenu auprès de fournisseurs un peu plus petits et plus localisés responsables de la conception et de l'assemblage des composants obtenus auprès de divers fabricants. Le dernier tiers des systèmes, y compris les systèmes d'imagerie de l'Office des brevets et des marques et le programme d'imagerie de l'Agence pour le registre des substances toxiques et des maladies, ont été conçus, développés et intégrés grâce à un effort de collaboration entre le personnel de l'entreprise d'intégration et le gouvernement fédéral. personnel de l'agence.

        Architecture des systèmes ouverts

        Les systèmes d'imagerie numérique dotés de composants matériels et logiciels propriétaires peuvent avoir une capacité limitée à accepter des composants fournis par d'autres fabricants. Alors que le marché de la technologie d'imagerie continue d'évoluer, l'accent est mis de plus en plus sur les systèmes « ouverts » qui intègrent un environnement multifournisseur. L'architecture des systèmes ouverts est définie aux fins de ce rapport comme une conception de systèmes qui :

        • Permet les mises à niveau des composants avec une dégradation négligeable des fonctions du système
        • Permet au système d'être mis à niveau au fil du temps sans risque important de perte d'informations
        • Prend en charge l'importation et l'exportation de données numériques.

        L'accent de la communauté des utilisateurs et de l'industrie de l'imagerie numérique se déplace vers des architectures système avec une flexibilité inhérente de fonctionnement et de configuration. Un environnement de systèmes ouverts prend en charge l'intégration de composants système standardisés, tout en répondant aux besoins uniques des utilisateurs. L'un des facteurs clés pour parvenir à de véritables systèmes ouverts est le développement, l'acceptation et l'adoption généralisée de normes non propriétaires.

        La majorité des 15 sites des agences fédérales visités ont des composants ou des processus exclusifs. Ces éléments comprennent des en-têtes de fichiers uniques, des processus de compression d'images et de transmission de données, des composants matériels, des logiciels d'application et la configuration globale du système d'exploitation. Les administrateurs de systèmes des agences fédérales sont conscients de la nécessité d'évoluer vers des systèmes ouverts et prennent des mesures positives dans cette direction. De nombreux administrateurs système interrogés ont noté que bien que leurs systèmes existants contiennent des composants propriétaires, les objectifs à long terme de l'agence sont d'évoluer éventuellement vers un concept de système ouvert. Ces plans impliquent l'adoption de normes à l'échelle de l'industrie et l'intégration de matériel et de logiciels de systèmes d'exploitation prêts à l'emploi. Les administrateurs de l'Agence ont noté que ces mesures devraient accroître l'interopérabilité du système de stockage de données optiques numériques sur disque. C'est-à-dire qu'ils s'attendent à des avantages immédiats de l'amélioration du partage des données et des liens de communication avec d'autres systèmes d'information à la fois à l'intérieur et à l'extérieur de l'application immédiate de l'agence, tout en reconnaissant que dans certains cas, un remplacement total du système peut être nécessaire.

        Adoptez une architecture de systèmes ouverts pour les nouvelles applications de disques de données numériques optiques. Ou alors

        Exiger un "pont" vers les systèmes avec des configurations non propriétaires.

        Configuration du système d'imagerie numérique

        La sélection du système d'image ne doit être tentée qu'après avoir effectué une analyse détaillée des besoins d'information existants et prévus de l'agence. Selon la quantité d'enregistrements et les exigences d'accès des utilisateurs, l'installation d'un système d'imagerie standard est l'approche la moins compliquée et la moins coûteuse. Les systèmes d'imagerie clé en main offrent des capacités génériques, acceptant des améliorations matérielles et logicielles mineures pour mieux répondre aux besoins uniques de l'utilisateur. Si les composants propriétaires empêchent la possibilité d'accepter la reconfiguration des composants pour répondre aux exigences organisationnelles, les agences peuvent avoir besoin d'acquérir des systèmes spécialement conçus. Dans l'idéal, une agence adopterait une approche systémique globale de la gestion des documents qui fournit des solutions pratiques pour prendre en charge les applications de traitement de l'information de l'agence.

        Un système de capture d'images permet à la technologie d'imagerie numérique d'adopter de nombreuses configurations différentes si ce système possède les composants matériels de base suivants :

        • Scanner de documents/équipement de capture d'images numériques
        • Moniteur d'affichage haute résolution,
        • Plate-forme système d'ordinateur personnel (PC),
        • Périphériques de stockage de fichiers temporaires, et
        • Imprimante laser.

        Selon les exigences de l'agence, la configuration finale du système peut inclure des composants facultatifs tels que des serveurs de fichiers, des postes de travail d'indexation et d'inspection de la qualité d'image, des scanners de documents à grande vitesse, des scanners de microformes et des réseaux locaux (LAN). La figure 1 illustre les éléments de base d'un sous-système de capture d'images numériques.

        Figure 1 Sous-système de capture d'images numériques

        Un logiciel informatique relie les modules du système, tout en conservant la flexibilité nécessaire pour répondre aux besoins uniques des utilisateurs. Les systèmes d'imagerie numérique mis en œuvre au début de la courbe de croissance de la technologie nécessitaient souvent un développement logiciel étendu et unique qui entraînait des configurations incompatibles. Les efforts pour modifier ou mettre à niveau des systèmes spécialisés étaient difficiles et longs, nécessitant fréquemment l'assistance de l'équipe d'ingénierie logicielle d'origine du fournisseur. Cette situation s'est améliorée au fil du temps à mesure que de plus en plus d'applications logicielles ont été développées pour les domaines suivants :

        Communications de données : le logiciel de Communication facilite le mouvement des données au sein du matériel du système, entre les systèmes liés sur un réseau local et entre les canaux reliant des systèmes séparés géographiquement, voire dans le monde entier.

        Gestion de base de données : les logiciels d'indexation et de base de données constituent la base de la récupération en contrôlant la nature et la structure des informations enregistrées sur chaque image ou groupe d'images, en organisant ces informations de manière significative pour l'utilisateur, en liant les images aux documents et fichiers et en permettant à l'utilisateur pour identifier et afficher des images à la demande.

        Amélioration de l'image : un logiciel d'amélioration de l'image permet de manipuler les caractéristiques de l'image pour améliorer la lisibilité, nettoyer les images et réduire la taille des fichiers.

        Gestion du système d'affichage : le logiciel d'affichage d'images de la station de travail permet de contrôler l'image pour le zoom, la rotation, le défilement et plusieurs formats d'écran d'affichage d'images.

        Gestion du flux de travail : le logiciel de flux de travail du système contrôle toutes les phases de la capture, du suivi, du routage, de l'indexation, de la récupération et de l'impression des images de documents.

        Reconnaissance optique de caractères : un logiciel de reconnaissance optique de caractères peut interpréter et convertir des données d'images matricielles en données textuelles manipulables par machine.

        Plusieurs similitudes significatives ont été notées dans les 15 systèmes d'imagerie des agences fédérales visités, bien que les applications aient considérablement varié. Par exemple, plus de la moitié des agences utilisent des scanners de type bureau pour convertir les documents papier, tandis qu'environ un tiers des sites ont adopté des scanners de documents à grande vitesse pour traiter plus efficacement un plus grand volume quotidien de documents. La plupart des systèmes visités utilisent des plates-formes PC, des serveurs de fichiers et des communications de réseau local. Près de la moitié des systèmes étudiés étaient connectés (ou partageaient des informations d'index avec) les systèmes centraux ou mini-ordinateurs existants de l'agence, et les connexions aux ordinateurs centraux pour d'autres sont en cours de planification et de développement.

        La majorité des systèmes d'imagerie numérique visités utilisent des postes de travail équipés de moniteurs d'affichage à haute résolution. Les autres sites stockent des données alphanumériques ou graphiques électroniques, où l'affichage d'images numériques à haute résolution n'est pas une exigence. Plusieurs systèmes ont intégré des scanners de microformes ou des dispositifs de sortie de film, et d'autres ont testé ou utilisent des technologies de reconnaissance optique de caractères. La plupart des systèmes visités ont installé un juke-box de disques de données numériques optiques pour le stockage et la récupération automatisés, et utilisent également des imprimantes laser pour la distribution de copies papier.

        À des degrés divers, de nombreuses agences visitées ont modifié ou envisagent de mettre à niveau leurs systèmes d'imagerie dans des domaines tels que des scanners de documents plus performants, une mémoire accrue dans les postes de travail, des serveurs de fichiers plus puissants, de nouveaux écrans de poste de travail et différents lecteurs ou supports de disque optique. Les administrateurs de l'agence ont noté que les architectures de système de type ouvert se prêtent mieux aux changements de configuration, car les composants matériels ou logiciels propriétaires sont plus difficiles à mettre à niveau lorsqu'ils répondent à des demandes supplémentaires inattendues des utilisateurs.

        Définissez clairement les besoins des utilisateurs et des agences lors de la phase d'analyse des besoins du projet d'imagerie.

        Vérifiez que le système d'imagerie a une flexibilité inhérente et a une conception ouverte, ou non propriétaire, qui accepte les futures mises à niveau matérielles et logicielles.

        Conversion des documents originaux

        La conversion rétrospective d'enregistrements papier en images numériques nécessite l'intégration d'installations de production spécialement configurées, d'équipements de conversion et d'un personnel d'exploitation soucieux de la technologie. Il n'est pas rare que les agences fédérales limitent les conversions d'enregistrements à un concept « aujourd'hui en avant », en ne convertissant que les enregistrements les plus récents et les plus fréquemment consultés. Ce concept est particulièrement attrayant lorsque des documents plus anciens et moins demandés constituent un segment important des fonds d'une organisation.

        Les systèmes d'imagerie convertissent les informations en images électroniques qui peuvent être indexées et recherchées, acheminées vers les postes de travail des utilisateurs, et distribuées et imprimées à distance. Les principales étapes de traitement des entrées comprennent :

        • Conversion d'enregistrements originaux (papier, microformes, données analogiques) vers un format numérique,
        • Améliorer électroniquement les images difficiles à lire pour améliorer la lisibilité,
        • Ajout d'un en-tête de fichier et compression des images numériques pour réduire les exigences de transmission et de stockage des données,
        • Indexation des images à des niveaux appropriés,
        • Effectuer des inspections de contrôle de la qualité des données d'index et d'images et numériser à nouveau les documents au besoin, et
        • Enregistrement des informations numériques sur un support de stockage approprié.

        Un processus complet de suivi et de comptabilité des enregistrements est nécessaire pour tous les efforts de conversion afin de s'assurer que tous les enregistrements désignés pour la conversion ont bien été convertis et pour surveiller exactement ce qui a été converti. Le suivi et la surveillance doivent commencer lorsqu'un enregistrement est identifié pour la conversion, et ne pas cesser avant d'avoir terminé toutes les tâches liées à l'acceptation du nouveau formulaire d'enregistrement et à l'élimination de l'ancien formulaire d'enregistrement.

        Le point d'entrée (dispositif d'entrée) des documents papier est un scanner de documents, disponible en plusieurs configurations : certains utilisent un mode autonome et un stockage magnétique des images électroniques, certains sont reliés à un poste de travail d'imagerie, et certains fonctionnent sous un configuration du serveur de fichiers de l'ordinateur. Des processus d'amélioration d'image peuvent être appliqués aux images numériques pour améliorer leur lisibilité, tout en réduisant simultanément la taille globale des fichiers. Le processus de numérisation comprend généralement la compression des données d'image conformément à un format standard ou propriétaire. Les images du document sont ensuite indexées à l'aide de la saisie manuelle traditionnelle, de la lecture de codes-barres ou de la reconnaissance optique de caractères.

        Selon les exigences d'une agence, le sous-système d'indexation peut être maintenu de plusieurs manières, y compris le stockage des données d'indexation dans le cadre du système d'imagerie ou le stockage des données d'indexation dans un système de gestion de base de données séparé. Dans les deux cas, les données d'index sont généralement conservées sur des supports de stockage magnétiques. Le stockage magnétique simplifie la révision des données d'index et permet un accès plus rapide des utilisateurs aux informations. Les images numérisées peuvent également être stockées magnétiquement, mais les disques optiques de données numériques sont une option viable pour la rétention d'informations à long terme. Une seule image numérisée peut nécessiter entre 20 000 et 300 000 octets ou plus de stockage (compression d'image à 10:1). Lors de la planification d'un système, il est utile d'effectuer des tests avec les matériaux d'origine à convertir pour déterminer les débits de numérisation potentiels, les exigences de stockage et les vitesses de transfert des fichiers d'images. Les informations numériques peuvent être distribuées de plusieurs manières, y compris l'affichage d'images sur des moniteurs haute résolution, des imprimantes laser, des microformes de sortie d'ordinateur ou la transmission d'images à distance. Ces processus sont souvent sous le contrôle d'un système de gestion des processus de flux de travail qui peut également acheminer les images vers les postes de travail, distribuer la sortie et effectuer le suivi des images et les rapports d'état.

        Plusieurs modèles saillants ont émergé au cours des visites sur place qui illustrent les stratégies génériques des agences fédérales. Les responsables de la production des agences fédérales comprennent le rôle essentiel de la préparation des documents dans les conversions à grand volume. La préparation de documents est une composante non technique d'une conversion d'enregistrements qui affecte la productivité opérationnelle globale. Les étapes de préparation des documents à numériser sont très similaires à celles utilisées pour préparer les dossiers pour le microfilmage. Le retrait des agrafes, reliures et autres éléments de fixation et le bon ordre séquentiel des documents sont des étapes importantes qu'il est préférable d'effectuer hors ligne. L'exécution de ces étapes avec diligence réduit les temps d'attente non productifs ou inactifs sur le poste de travail de numérisation et améliore les taux de débit de numérisation de documents, en particulier pour les systèmes d'imagerie dotés d'équipements à grande vitesse.

        Huit des quinze systèmes d'agences fédérales interrogés utilisent le personnel d'agences existantes pour effectuer des conversions de documents ou de données en interne. Cinq agences visitées font appel à des sous-traitants sur place pour les services de numérisation et d'indexation organisés par le biais de contrats avec des bureaux de services ou des fournisseurs d'intégration. L'enquête a indiqué que plusieurs agences utilisent une approche combinée, ou « d'équipe », pour le processus de conversion proprement dit, dans lequel les entrepreneurs et les employés fédéraux partagent les tâches de conversion. Le système d'imagerie du Département d'État, par exemple, fonctionne avec le personnel de l'agence traitant les demandes de courrier entrant et le personnel fourni par l'entrepreneur exploitant les systèmes de numérisation et d'indexation.

        Plusieurs des agences visitées effectuent la numérisation de documents sur des sites de conversion qui ne sont pas situés à proximité des systèmes de stockage et de récupération. Dans ces cas, les images numérisées sont temporairement stockées à l'aide de supports magnétiques ou de disques optiques de données numériques réinscriptibles. Par exemple, la numérisation de documents pour le projet de conversion du Bureau des brevets et des marques a été effectuée par le personnel de l'entrepreneur dans une installation de stockage de documents hors site.

        Trois agences fédérales visitées utilisent des disques de données numériques optiques pour stocker numériquement des données ASCII graphiques ou alphanumériques. La National Oceanic and Atmospheric Administration (NOAA), par exemple, utilise la technologie des disques optiques de données numériques pour la conservation des archives des données environnementales côtières. La NOAA surveille les événements climatiques naturels et les facteurs environnementaux d'origine humaine et analyse leur impact sur les processus mondiaux en évolution rapide. Le Centre national d'information sur les tremblements de terre utilise la technologie des disques de données numériques optiques pour stocker les données sismiques détectées lors des tremblements de terre causés par des événements tels que des tremblements de terre, une activité volcanique, des essais nucléaires et la prospection pétrolière. Et enfin, la Social Security Administration conserve les données sur les revenus des travailleurs au format numérique à l'aide de disques de données numériques optiques réinscriptibles.

        Analysez le domaine des documents à numériser, identifiez les niveaux d'uniformité et envisagez l'utilisation d'un entrepreneur en conversion de documents lorsque les fonds d'archives sont importants.

        Mettre en œuvre un processus complet de comptabilité et de suivi des dossiers pendant la phase de conversion du projet.

        Investissez suffisamment de personnel ou de sous-traitants dans la préparation des documents pour augmenter la productivité de la numérisation.

        Le cas échéant, affectez le personnel expérimenté de l'agence aux processus de conversion qui bénéficient de leur connaissance des opérations existantes de l'agence.

        Scanners d'images numériques

        Scanners de documents: Un scanner est le composant matériel qui convertit les documents originaux en images numériques électroniques. Le marché de l'imagerie commerciale propose des équipements de numérisation avec une diversité de vitesses de traitement, de fonctions d'opérateur automatisées et de coûts d'acquisition. Le temps réel écoulé pour la numérisation et l'affichage des images varie en fonction de plusieurs facteurs, notamment les performances inhérentes à l'unité de numérisation spécifique, les dimensions physiques des documents et la résolution de numérisation sélectionnée. Ces facteurs contribuent à des taux de production de scanners de bureau compris entre 2 et 20 documents par minute. Par conséquent, lorsqu'ils sont équipés de chargeurs de documents et d'une capacité de numérisation recto verso, les scanners de bureau sont utiles pour les petites applications d'imagerie avec des volumes de conversion quotidiens inférieurs et pour les systèmes d'imagerie de bureau de milieu de gamme. Lorsqu'ils sont équipés de capacités spéciales d'amélioration de l'image, les scanners de bureau sont également efficaces pour numériser des documents à faible contraste, difficiles à lire. Ces scanners fonctionnent également efficacement pour numériser à nouveau les images de mauvaise qualité rejetées lors des inspections de contrôle de la qualité des images de routine.

        Pour les applications de conversion de documents plus volumineuses, des scanners plus performants qui utilisent des transports de documents mécanisés robustes et plusieurs matrices de dispositifs à couplage de charge (CCD) de numérisation sont disponibles. Cet équipement offre des débits allant d'environ 40 à 120 pages ou plus par minute. Selon l'unité spécifique, ces scanners peuvent capturer les deux faces de chaque document en un seul passage, améliorant ainsi la productivité grâce à une gestion réduite du papier. Étant donné que les taux de production du scanner peuvent être affectés par l'état physique du document, les déclarations du fabricant concernant les taux de débit du scanner doivent être vérifiées avant l'achat de l'équipement. La vérification est mieux réalisée en utilisant un échantillon représentatif des dossiers réels de l'agence. Des scanners spécialisés sont également disponibles pour capturer des documents plus volumineux tels que des cartes et des dessins techniques.

        Les scanners de documents sont généralement installés et calibrés conformément aux instructions énoncées dans les guides d'utilisation et de maintenance du fabricant. Pour déterminer la qualité d'une image acquise avec un scanner récemment calibré, il est recommandé de scanner et d'évaluer une cible standardisée conformément à la norme FIPS PUB 157 « Directive pour le contrôle de la qualité des scanners d'images ». Des cibles de test sont disponibles pour évaluer les performances du scanner pour diverses caractéristiques d'image, notamment la couleur, la taille des caractères et la résolution.

        Numérisation numérique et microformes : Selon les exigences de stockage et de récupération des données d'une organisation, plusieurs alternatives sont disponibles pour migrer les informations entre les systèmes d'images numériques et les technologies de microformes analogiques. Ces approches comprennent :

        • En parallèle de la numérisation et du microfilmage des documents à l'étape de la capture d'image,
        • Création de microformes à partir de données existantes stockées numériquement, et
        • Conversion de microformes existantes en données numériques pour le stockage sur des disques optiques de données numériques.

        La première approche nécessite un équipement de capture d'images qui numérise numériquement les documents papier et, en même temps, enregistre photographiquement les images sur microfilm. Cette capacité à deux niveaux offre potentiellement le meilleur des deux mondes. C'est-à-dire que les images numériques sont stockées sur des disques optiques de données numériques pour un stockage et une récupération automatisés, tandis que les microformes, lorsqu'elles sont traitées et stockées conformément aux réglementations micrographiques de la NARA (36 CFR 1230), sont conformes aux exigences de conservation des informations à long terme. Un inconvénient potentiel qui pourrait annuler les avantages potentiels de cette approche serait lorsque des problèmes de contrôle qualité sont découverts avec les microformes traitées et que le lot de documents doit être complètement refilmé.

        Une deuxième approche consiste à créer des microformes à partir d'images numériques existantes et de données textuelles stockées sur des disques optiques de données numériques. Plusieurs configurations d'équipement d'enregistrement de microformes sont disponibles pour produire des microformes à partir de formats de texte et d'image matricielle stockés numériquement.Une technique utilise une technologie d'enregistrement par faisceau laser pour « écrire » les informations numériques, ligne par ligne, directement sur les matériaux de microforme avec des motifs de pixels de la taille d'un micron. La deuxième technique, qui s'applique uniquement aux données codées, y compris le texte, utilise la technologie d'imagerie plus conventionnelle du tube à rayons cathodiques (CRT) fournie dans la sortie informatique des appareils d'enregistrement sur microfilm (COM). La disponibilité commerciale est plutôt limitée pour les enregistreurs de microformes haute résolution qui créent des images COM raster sur des films 35 mm. Étant donné que ces systèmes sont également complexes à exploiter et coûteux, les utilisateurs doivent envisager un service bureau pour les applications à faible volume. Une complexité supplémentaire est introduite lorsque les informations numériques sont marquées avec des informations d'en-tête de fichier image uniques ou propriétaires, nécessitant une conversion dans un format largement utilisé (par exemple, Tagged Image File Format [TIFF]).

        Une troisième approche implique la conversion numérique de microformes. Ces microformes peuvent déjà exister dans les fichiers d'une agence. Inversement, ils peuvent avoir été créés à la place de la numérisation numérique des documents selon un concept de microfilm d'abord, de numérisation ultérieure. Si cette approche est envisagée, étudiez les exigences d'entrée des équipements de numérisation de microformes disponibles dans le commerce. S'assurer que les spécifications techniques de production de la microforme sont conformes aux exigences du scanner accélérera le processus de numérisation. Contrairement aux scanners de documents papier qui détectent la lumière réfléchie, les scanners de microformes transmettent un faisceau de lumière à travers le film. La qualité technique des microformes d'entrée originales impacte directement la lisibilité des images numériques. Les microformes de haute qualité fournissent les images numériques les plus lisibles (les plus propres), avec un avantage supplémentaire de tailles de fichiers numériques plus petites. Selon les besoins des utilisateurs, le marché commercial propose des scanners de microfilms avec diverses caractéristiques de performances opérationnelles. Les équipements de numérisation de microformes haut de gamme peuvent inclure de puissants algorithmes d'amélioration d'image qui améliorent la lisibilité des microformes à faible contraste et des capteurs électroniques pour détecter les images asymétriques ou mal alignées.

        Les 15 agences fédérales visitées ont utilisé des scanners de bureau ou à grande vitesse pour convertir les dossiers papier ou microformes existants. Plusieurs applications lancées avec des scanners de bureau à faible volume ont jugé nécessaire de passer à un équipement plus performant. D'autres agences ont atteint une production plus élevée en ajoutant des chargeurs automatiques aux scanners à feuilles de bureau ou en intégrant des scanners à grande vitesse supplémentaires. Les responsables du site ont noté que dans les conditions de production réelles, les débits de numérisation de documents peuvent varier considérablement des estimations du fabricant. Les administrateurs système ont noté que les demandes accrues imposées aux composants existants étaient fondées en partie sur une meilleure connaissance et acceptation de la technologie d'imagerie. Aux heures de pointe, cette demande accrue inattendue sur les systèmes d'imagerie peut surcharger les capacités inhérentes.

        La conversion de microformes en images numériques offre un certain nombre d'avantages potentiels, mais il peut y avoir un inconvénient important. La qualité d'origine de la microforme, y compris le contraste, l'espacement, l'inclinaison et la netteté de l'image, contribuent tous aux taux de production de numérisation potentiels et à la qualité des images numérisées. Afin de traiter efficacement ces problèmes, le système PERMS du ministère de l'Armée utilise des systèmes de numérisation de microformes spécialisés. Plusieurs autres agences interrogées ont choisi la technologie des disques optiques de données numériques en remplacement des systèmes d'information existants basés sur des microformes, accomplie soit par une conversion numérique des microformes existantes, soit en enregistrant les données directement sur des disques optiques de données numériques sans aucun enregistrement papier créé en tant qu'intermédiaires.

        Avant l'acquisition du système, validez les déclarations des fournisseurs concernant les taux de traitement des documents, la qualité de l'image et la facilité d'utilisation à l'aide d'un échantillon représentatif des fonds de l'agence.

        Suivez les procédures de test standard décrites dans FIPS PUB 157 "Guideline for Quality Control of Image Scanners".

        Résolution du scanneur

        La résolution du scanner de documents sélectionnée a un impact direct sur plusieurs facteurs clés, notamment la lisibilité des images numériques à l'écran, la lisibilité des sorties papier et l'utilité des images numériques pour les futures applications de l'agence. La sélection de la résolution de numérisation optimale est essentielle pour les applications immédiates et à plus long terme, car la résolution de numérisation d'origine ne peut jamais être augmentée, même si les futures technologies de récupération d'informations nécessitent une image de meilleure qualité. Par conséquent, un argument solide peut être fait pour numériser à la résolution la plus élevée actuellement abordable.

        La résolution du scanner est une équation complexe : la résolution de l'image, le spectre de couleurs, la taille de stockage des fichiers et les algorithmes de compression sont interdépendants et dépendent de l'équipement de numérisation, d'affichage et d'impression disponible. Les tailles des fichiers d'images numériques, par exemple, dépendent de la résolution du scanner sélectionnée. Un document bureautique standard nécessite environ 500 000 octets (non compressés) à 200 points par pouce (dpi) et près de 2 millions d'octets avant compression à 400 dpi. Ce facteur de stockage de quatre pour un devient important lors de la capture de milliers d'images.

        Dans le passé, c'étaient principalement les limitations de l'équipement de numérisation et d'affichage qui déterminaient la pratique de la numérisation numérique, et peu d'attention était accordée aux critères objectifs. Étant donné que la résolution du scanner affecte également la productivité d'entrée, les fournisseurs spécifiaient auparavant des paramètres de résolution inférieurs pour obtenir des vitesses de traitement efficaces et des coûts de stockage et de traitement des données réduits. Une résolution de numérisation de 300 dpi produit une qualité comparable à celle d'une imprimante laser de bureau moyenne (bien qu'inférieure à celle d'une photocopieuse) et peut être adéquate pour les documents de bureau typiques qui ne contiennent aucune taille de police inférieure à 6 points. Si une agence fédérale envisage d'intégrer la technologie de reconnaissance optique de caractères (OCR), une résolution de numérisation minimale de 300 points par pouce est recommandée.

        Les dessins techniques, les cartes et les documents contenant des informations très détaillées, fines et manuscrites peuvent nécessiter une résolution de numérisation allant jusqu'à 600 ppp ou plus. Dans tous les cas, mais surtout si les documents à numériser comprennent des cartes, des dessins ou des documents avec des lignes fines et des détails d'arrière-plan, des tests doivent être effectués pour vérifier la résolution de numérisation appropriée au cas par cas avec des échantillons de documents réels avant acquisition de matériel.

        La résolution du scanner est souvent spécifiée par les responsables de programme chargés d'équilibrer deux facteurs critiques : le stockage des données d'image et la lisibilité de l'affichage de l'image. La résolution de numérisation sur 12 sites d'agences fédérales capturant des documents originaux va de 200 à 400 dpi, la majorité utilisant 300 dpi. Les agences accordant moins d'importance à la qualité de l'affichage à l'écran tout en mettant l'accent sur l'économie du stockage ont tendance à numériser dans la plage de 150 à 200 ppp, arguant qu'un nombre bien plus important d'images compressées peut être placé sur un disque de données optique numérique donné. Les agences nécessitant un affichage d'image de meilleure qualité acceptent des fichiers de plus grande taille, numérisant dans les plages de 400 ppp et plus. Par exemple, le système d'imagerie REDAC du département d'État numérise régulièrement à 200 points par pouce, tandis que les documents de mauvaise qualité sont numérisés jusqu'à 400 dpi. Le système General Land Office Records Automation Project du Bureau of Land Management capture des images de documents à une résolution de 300 dpi, affiche des images à 150 dpi et imprime au laser des images de 300 dpi.

        Utilisez une résolution de numérisation d'au moins 300 ppp pour les documents bureautiques lorsque de futures applications (par exemple, OCR) pour les images numériques sont prévues.

        Spécifiez une résolution de numérisation plus élevée (entre 300 et 600 ppp ou plus) selon les besoins, pour les dessins techniques, les cartes et les documents contenant des informations détaillées sur les lignes fines et l'arrière-plan.

        Plage dynamique

        Les systèmes d'imagerie numérique comprennent généralement un équipement de balayage et d'affichage de type binaire. C'est-à-dire que chaque point (pixel) d'une carte binaire d'image matricielle est interprété comme noir ou blanc. Les scanners binaires ne sont pas parfaitement adaptés à la capture d'images de documents en couleur, de photographies, d'illustrations ou d'autres éléments contenant des tons continus. Pour capturer de manière optimale ces images, un scanner avec une plus grande plage dynamique est nécessaire. La plage dynamique est définie pour ce rapport comme la variation de ton dans n'importe quel point balayé donné. Dans les images en noir et blanc, la plage est représentée par une échelle de tons de gris. Le degré de noirceur associé à chaque élément d'image, ou pixel, dans une image en niveaux de gris est contrôlé par les informations numériques, ou bits, associées à ce pixel. De même, dans les images en couleur, chaque pixel est représenté par une valeur pour les trois couleurs primaires (généralement rouge, vert et bleu) qui, lorsqu'elles sont combinées, produisent la couleur souhaitée.

        Les systèmes d'imagerie enregistrant des images en niveaux de gris et en couleur nécessitent des composants spécialisés tels qu'un scanner avec une capacité en niveaux de gris ou en couleur, des écrans vidéo pouvant refléter la plus grande plage dynamique du système et un logiciel de traitement d'image plus puissant. Un scanner à niveaux de gris est obligatoire lors de la numérisation de photographies ou de négatifs en noir et blanc en tons continus. De telles images doivent être numérisées à 8 bits par pixel, permettant l'expression de 256 valeurs de gris, à moins qu'il ne soit déterminé à l'avance qu'il n'y a pas de besoin actuel ou futur prévu pour ce niveau de détail. Les techniques de numérisation en niveaux de gris peuvent également être appliquées efficacement à la numérisation de documents en noir et blanc. Étant donné que l'œil humain est très sensible aux variations de luminance, les documents numérisés à une résolution relativement faible (par exemple, 200 ppp) mais avec une échelle de gris de 4 ou 6 bits peuvent en réalité être plus lisibles sur des moniteurs à faible résolution que les documents numérisés à une résolution plus élevée dans un mode à deux niveaux. L'utilisation d'un moniteur ou d'une impression à plus haute résolution nécessite souvent une numérisation à plus haute résolution (par exemple, 300 et 400 ppp) avec une imagerie en niveaux de gris 8 bits.

        La numérisation couleur présente des défis techniques encore plus importants. Par exemple, le spectre complet des couleurs visibles peut ne pas être capturé avec précision par tous les scanners. Des problèmes supplémentaires surviennent à la sortie. Alors que les valeurs rouge, verte et bleue des documents sont généralement capturées lors de la numérisation, la sortie de l'imprimante est obtenue en équilibrant le cyan, le magenta, le jaune et le noir. Pour une représentation précise des couleurs en sortie, les périphériques d'entrée et de sortie doivent être calibrés. Même avec des techniques de compression d'image sophistiquées, l'imagerie en niveaux de gris et en couleur nécessite une capacité de stockage de données substantielle. Une image numérique binaire standard non compressée se compose de centaines de milliers de pixels, chacun représenté par 1 bit d'information. Étant donné qu'une image en niveaux de gris de 8 bits représente chacun de ces pixels avec 8 bits, le fichier non compressé résultant est huit fois plus volumineux. Par exemple, une image bi-ton non compressée de 300 dpi nécessite 1,05 mégaoctet de stockage, tandis qu'une image en échelle de gris non compressée de 300 dpi (8 bits par pixel) nécessite 8,4 mégaoctets de stockage. Les algorithmes de compression en niveaux de gris sont par nature moins efficaces que les schémas de compression binaires (c'est-à-dire que les fichiers d'images en niveaux de gris compressés peuvent être beaucoup plus volumineux que 8 fois la taille des fichiers binaires compressés). Sur la base des exigences de l'agence, ce facteur peut faire de la numérisation en niveaux de gris ou en couleur une option de stockage d'un coût prohibitif.

        Un seul des sites des agences fédérales visités, le National Earthquake Information Center du US Geological Survey, utilise des postes de travail informatiques avec des moniteurs de 800 x 1 000 pixels pour afficher des images de données numériques sismiques contenant 256 nuances de gris. Aucun des autres sites d'agences visités ne numérise ou ne stocke régulièrement des images en niveaux de gris.

        Utilisez une technologie d'imagerie en niveaux de gris ou en couleur selon les besoins pour des images à tons continus appropriées telles que des photographies, des cartes et des enregistrements associés.

        Le cas échéant, utilisez la technologie d'image à échelle de gris de 8 bits par pixel pour capturer des photographies et/ou des négatifs en noir et blanc en tons continus, et le mode 24 bits pour obtenir un rendu des couleurs fidèles.

        Amélioration d'images

        L'amélioration des images numériques fait appel à des algorithmes logiciels utilisés pour « nettoyer » l'apparence visuelle et la qualité des images numériques. L'amélioration de l'image doit être utilisée avec précaution, car ce processus peut en fait supprimer des éléments infimes des données d'image. Cette suppression de données d'image peut se produire soit de manière sélective, soit automatiquement, le produit final ayant un contraste visuel accru et une lisibilité améliorée. Les images améliorées électroniquement peuvent augmenter considérablement la lisibilité de l'écran d'affichage et de la copie papier. L'amélioration de l'image peut également réduire les besoins de stockage en améliorant l'efficacité du logiciel de compression d'image. Les documents difficiles à capturer, tels que les copies carbone avec des caractères fleuris, les photocopies multigénérations, les polycopiés bleu clair et violet, les originaux décolorés ou tachés et les annotations pâles au crayon et à l'encre, sont des candidats de choix pour l'amélioration de l'image. Les systèmes d'imagerie offrent généralement une capacité fondamentale de manipulation de contraste d'image. Du matériel et des logiciels supplémentaires sont disponibles pour étendre la puissance et la vitesse d'amélioration tout en augmentant les capacités de compression.

        Un aspect négatif de certains algorithmes d'amélioration d'image est une perte possible de détails contenus dans les documents originaux. Par exemple, les documents contenant une impression couleur, des annotations manuscrites ou des marges peuvent ne pas être reproduits de manière uniforme. Dans ces cas, le logiciel d'amélioration d'image peut supprimer par inadvertance certaines marques pâles ou à faible contraste. De même, tous les systèmes à deux tons convertissent les couleurs en noir, ce qui augmente les problèmes de lisibilité. Des filtres spéciaux peuvent être utilisés dans le processus de numérisation pour minimiser ce problème, et les administrateurs doivent s'assurer que la capacité de numérisation du système proposé correspond aux caractéristiques des documents à numériser. Il est prudent de tester le système d'imagerie avec un échantillon de documents de l'agence avant une conversion à grande échelle.

        Si un document source a une valeur intrinsèque, l'original doit être conservé après la numérisation de l'image numérique. Les données d'images matricielles numérisées numériquement de documents à valeur intrinsèque doivent être stockées sous une forme non améliorée pour garantir que toutes les informations numériques capturées soient disponibles pour un traitement futur par des techniques d'amélioration d'image plus puissantes.

        L'amélioration de l'image est attrayante en raison de sa capacité à améliorer la lisibilité des documents tachés, vieillis et à faible contraste. Même si la majorité des scanners de documents fournissent des commandes de contraste de base (clair/foncé) pour ajuster l'apparence de l'image numérique, plusieurs des sites visités envisagent ou ont déjà intégré des fonctionnalités spéciales d'amélioration de l'image. Par exemple, le programme PERMS de l'armée américaine utilise des améliorations logicielles pour nettoyer les images « bruyantes », obtenant ainsi une plus grande compaction dans le stockage des données et des images de meilleure qualité. Un autre exemple est la Commodity Futures Trading Commission, où une carte de circuit informatique d'amélioration d'image a été installée dans le scanner de bureau pour obtenir des images de meilleure qualité. Les opérateurs du système ont également noté l'utilité d'une capacité d'inversion de l'écran (positif et négatif) qui augmente la lisibilité visuelle de l'image des documents difficiles à lire, des microfilms négatifs numérisés et des photostats décolorés.

        Effectuez des tests de scanner à l'aide de documents sélectionnés pendant la phase de conception du système pour déterminer le besoin de modifications matérielles spéciales du scanner.

        Conservez les images numérisées non améliorées de documents de valeur intrinsèque.

        En-têtes de fichiers d'images numériques

        Les systèmes d'imagerie numérique utilisent un ensemble complexe de logiciels informatiques pour les fonctions de capture, de stockage et de récupération d'images. La demande d'image de l'utilisateur est liée à un emplacement spécifique sur le disque optique de données numériques ou sur un autre support de stockage. La liaison est réalisée au moyen d'un en-tête précédant les données numériques de chaque image discrète ou groupe d'images. Les données d'en-tête de fichier image peuvent inclure des éléments tels que la taille du fichier, le type de technique de compression et la résolution de numérisation. Les en-têtes de fichiers sont souvent propriétaires et sont généralement fournis en tant que composant intégral du système d'imagerie. Malgré l'importance d'un en-tête de fichier pour récupérer des images sur une longue période, les en-têtes de fichier sont souvent ignorés par les utilisateurs jusqu'à ce que des problèmes surgissent. Des difficultés surviennent généralement lorsque des données d'image doivent être transférées ou lorsqu'un système est mis à niveau ou modifié d'une autre manière.

        Il est essentiel d'utiliser des formats de fichier image et des structures d'en-tête non propriétaires ou d'avoir la possibilité de migrer des fichiers image dans un format standardisé commun. Lorsque les formats et en-têtes de fichiers image propriétaires ne peuvent pas être évités, le développeur du système doit être tenu de fournir un "pont" vers des formats de fichiers image non propriétaires ou, au minimum, une documentation complète décrivant la structure du fichier image. À l'heure actuelle, il n'existe pas de normes acceptées à l'échelle de l'industrie pour les formats et les en-têtes de fichiers d'images, bien que de nombreux acteurs de l'industrie travaillent actuellement à développer de telles normes. Une installation d'échange d'images (IIF), par exemple, est actuellement en cours de développement sous les auspices de l'Organisation internationale de normalisation dans le cadre de sa norme internationale de traitement et d'échange d'images. Le composant principal de l'IIF sera la définition d'un format de données pour l'échange de données d'images arbitrairement structurées à travers des limites d'application hétérogènes.

        En l'absence d'un format d'image standard accepté, de nombreux systèmes d'imagerie utilisent le Tagged Image File Format, ou TIFF. C'est l'un des formats de fichiers image les plus largement pris en charge pour les ordinateurs personnels. Chaque fichier TIFF comprend un en-tête, un ou plusieurs répertoires de fichiers image et des données de contenu. Les en-têtes TIFF et les répertoires de fichiers image indiquent au système informatique comment lire les données et contiennent des informations telles que la largeur de l'image, sa longueur et sa résolution. Certains développeurs de systèmes d'images adoptent le TIFF pour prendre en charge le transfert d'images entre les systèmes. Malheureusement, différentes versions d'en-têtes TIFF peuvent être implémentées. Par conséquent, le TIFF ne garantit pas automatiquement le succès des transferts d'images entre des systèmes disparates. Il est recommandé d'acquérir une documentation complète sur la structure de l'en-tête, même lorsque vous utilisez le format de fichier image étiqueté.

        Plus de la moitié des sites d'agences fédérales interrogés pour ce rapport utilisent des en-têtes de fichiers d'images numériques propriétaires. Seuls trois des sites des agences fédérales utilisent une version du format de fichier d'image étiqueté le plus largement utilisé. La terminologie complexe et les détails spécifiques des en-têtes de fichiers image contribuent au manque de compréhension universelle et de reconnaissance de leur importance. Par conséquent, de nombreux administrateurs système s'appuient sur des sociétés d'intégration, des fournisseurs et des fabricants de disques optiques de données numériques pour les guider à travers le labyrinthe de détails techniques et de spécifications de format d'en-tête de fichier. Cette dépendance à l'égard de solutions de fournisseurs propriétaires peut contribuer aux difficultés futures de migration des données.

        Utilisez des formats de fichiers qui favorisent/facilitent le transfert de données réseau, tels que Aldus/Microsoft TIFF version 5.0 qui répond à la définition standard de l'Internet Engineering Task Force pour l'échange d'images en noir et blanc sur Internet.

        Exiger l'utilisation d'une étiquette d'en-tête de fichier image non propriétaire. Ou Exiger un "pont" vers une étiquette d'en-tête de fichier image non propriétaire. Ou Exiger une définition détaillée de la structure d'étiquette d'en-tête de fichier image.

        Techniques de compression de données

        Les images numériques sont généralement compressées dans le cadre du processus de numérisation et de stockage, puis décompressées lors de la récupération. Un algorithme de compression transforme le motif de trame d'image numérique d'origine en un code mathématique qui est stocké de manière plus compacte, avec des techniques de compression à une ou deux dimensions.La compression unidimensionnelle utilise des pixels contigus (adjacents) sur la même ligne numérisée, tandis que la compression bidimensionnelle compare les différences entre les lignes numérisées, ainsi qu'au sein de la même ligne. Selon les caractéristiques du document et les techniques choisies, les taux de compression réels atteints peuvent varier considérablement. Les systèmes d'imagerie typiques peuvent compresser à un rapport de 10 pour 1, tandis qu'un rapport de 20 pour 1 ou même plus est réalisable avec des schémas de compression plus sophistiqués.

        Bien qu'il existe de nombreuses techniques de compression utilisées aujourd'hui, elles se répartissent généralement en deux catégories : propriétaire ou standard. Les algorithmes de compression propriétaires ont tendance à fonctionner plus rapidement et offrent un meilleur compactage des données. Cependant, les images stockées peuvent ne pas être facilement transportables entre différents systèmes en raison des caractéristiques spécialisées de l'algorithme. Les algorithmes de compression standardisés peuvent ne pas être aussi puissants, mais peuvent prendre en charge le transfert de données d'image entre des systèmes qui, autrement, pourraient être incompatibles. Les techniques de compression standard, ou non propriétaires, sont donc un élément indispensable d'une stratégie de migration pour les enregistrements de valeur à long terme.

        Les techniques de compression exclusives et standard peuvent chacune être subdivisées en méthodes de compression "avec perte" et "sans perte". Avec la compression avec perte, une certaine quantité des informations d'origine est supprimée dans le cadre du processus de compression. La compression sans perte, comme son nom l'indique, permet de reconstruire un fichier identique à l'original. Lorsqu'elle est effectuée correctement sur un document approprié, la compression avec perte a l'avantage de réduire considérablement la taille des fichiers numériques originaux d'une manière presque indétectable par l'œil humain. Pour les documents d'archives dans lesquels la fidélité continue à l'apparence exacte du document original est importante, un schéma de compression sans perte est recommandé.

        L'une des techniques de compression sans perte les plus couramment utilisées utilise une méthode appelée codage de longueur d'exécution. Il évalue les modèles de pixels adjacents sur une seule ligne horizontale et code les transitions binaires. L'encodage de longueur d'exécution est le plus efficace pour les documents comportant de grandes zones d'espace vide, que l'on trouve couramment dans les fichiers texte de bureau. Les documents plus complexes qui incluent des dessins au trait, des graphiques, des photographies et des cartes, entre autres, peuvent être compressés plus efficacement à l'aide de techniques utilisant des « tableaux de consultation » pour la comparaison avec l'image numérisée.

        L'ancien Comité consultatif du télégraphe et des téléphones internationaux (CCITT), désormais appelé Secteur de la normalisation des télécommunications (TSS), a élaboré des normes internationales pour la transmission de données sur des lignes de communication en modes unidimensionnels et bidimensionnels. Ces normes de télécopie sont connues sous le nom de Groupe 3 et Groupe 4. Le Groupe 4 offre une plus grande capacité de compression (bien qu'à un certain point avec perte) et fonctionne en mode bidimensionnel. Actuellement en cours de développement par le Joint BI-level Image Group (JBIG) est une nouvelle norme internationale destinée à remplacer les normes de compression CCITT Group 3 et CCITT Group 4.

        En plus des normes précédentes, les développeurs de logiciels système peuvent parfois avoir besoin d'implémenter d'autres schémas de compression. Deux programmes de compression importants sont le Joint Photographic Experts Group (JPEG) et le Motion Picture Experts Group (MPEG). JPEG est conçu pour compresser des images numériques en couleur ou en niveaux de gris de qualité à tons continus. Il offre à la fois une alternative de compression avec et sans perte. Le premier se produit lorsqu'un processus mathématique appelé transformation en cosinus discrète (DCT) est invoqué qui utilise une trame de 8 x 8 pixels et produit une compression substantielle. Ce processus produit une image avec perte avec une certaine perte de détails qui n'est pas nécessairement détectable à l'œil humain. La quantité réelle de perte dépend du taux de compression sélectionné. En revanche, l'alternative de compression sans perte atteint une fidélité totale à l'image source car la zone d'échantillonnage ou la trame est de 2 x 2 pixels, dont trois sont alignés le long d'axes différents par rapport au quatrième. Le taux de compression est contrôlé par l'utilisateur et limité à 2:1 ou 3:1.

        MPEG est un schéma de compression pour les images vidéo animées. Il utilise JPEG pour la compression d'images individuelles et utilise également d'autres techniques avec perte pour compresser les données entre les images. Les exigences croissantes de l'informatique multimédia, de la vidéoconférence et de la télévision numérique haute définition font qu'il est probable que de nouvelles normes seront développées sous peu pour la transmission rapide d'images animées. Étant donné que MPEG est intrinsèquement avec perte et que le taux de compression élevé de JPEG n'est possible qu'avec la technique de compression avec perte, les administrateurs système doivent évaluer soigneusement les besoins fonctionnels de leur système pour déterminer si l'une ou l'autre technique répondra aux exigences d'image actuelles et futures.

        Les développeurs système et les administrateurs doivent choisir entre des techniques de compression standard et propriétaires. L'utilisation de techniques de compression conformes au CCITT ou aux spécifications JBIG en développement lors du stockage de données non tonales augmentera la probabilité que les images puissent être utilisées avec d'autres technologies ou migrées entre les systèmes. Bien que les techniques propriétaires puissent fournir une meilleure compression des données, la compatibilité n'est pas assurée. En fait, si le logiciel supportant une technique de compression propriétaire devient obsolète, alors à toutes fins utiles, l'image ne peut pas être restaurée. Il peut arriver que l'utilisation d'une technique de compression sans perte propriétaire soit inévitable, mais dans ces cas, le fournisseur devrait être tenu de fournir un utilitaire pour décompresser les données dans leur format de données numérisées d'origine. À un moment ultérieur, les données peuvent être à nouveau compressées en utilisant n'importe quelle méthode souhaitée. Le tableau 1 présente une comparaison des techniques de compression de données et des exemples de leurs applications.

        Image
        La source

        Les sites étudiés utilisaient à la fois des schémas de compression propriétaires et standardisés. Plus de la moitié des 15 sites ont adopté un certain type d'algorithmes de compression de données propriétaires, alors que seulement 5 ont utilisé la technique de compression normalisée du groupe 4 du CCITT. Bien que les divers schémas de compression propriétaires réduisent efficacement la taille des fichiers numériques, entraînant une transmission d'image plus rapide et un stockage réduit sur les disques optiques de données numériques, l'adoption d'une approche propriétaire introduit un niveau de risque dans tout effort ultérieur de migration de données. Quelle que soit la technique adoptée, les administrateurs système ont reconnu l'importance d'obtenir une documentation descriptive sur les algorithmes de compression employés.

        Utilisez un schéma de compression sans perte lorsqu'une fidélité continue à l'apparence exacte du document original est réalisable et souhaitée.

        Utilisez JPEG ou MPEG pour les images avec des qualités tonales continues lorsqu'une certaine perte de détails est acceptable.

        Pour les images numériques sans qualité tonale continue, exigez des techniques de compression standardisées, telles que CCITT Groupe 3, CCITT Groupe 4 ou JBIG.

        Si un système de compression propriétaire sans perte est utilisé, exigez que le fournisseur fournisse un moyen de décompresser les données dans leur format d'origine.

        Assurance qualité des images numériques

        Le contrôle des processus garantit que les équipements de production (par exemple, les scanners de documents, le matériel de compression d'images, les imprimantes laser) et les processus système associés fonctionnent à des niveaux optimaux selon des critères préétablis. Idéalement, ces critères de contrôle de processus sont couramment utilisés pour surveiller les performances du système d'imagerie et de ses composants individuels. Des outils spécialisés de diagnostic et d'évaluation technique, combinés à des journaux de bord détaillés, sont une ressource inestimable pour le dépannage des futurs problèmes du système.

        Le contrôle de la qualité du produit évalue la qualité des images numériques individuelles et des données d'index associées produites par le système d'imagerie. Ce niveau de contrôle qualité est accéléré lorsque les images numériques numérisées sont temporairement stockées sur un cache de disque magnétique. Le stockage magnétique permet un nouveau balayage avant d'enregistrer les données d'image sur les disques optiques de données numériques. La renumérisation corrective est une capacité particulièrement importante pour les systèmes utilisant des disques de données numériques optiques à écriture unique. Selon la configuration du système, les corrections peuvent être effectuées à la station de capture du scanner ou à des postes de travail d'inspection ou de renumérisation spécialement désignés.

        La formation et la supervision du personnel d'exploitation est un facteur clé pour maintenir une qualité d'image acceptable. Comme indiqué précédemment, il n'existe pas d'indicateurs empiriques objectifs d'une qualité d'image acceptable pour les images numérisées. Une alternative consiste à catégoriser les documents en fonction des problèmes de numérisation et à parvenir à un consensus sur la manière de capturer le plus efficacement la « meilleure » image. Idéalement, ce processus décisionnel impliquerait une équipe composée d'un personnel de production du système d'imagerie, de gestionnaires de documents, d'utilisateurs du système et de chercheurs. Ces évaluations devraient inclure une analyse visuelle des images de l'écran d'affichage du poste de travail et de la sortie de l'imprimante laser. Conserver un ensemble d'impressions laser représentatives pour référence future serait un outil de référence d'analyse d'image précieux.

        Les programmes d'inspection de contrôle qualité ont un impact direct sur la productivité de la conversion des documents et l'utilité globale du système d'imagerie. Par exemple, un programme d'inspection peut inclure une comparaison visuelle complète de 100 % des images numérisées avec les documents originaux, ou il peut se limiter à définir la population d'inspection sur la base d'un pourcentage calculé ou d'un plan d'échantillonnage. Le niveau global d'inspection de contrôle de la qualité devrait être extrêmement élevé si les documents originaux ne sont pas conservés après la conversion. Dans certains systèmes, les décisions de réussite/échec concernant l'adéquation des images numérisées sont basées sur les jugements de l'opérateur. Ces jugements peuvent être affinés par la formation et l'expérience pratique plutôt que de s'appuyer sur des critères plus objectifs tels que des directives écrites de l'agence ou des procédures opérationnelles. C'est-à-dire que si une image à l'écran "semble juste" à l'opérateur du scanner ou au technicien de contrôle qualité, alors les critères de qualité du système ont été atteints. Dans tous les cas, les responsables prudents des agences fédérales devraient exiger une évaluation immédiate de chaque entrée d'index et image de document.

        Il est important de vérifier non seulement les images numériques telles qu'elles sont capturées à la station de numérisation, mais également lorsque les images sont écrites sur un disque optique de données numériques, ou après avoir créé une copie de sauvegarde optique disque à disque. Des problèmes au cours de ces processus peuvent entraîner des images qui sont statistiquement comptées par le système comme des "pages", mais ne sont pas récupérables lorsque les utilisateurs tentent de visualiser ou d'imprimer le fichier. Selon l'étendue du problème, si seulement une partie de la page a été copiée ou transférée, ces fichiers corrompus peuvent contenir du bruit inutile généré par le système ou des lignes superflues. Ces problèmes sont causés par plusieurs sources telles que des pannes de composants matériels, des problèmes logiciels ou même des surtensions. Par conséquent, il est conseillé lors du transfert de données d'image vers tout autre support à partir du disque dur magnétique d'origine ou du disque de données numériques optiques de vérifier les images comme copiées. Ce processus peut être effectué manuellement ou automatiquement à l'aide d'un logiciel de vérification d'image.

        Une inspection de qualité à 100 % des données de l'index est obligatoire pour continuer à fonctionner correctement et maintenir la confiance des utilisateurs du système dans le programme d'imagerie numérique d'une agence. Si les données d'index sont saisies de manière incorrecte ou si des erreurs sont introduites au cours du processus de saisie automatisée des données par OCR/code à barres, les images numériques associées sont pratiquement impossibles à récupérer. La vérification de l'index peut être effectuée de plusieurs manières, y compris une comparaison visuelle des données saisies par clé avec les images numérisées ou les documents papier affichés. Les données d'index peuvent également être vérifiées par double saisie, moyennant quoi les données d'index sont réintroduites manuellement, le logiciel du système informatique effectuant automatiquement une comparaison des deux entrées.

        Pratiquement chaque site d'agence fédérale visité dispose d'un certain type de programme d'inspection de contrôle de la qualité. Les programmes d'inspection varient selon qu'une vérification visuelle ou automatisée des fichiers d'images est effectuée. Les inspecteurs d'images utilisent des moniteurs d'affichage pour vérifier visuellement la qualité des documents numérisés. Quelques gestionnaires de système ont exprimé leur confiance que les opérateurs de scanner expérimentés sont suffisamment qualifiés pour obtenir une qualité d'image adéquate sans inspecter chaque image capturée. L'un des sites visités fait appel à un entrepreneur indépendant chargé du contrôle de la qualité, chargé de surveiller les opérations de conversion sur place et de vérifier les étalonnages des équipements. Dans cette configuration, la direction de l'agence supervise le processus de contrôle de la qualité et surveille les efforts de production pour vérifier la conformité continue aux directives établies. Moins de la moitié des sites visités utilisent des cibles de test spécialisées pour l'évaluation de la qualité d'image (voir FIPS PUB 157) afin de surveiller les performances continues du système. Comme l'a noté un administrateur système possédant une vaste expérience du monde réel, « une image cible de test est toujours meilleure qu'un morceau de papier avec une empreinte à travers elle ».

        Évaluez régulièrement les performances du scanner en fonction des procédures de contrôle qualité recommandées dans FIPS PUB 157 « Directive for Quality Control of Image Scanners ».

        Établir un consensus sur ce qui constitue la « meilleure » image pour les différents types de documents sources de l'agence surveiller la qualité continue de l'image à l'aide des écrans d'affichage et des imprimantes laser du système.

        Effectuez une évaluation de la qualité visuelle à 100 % de chaque image numérisée et les inspections de contrôle de la qualité des données d'indexation associées doivent être méticuleuses si les documents originaux ne sont pas conservés après la conversion.

        Vérifiez les informations telles que copiées lors du transfert d'images/données vers tout autre support à partir du disque dur magnétique d'origine ou du disque de données numériques optiques.

        Si les disques WORM sont le support de stockage de choix, n'écrivez définitivement les informations qu'après avoir effectué une inspection de contrôle qualité approfondie des images numérisées et des données d'indexation.

        Section 5 : Systèmes d'indexation

        Problèmes de gestion

        La récupération efficace des images de documents numérisés et des données graphiques dépend d'une base de données d'index précise et à jour. L'indexation d'une image numérique consiste à lier des informations d'image descriptives à des informations d'en-tête de fichier. Les données d'index sont généralement saisies manuellement à l'aide des documents originaux ou des images numérisées, soit au moment de la capture de l'image, soit plus tard dans le processus de production. La vérification des données d'index dans laquelle les entrées de la base de données sont comparées aux documents source d'origine pour en assurer l'exhaustivité et l'exactitude est cruciale : un terme d'index erroné peut entraîner la non-récupération de l'image associée.

        Les informations d'en-tête de fichier sont automatiquement fournies par le sous-système de stockage du système d'imagerie et incorporent généralement un numéro de référence d'image qui est inclus dans l'index d'informations descriptives. L'index descriptif et l'index d'en-tête de fichier existent fréquemment en tant qu'entités distinctes, ce qui crée un problème de gestion pour les informations d'archivage stockées optiquement. La fonction d'indexation d'un sous-système de capture d'images peut utiliser l'une des différentes approches généralement contrôlées par trois facteurs :

        La séquence des opérations fait référence à l'ordre dans lequel l'index est entré dans le système. Certaines applications bénéficient d'une base de données existante qui peut être utilisée conjointement avec des pointeurs vers le fichier image associé. Dans les applications où l'index doit être créé, deux approches sont disponibles par rapport au moment où l'index sera entré dans le système. La première approche implique la création de l'index avant la numérisation, suivie de la numérisation, puis de la création des fichiers image avec des pointeurs vers eux immédiatement placés dans les entrées d'index correspondantes. La seconde consiste à effectuer la numérisation du document sans index existant, permettant la création d'index suite à la création du fichier image. Dans ce cas, l'opérateur de saisie saisit les données d'index et indique le début et la fin du fichier, le tout en une seule étape.

        La complexité des données est un facteur important à prendre en compte lors de la conception d'un système d'indexation. Dans la plupart des systèmes basés sur des images numériques, le nombre de champs d'indexation est limité à une quantité raisonnable, suffisante pour fournir au chercheur les informations adéquates pour localiser le fichier sans surcharger la recherche dans la base de données. Il est de la responsabilité du chercheur de lire l'image et d'en extraire l'information et de ne pas se fier à l'index pour fournir toutes les données requises. Si un système d'images basé sur des trames est encombré d'un système d'indexation important et complexe, cependant, les temps de recherche pourraient être augmentés et les efficacités du système seront quelque peu annulées.

        Avec la méthodologie de saisie par saisie, l'opérateur de saisie saisit les champs pré-identifiés soit à partir de l'image numérique, soit à partir des documents papier originaux. Le point d'accès direct le plus bas (généralement au niveau du fichier) doit contenir ses propres données d'index. Un fichier peut être constitué d'un nombre quelconque de pages, et les pages individuelles d'un fichier peuvent alors être directement accessibles une fois que le fichier a été récupéré à partir du disque optique de données numériques. Dans certaines applications, cependant, chaque page de document est son propre fichier et, par conséquent, chaque page doit être indexée individuellement. Selon les caractéristiques du document, la reconnaissance optique de caractères (OCR) peut être utile pour l'identification et la capture des données d'index. Les zones de document prédéfinies sont numérisées et les données d'image raster qui s'y trouvent sont converties en données de caractères ASCII. Les applications qui utilisent des formulaires standard ou tout type de mise en page contenant des emplacements de champs cohérents peuvent être admissibles à cette technologie. Actuellement, la technologie OCR standard peut convertir efficacement la plupart des polices de caractères standard et certaines impressions manuelles structurées en ASCII. Les coûts de conversion peuvent augmenter considérablement (doubler pour chaque pour cent de précision améliorée) lors de la ressaisie des erreurs OCR pour obtenir un taux de précision des données d'index de 100 pour cent. Si une précision d'index de 100 pour cent n'est pas obligatoire pour une application spécifique, il est possible (mais non recommandé) d'utiliser la version d'index OCR non corrigée pour prendre en charge les recherches dans les fichiers image.

        Une méthodologie alternative pour les applications d'agence qui ont peu de cohérence dans l'emplacement des données utilise des étiquettes préimprimées, ou des feuilles d'en-tête, qui peuvent être insérées au début de chaque fichier à numériser. Ces étiquettes peuvent utiliser des codes à barres lisibles par machine ou des données de caractères qui sont facilement convertis par la technologie OCR. De manière générale, s'il est possible d'utiliser l'OCR ou une autre forme de lisibilité par machine pour la saisie d'index et que cela est rentable, cette forme doit être utilisée pour gagner en vitesse, en précision et en facilité d'utilisation. Cependant, la saisie manuelle des clés peut fournir des taux de conversion rapides si la taille des fichiers est importante et les champs de saisie de données sont minimisés.

        De nombreux systèmes d'indexation pris en charge par l'ordinateur central peuvent répondre aux normes de base de données existantes du gouvernement fédéral, telles que la publication FIPS PUB (Federal Information Processing Standards) numéro 127, "Structured Query Language (SQL)". Cependant, de nombreux systèmes d'imagerie numérique à petite et moyenne échelle ont tendance à être ciblés pour un réseau local (LAN) ou un environnement de bureau. Les systèmes plus petits peuvent utiliser des bases de données d'index optimisées pour les performances de recherche et de récupération plutôt que de se conformer aux normes d'interopérabilité et de portabilité. Par conséquent, à mesure que les systèmes plus petits dépassent leur plate-forme d'exploitation, il est très difficile de les migrer vers un environnement de base de données plus vaste. Par conséquent, les systèmes plus petits susceptibles d'évoluer vers des environnements SQL plus vastes doivent être développés en gardant à l'esprit FIPS PUB 127, et le processus d'analyse des exigences doit tenir compte de la croissance future pour déterminer s'il existe une exigence de portabilité des données.

        Les problèmes de performances et de taille déterminent généralement la conception des systèmes d'indexation. Lorsque ces systèmes d'indexation sont liés à des systèmes optiques de récupération d'images, le résultat final est souvent une solution propriétaire. Dans certains cas, il peut être préférable d'assouplir les exigences de performances en faveur d'une approche de systèmes ouverts (voir FIPS PUB 127) qui facilite la migration de la base de données d'indexation tout en conservant la base de données d'images existante.

        La recherche et le développement de méthodes automatisées pour capturer avec précision les données d'indexation requises, y compris les technologies d'OCR et de codes à barres, sont en cours. L'OCR progresse rapidement, comme en témoignent les capacités de reconnaissance améliorées et les vitesses de conversion plus élevées. Les systèmes d'imagerie des petits bureaux prennent désormais en charge la capacité de reconnaissance optique de caractères intégrée, bien que les documents de mauvaise qualité puissent nécessiter une numérisation plus performante que celle actuellement offerte par les systèmes clé en main. Les fournisseurs ont également intégré la technologie des codes à barres pour le contrôle du scanner, la délimitation des fichiers et la collecte des données d'index.

        Les systèmes d'exploitation LAN commencent à utiliser des techniques de compression de données sur des serveurs LAN optimisés pour la récupération de données. Ces techniques peuvent permettre de stocker des bases de données de taille moyenne sur des serveurs de réseau au lieu de systèmes mainframe. Cette tendance peut réduire le coût de mise en œuvre des systèmes de recherche d'informations qui sont liés ou intégrés à des systèmes de recherche d'images. Enfin, les ensembles de données d'index volumineux peuvent désormais être sauvegardés par des sous-systèmes de cartouches de bande très haute capacité, qui peuvent être intégrés dans des sous-systèmes de stockage et de récupération multicartouches et multidisques. Cette technologie apporte une capacité de sauvegarde et d'archivage des données mainframe à un environnement de serveur LAN, rendant l'imagerie basée sur serveur attrayante et rentable.

        Les archives des agences fédérales contiennent des documents difficiles à lire, tels que des documents dactylographiés manuellement, des télécopies, des copies carbone et des documents trop complexes. Historiquement et pratiquement, l'existence de tels documents a limité l'adoption généralisée des technologies d'indexation automatisée. Les systèmes automatisés de reconnaissance de caractères étaient souvent limités aux applications contenant un pourcentage important de formulaires standardisés de haute qualité. Au cours des visites sur site effectuées pour ce rapport, un chef de projet d'une agence fédérale a fait remarquer que « l'indexation est le côté obscur de l'imagerie ». Le commentaire fait allusion aux efforts de travail manuels à forte intensité de main-d'œuvre nécessaires pour obtenir des données de champ d'indexation très précises, souvent sous les contraintes d'un calendrier de production pressurisé.

        Les sites des agences fédérales visités utilisaient à la fois des processus de saisie manuelle des données et d'indexation à saisie automatisée. Les opérateurs de saisie de données sur 10 des sites saisissent manuellement les données de l'index descriptif, en utilisant soit les documents originaux, soit les images numérisées affichées. Le personnel contractuel du Bureau of Land Management (BLM), par exemple, visualise les images numériques à l'écran tout en saisissant les données dans 35 champs distincts. Les données saisies sont ensuite vérifiées par le personnel de l'agence BLM, et un taux d'exactitude global de 99,5% est revendiqué. Le système informatique assiste les opérateurs de saisie en remplissant automatiquement certains champs prédéfinis. Un autre exemple est le système d'imagerie numérique Superfund de l'Environmental Protection Agency, qui prend en charge l'indexation manuelle à l'aide d'un clavier, d'une souris ou d'un lecteur de codes-barres.

        Le logiciel système observé sur trois systèmes stockant des données numériques (images non numérisées) sélectionne et crée automatiquement les informations d'index. Par exemple, le réseau sismographique national du Centre national d'information sur les tremblements de terre automatise les fonctions de capture, d'indexation, de transmission et d'accès des utilisateurs aux données. L'indexation automatisée des fichiers de données se produit au moment de la capture et du stockage initial des données, le temps chronologique écoulé (durée) enregistré de l'événement sismique servant de clé d'indexation principale. La Bibliothèque du Congrès a automatisé la création de la base de données d'index en capturant les données d'index (dans ce cas, un numéro d'accès unique) à partir de feuilles d'en-tête d'entrée spécialement créées, les erreurs OCR nécessitant des corrections par les opérateurs de saisie. L'automatisation du processus d'indexation d'une agence améliore le débit du projet de conversion et augmente également la précision des données enregistrées.

        Le cas échéant, assurez-vous que le logiciel de récupération d'informations est conforme à SQL.

        Quelle que soit la méthodologie de capture utilisée, effectuez une inspection de contrôle qualité à 100 % de toutes les données d'index.

        Emplacement de la base de données d'indexation

        Plusieurs options sont disponibles pour stocker des données d'index liées à des images raster stockées optiquement ou à des données numériques. Les données d'index stockées magnétiquement offrent une recherche de données améliorée, un accès aux images et des procédures moins complexes lors de la modification des informations d'index. Cependant, cette approche nécessite la conservation et la recopie périodique de deux systèmes distincts : les données d'index stockées magnétiquement et les images stockées optiquement. En fonction des exigences de stockage des données d'une agence, des copies de sauvegarde des données d'indexation doivent également être envisagées, offrant une redondance et une protection contre la perte accidentelle de données. Les données d'index peuvent également être enregistrées directement sur les disques de données numériques optiques, servant de table des matières permanente aux images stockées de manière adjacente. Cette technique peut être utile aux agences ayant des exigences spécialisées en matière d'indexation, de conservation ou de sécurité des données.

        Les 15 sites des agences fédérales visités stockent leurs données d'index à l'aide de la technologie de stockage magnétique. La Bibliothèque du Congrès, par exemple, maintient un numéro d'accès d'index de document unique ainsi que des pointeurs d'emplacement de document vers les images stockées optiquement. Le stockage magnétique de ces informations d'accession à l'index permet au personnel de la bibliothèque de mettre à jour ou de modifier les données selon les besoins. L'Office des brevets et des marques conserve les données de l'index des brevets au format magnétique, mais contrairement aux autres agences étudiées, les données sont également au format optique. Alors que les données d'index stockées magnétiquement de l'Office des brevets facilitent la recherche et la modification, les administrateurs système enregistrent également de manière permanente les données d'index sur chaque disque optique de données numériques. Les données d'index stockées optiquement fonctionnent comme un répertoire permanent ou une table des matières pour les images numériques. Dans le cadre du concept de double stockage de l'Office des brevets, les données d'index et d'images sont indissociables, ce qui permet d'assurer la liaison à long terme de ces deux sources d'information.

        Stockez les données d'index magnétiquement pour des opérations améliorées et optiquement si la conservation à long terme est un problème.

        Indexer la complexité de la base de données

        Les données d'index traitées par le logiciel de base de données peuvent être suffisamment descriptives pour répondre aux requêtes des utilisateurs sans avoir besoin de récupérer les images numériques. La productivité de l'opérateur est la plus élevée lorsque les données d'index peuvent être facilement extraites. Selon les exigences du système d'indexation, un temps considérable de personnel est nécessaire pour saisir manuellement plusieurs champs de données ou le texte complet pour une recherche en texte intégral. Sur la base des visites sur site et des discussions avec les administrateurs système des agences fédérales, les systèmes d'imagerie optique observés sont basés sur l'un des concepts de récupération génériques suivants.

          Les images (données numériques) ou les groupes d'images regroupés sont liés à un identifiant personnel unique, tel qu'un numéro de sécurité sociale, stocké dans une simple base de données plate. Une telle base de données est facile à créer et à maintenir, nécessitant peu de la part de l'administrateur système en termes de programmation sophistiquée.

        Les sous-systèmes de recherche d'informations descriptives doivent généralement être capables d'effectuer une recherche rapide dans de grandes bases de données avec une variété d'options de requête. Les sous-systèmes de récupération d'images ne nécessitent généralement pas beaucoup d'espace de stockage pour l'index d'en-tête de fichier, et leur capacité à fournir l'image au poste de travail de l'utilisateur dépend des capacités du périphérique de stockage ou d'accès et du sous-système de communication. Les sous-systèmes d'extraction de données d'index et d'extraction d'images doivent être suffisamment intégrés pour qu'un système d'imagerie fonctionne selon les attentes de l'utilisateur.

        Certaines variantes du système d'indexation de type de fichier plat, moins complexe, ont été observées dans les 10 sites d'agences fédérales visités. Le système d'indexation de la Commodity Futures Trading Commission utilise un serveur OCR qui convertit les images bitmap en texte ASCII. Les fichiers texte ASCII sont dirigés vers le serveur réseau pour indexation par le logiciel d'application. Les éléments d'index balisés comprennent les titres de coupures de journaux, les sources d'information d'origine et environ 50 catégories de sujets de page saisis pour une utilisation ultérieure en tant que mots-clés de base de données interrogeables. Le système d'imagerie de l'Environmental Protection Agency (EPA), quant à lui, utilise un système d'indexation plus complexe lié aux mini-ordinateurs hôtes IBM AS/400 existants de l'agence. Le personnel des opérations du bureau régional de l'EPA saisit manuellement les informations de l'index en utilisant les documents originaux avant de les numériser. Les informations à code-barres servent d'alternative à la saisie manuelle des clés dans la mesure du possible. Le logiciel d'indexation fournit des menus déroulants d'interface utilisateur de poste de travail contrôlés par la souris ou le clavier. La productivité opérationnelle est encore améliorée lorsque les écrans d'affichage des données d'index fournissent aux utilisateurs suffisamment d'informations pour éviter efficacement le besoin de récupérer les images numériques.

        Les décisions relatives à la conception du système d'indexation et aux capacités doivent être fondées sur une analyse approfondie des opérations de l'agence et des besoins des utilisateurs.

        Sections 6 : Systèmes de disques optiques de données numériques

        Figure 2 sous-système de stockage sur disque optique

        Problèmes de gestion

        Les administrateurs d'agences fédérales responsables de la conservation à long terme des dossiers peuvent bénéficier de l'adoption d'un système de stockage et de récupération d'informations basé sur la technologie. Le stockage de données haute capacité offert avec les disques optiques de données numériques est particulièrement intéressant pour les archivistes, les gestionnaires de documents et les autres personnes concernées par la préservation de l'information. La sélection du système de stockage d'informations le plus approprié doit être basée sur une analyse complète des besoins immédiats et à long terme de chaque agence fédérale. Une analyse des besoins fonctionnels d'une agence doit refléter les exigences de l'ensemble de la communauté des utilisateurs de l'agence, y compris les administrateurs, les gestionnaires de programme, les responsables de la gestion des ressources d'information (IRM), le personnel de soutien technique et le grand public, le cas échéant. Bien que l'industrie de l'imagerie mette l'accent sur les avantages d'un accès et d'une gestion des fichiers efficaces, les facteurs de coût jouent trop souvent un rôle important dans le processus de prise de décision. Les problèmes de conservation tels que la longévité du système ou du support, le besoin de mises à niveau de routine du système, le transfert d'images ou de données d'indexation et des problèmes similaires sont ensuite relégués à un statut subordonné. Un élément important à prendre en compte est la facilité d'utilisation attendue du support de stockage d'informations pendant la durée de vie du système de stockage sur disque de données optiques et d'imagerie numérique.

        Configuration du système de disque optique de données numériques

        Les composants optiques de stockage sur disque de données numériques peuvent être intégrés dans diverses configurations de système, allant des postes de travail à utilisateur unique ou à plusieurs utilisateurs fonctionnant sous des configurations client-serveur aux ordinateurs centraux avec des centaines de terminaux d'utilisateurs distants. Un sous-système de stockage optique peut comprendre :

        • Plates-formes de serveur d'ordinateur central, de mini-ordinateur ou d'ordinateur personnel (PC) du système
        • Lecteur de disque optique et support de disque optique de données numériques
        • Équipement de stockage de jukebox
        • Logiciels systèmes et applications

        La figure 2 illustre une configuration possible d'un sous-système de stockage et de récupération de disque optique de données numériques.

        Les exigences de stockage d'informations d'une agence fédérale doivent être évaluées en fonction de plusieurs facteurs, notamment la capacité de stockage de données requise, l'efficacité de la récupération, la fiabilité du système et des composants, la capacité à garantir l'intégrité des données et la longévité des supports de stockage sélectionnés et des composants du système d'imagerie associés. Les facteurs techniques supplémentaires à prendre en compte sont les caractéristiques physiques du support, le processus d'enregistrement du disque optique de données numériques spécifié, les caractéristiques d'enregistrement des données et la capacité de stockage utilisable généralement exprimée en gigaoctets (Go), et la durabilité du disque optique de données numériques et la conformité aux normes nationales et internationales. .

        En raison des changements technologiques rapides, les gestionnaires de programmes des agences fédérales sont aux prises avec la conception de plans de migration de stockage réalistes. Des entretiens sur place avec des administrateurs d'agences fédérales ont indiqué une prise de conscience générale de la nécessité de mettre à niveau éventuellement les composants du système ou de développer des approches alternatives. Les visites sur place ont révélé que quelques agences fédérales ont déjà modifié, mis à niveau ou remplacé des composants individuels ou des sous-systèmes entiers. Ils ont pris ces mesures tout en recherchant des performances plus élevées et un meilleur accès aux informations stockées. Les modifications comprennent des améliorations des logiciels d'applications système, des écrans de station de travail à plus haute résolution et une mémoire cache accrue, l'intégration de stations de travail à jeu d'instructions réduit (RISC) hautes performances et l'acquisition de lecteurs de disques ou de juke-box de données numériques optiques supplémentaires et de données numériques optiques de plus grande capacité. disques.

        La majorité des 15 sites d'agences interrogés utilisent des plates-formes basées sur PC comme postes de travail ou serveurs, et plus de la moitié sont contrôlés par ou ont des liens avec un système central ou un mini-ordinateur. Ces liens mainframe améliorent généralement l'accès des utilisateurs aux données stockées optiquement tout en fournissant également un passage vers les systèmes de récupération de bases de données d'index existants. De plus, bien que presque tous les systèmes étudiés utilisent un certain type de réseau local (LAN), les systèmes de disques de données numériques optiques varient en taille, en complexité et en méthodologie. L'indexation des données, la construction de fichiers et les procédures de workflow sont dans de nombreux cas adaptées aux exigences d'application uniques des sites individuels.

        La plupart des sites système visités pour ce rapport utilisent un juke-box pour le stockage de données optiques numériques sur disque. L'Office des brevets et des marques a adopté une approche unique en intégrant une série de lecteurs optiques à accès rapide (RAD) à disque unique dédiés en plus des juke-box conventionnels. La technologie RAD fournit une récupération d'informations optimisée pour prendre en charge les demandes des utilisateurs. En revanche, plusieurs des sites étudiés utilisent des systèmes de lecteurs optiques autonomes dans lesquels les disques sont manipulés manuellement par le personnel d'exploitation. Ces systèmes manuels sont souvent mis à niveau vers des opérations plus automatisées, car les besoins des utilisateurs imposent une réponse améliorée du système. Tous les systèmes visités qui traitent des données d'images numériques utilisent des moniteurs d'affichage à plus haute résolution (100 dpi à 150 dpi) et un équipement d'impression laser.

        Technologies d'enregistrement optique sur disque de données numériques

        Selon les exigences de l'agence, les systèmes d'imagerie numérique et de stockage de données numériques optiques sur disque peuvent incorporer l'une ou l'autre de deux approches incompatibles pour l'enregistrement d'informations numériques :

        Systèmes WORM (Write Once Read Many). Écrivez une fois lu beaucoup, ou WORM, les supports optiques ont été introduits pour la première fois au début des années 1980 et restent un choix populaire pour les systèmes d'imagerie numérique. WORM traite les données d'enregistrement au moyen d'un faisceau laser modifiant en permanence les caractéristiques de réflexion de la surface d'enregistrement du disque ou de la ou des couches sensibilisées. Les processus de technologie d'enregistrement optique WORM comprennent l'ablatif, la bulle thermique, l'alliage bimétallique, le colorant-polymère et le changement de phase. Le processus ablatif, la première technologie d'enregistrement optique disponible dans le commerce, modifie les caractéristiques de réflexion du disque optique de données numériques en créant des creux de taille submicronique, ou des bulles, pour indiquer les 1 et les 0. L'enregistrement thermique des bulles crée des bulles sur la surface du support optique en utilisant l'énergie concentrée du faisceau laser. La technologie bimétallique utilise un faisceau laser pour fusionner plusieurs alliages en un tout nouvel alliage avec un indice de réflexion différent. Dans les technologies d'enregistrement à colorant-polymère et à changement de phase, le faisceau laser modifie la couleur physique et les caractéristiques de réflexion du support, avec les informations signifiées par les changements de couleur. Étant donné que ces technologies d'enregistrement impliquent une altération physique irréversible de la surface d'enregistrement, elles sont désignées « écrire une fois ». Bien que chaque technique présente des avantages et des inconvénients, du point de vue de la gestion des archives et des documents, aucune n'est connue pour être intrinsèquement supérieure. À l'heure actuelle, il n'y a pas de processus d'enregistrement préféré pour les enregistrements de valeur à long terme.

        Lorsque l'intégrité des données est une préoccupation majeure, les disques optiques de données numériques WORM deviennent attrayants car les données enregistrées ne peuvent pas être modifiées ou effacées. Si, à un moment donné, une image existante est jugée incorrecte ou n'est plus nécessaire, le pointeur électronique vers cet emplacement de recherche peut être désactivé. Ce processus de désactivation du pointeur élimine efficacement l'accès des futurs utilisateurs. Des données nouvelles ou corrigées sont ensuite écrites dans une zone différente, inutilisée, du disque optique de données numériques. Ce processus est essentiellement transparent pour la communauté des utilisateurs. Bien que l'accès à l'image d'origine soit bloqué, les données sont toujours sur le disque WORM et restent potentiellement accessibles à moins qu'elles ne soient expressément écrasées par le gestionnaire du système pour effacer le modèle de données enregistré.

        L'un des développements les plus récents dans le domaine de l'écriture une fois lu de nombreux disques de données numériques optiques est l'émergence des disques compacts enregistrables, ou CD-R. À partir du milieu des années 80, les disques compacts à mémoire morte (CD-ROM) sont rapidement devenus un moyen populaire de publication et de distribution d'informations numériques. Ce processus d'acceptation a été particulièrement amélioré au fur et à mesure que des normes internationales ont été élaborées pour assurer l'échange de disques CD-ROM sur une variété de lecteurs. Le processus de publication de CD-ROM conventionnel est complexe et nécessite souvent l'accès à des installations de mastering commerciales qui permettent de réaliser des économies d'échelle uniquement lorsqu'un nombre suffisant de disques est produit. Par conséquent, l'utilité du CD-ROM dans la production d'un ou deux disques seulement, pratique courante dans les environnements d'archivage et de gestion des documents, a été limitée. Cette situation évolue rapidement avec l'introduction d'équipements CD-R relativement peu coûteux qui enregistrent les données directement sur des disques individuels en interne. Un avantage majeur est que le CD-R utilise les mêmes normes de l'Organisation internationale de normalisation (ISO) pour les supports physiques (ISO 10419) et les formats de fichiers (ISO 9660) que les CD-ROM. L'adoption de ces normes améliore considérablement l'échange de disques et la possibilité d'accéder aux informations stockées sur les disques CD-R.

        Systèmes réinscriptibles. Les disques optiques de données numériques réinscriptibles offrent une alternative viable aux données numériques qui nécessitent des mises à jour ou des révisions fréquentes. Les disques réinscriptibles offrent aux utilisateurs la possibilité de mettre à jour les données enregistrées comme c'est actuellement le cas avec les disques durs magnétiques. Bien que les systèmes WORM soient actuellement prédominants, les observateurs de l'industrie prévoient une croissance continue des formats réinscriptibles. La place de marché propose actuellement deux techniques réinscriptibles incompatibles : la magnéto-optique (MO) et le changement de phase.

        Les systèmes magnéto-optiques combinent les propriétés des technologies magnétiques et optiques. Le processus d'enregistrement des données, ou « écriture », utilise un faisceau laser pour chauffer (généralement jusqu'au point de Curie) un site prémagnétisé sur la surface d'enregistrement du support optique. Le processus thermique provoque une inversion de la polarité magnétique, ce qui entraîne de subtiles différences de réflexion qui sont détectées par le faisceau laser "lu". Le processus est réversible pour effacer efficacement les données numériques. Il existe des normes nationales et internationales approuvées pour certains types de supports magnéto-optiques.

        Les processus réinscriptibles à changement de phase modifient la surface d'enregistrement amorphe du support optique.Les données existantes peuvent être effacées et de nouvelles données écrites au cours de la même rotation de disque, offrant une capacité d'écrasement directe des données. La normalisation des lecteurs et des supports à changement de phase a été lente par rapport à celle de la technologie magnéto-optique.

        Les agences fédérales ont plusieurs options concernant la sélection de systèmes de supports optiques disponibles dans le commerce. Les systèmes WORM conventionnels de type ablatif ont été rejoints sur le marché par des systèmes réinscriptibles proposés comme alternatives fondamentalement équivalentes aux systèmes d'enregistrement WORM. Selon l'approche du fabricant, ces systèmes optiques réinscriptibles utilisent des codes de sécurité préenregistrés, ou des « verrous » logiciels intégrés dans les lecteurs optiques ou les supports optiques réinscriptibles ou les deux. Ces mesures de sécurité du micrologiciel/logiciel servent à contrôler l'autorité d'écriture et d'écrasement des données du gestionnaire de système, fournissant efficacement une fonction WORM avec un support réinscriptible.

        En dernière analyse, le choix des technologies de disques de données numériques optiques WORM ou réinscriptibles dépend de plusieurs facteurs, notamment les exigences d'application de l'agence fédérale, les contraintes réglementaires, les ressources disponibles et les problèmes de normalisation. La technologie WORM de type ablatif semble offrir un degré substantiel de sécurité de l'information et de confiance des utilisateurs car, contrairement à la technologie réinscriptible, elle est irréversible. Il est important de noter que la confiance des utilisateurs dans l'intégrité des données stockées est généralement basée sur plus que la réversibilité ou la non-réversibilité des supports. En fait, les fonctionnalités de sécurité des données, qui peuvent limiter les utilisateurs à « lecture seule » ou fournir une capacité d'audit qui suit les utilisateurs avec des privilèges « d'écriture », sont bien plus importantes.

        Aucun processus WORM n'a été identifié comme le choix écrasant et définitif parmi les 15 sites d'agences fédérales interrogés. Le processus d'enregistrement réel n'était qu'un des nombreux facteurs pris en compte, y compris la reconnaissance du nom du fabricant de disques optiques de données numériques, la réputation de l'industrie et l'historique de fabrication de produits de qualité. Cinq des quinze systèmes utilisaient une technologie réinscriptible. Un exemple est l'utilisation par le programme PERMS du ministère de l'Armée de la technologie d'enregistrement magnéto-optique réinscriptible de 5,25 pouces comme stockage d'images numérisées provisoire ou temporaire (en cours de traitement) avant de transférer les données d'image sur un support WORM de 12 pouces. Un autre exemple est le système de documents capturés de l'armée (DOCEX), qui utilisait la technologie de bande audionumérique (DAT) comme stockage provisoire, suivi du transfert de données d'image sur des disques magnéto-optiques réinscriptibles de 5,25 pouces pour un stockage permanent. Quel que soit le format choisi, les visites sur place ont indiqué que tous les systèmes de disques optiques de données numériques fonctionnaient conformément aux spécifications du fabricant et répondaient aux besoins des utilisateurs.

        Des technologies WORM ou réinscriptibles peuvent être utilisées, la sélection réelle étant déterminée par les exigences d'application spécifiques de l'agence. Assurez-vous que les privilèges de lecture/écriture sont soigneusement contrôlés et qu'une piste d'audit des réécritures est maintenue lorsque la technologie réinscriptible est utilisée.

        Capacité de stockage de disque de données numériques optiques

        La capacité de stockage des disques de données numériques optiques est basée sur plusieurs facteurs, notamment le diamètre physique (par exemple, 5,25 pouces) d'un disque spécifique, l'état de la technologie d'enregistrement optique et la conformité aux normes industrielles applicables. Les développements continus de l'ingénierie dans des domaines techniques tels que les largeurs de piste, l'enregistrement de données et les diodes laser à longueur d'onde plus courte (par exemple, bleu et vert) devraient améliorer considérablement les capacités de stockage des disques de données numériques optiques. Par exemple, la diminution de la distance entre les pistes adjacentes ou la réduction de la taille du spot du faisceau laser d'enregistrement permettra d'enregistrer davantage de données sur chaque disque optique de données numériques.

        Le tableau 2 illustre les capacités de stockage générales de divers formats de supports optiques et technologies d'enregistrement.

        Tableau 2. Capacités de stockage des disques optiques de données numériques
        Type de disque Diamètre Capacité
        CD ROM 4,72 po 550 mégaoctets (Mo)
        CD-R 4,72 po 600 Mo
        VER DE TERRE 5,25 pouces (130 mm) 650 Mo et timide 2 Go
        VER DE TERRE 12 po (300 mm) 2,18 Go et timide 5,6 Go
        VER DE TERRE 14 po (356 mm) 6,8 Go et timide 13 Go
        Réinscriptible - MO 3,5 pouces (86 mm) 128 Mo-384 Mo
        Réinscriptible-MO 5,25 pouces (130 mm) 650 Mo – 2 Go
        Changement de phase 5,25 pouces (130 mm) 940 Mo - 1,5 Go

        De nombreux observateurs de l'industrie pensent que la capacité de retirer et d'échanger des supports est un facteur clé du succès commercial à long terme et de la viabilité des disques optiques de données numériques. La concurrence intense du marché qui existait au début du développement de la technologie des disques optiques de données numériques WORM de 12 pouces signifiait que peu d'efforts étaient consacrés à la normalisation. Par conséquent, les disques WORM de 12 pouces ne sont pas interchangeables. Tirant les leçons de cette expérience, les leaders de l'industrie ont adopté une approche plus coopérative avec d'autres formats de disques de données numériques optiques et ont atteint une plus grande standardisation technique.

        Par exemple, les formats de disques de données numériques optiques de 5,25 pouces de diamètre et plus petits sont de plus en plus populaires en raison de plusieurs facteurs : des capacités de stockage de données supérieures, des coûts réduits pour les lecteurs optiques et les supports, des juke-box hautes performances et des normes industrielles largement acceptées. Les partisans du CD-R pensent que la capacité de stockage actuelle d'environ 600 mégaoctets pour les disques de 4,72 pouces augmentera considérablement. Les observateurs de l'industrie s'attendent à ce que la capacité de stockage accrue, les coûts inférieurs pour l'équipement et les supports, ainsi que la capacité d'échange offerte avec les CD-R, en feront le support optique de choix pour de nombreuses applications. Néanmoins, les disques optiques de données numériques WORM de plus grand diamètre sont susceptibles de continuer dans les environnements d'imagerie numérique à grande échelle. La recherche et le développement en laboratoire dans des domaines tels que les longueurs d'onde laser et la conception de têtes de lecture augmenteront encore les capacités et les performances de stockage des supports optiques. Ces efforts de recherche imposeront des exigences supplémentaires aux fabricants de supports optiques et de lecteurs pour continuer à améliorer les performances des produits. Les produits nouvellement introduits doivent être évalués en fonction de leurs capacités système uniques, de leur applicabilité aux besoins de l'agence et de leur conformité aux normes industrielles existantes.

        Le format de disque optique de données numériques WORM de 12 pouces était le support prédominant sur les 15 sites d'agences fédérales étudiés. Par exemple, le système d'imagerie Superfund de l'Environmental Protection Agency utilise un support WORM de 12 pouces à l'appui de la compilation, de la conservation et de la distribution des rapports de recouvrement des coûts et des documents juridiques associés au nettoyage des sites de déchets toxiques hautement prioritaires. La Federal Communication Commission utilise des disques optiques de données numériques WORM de 12 pouces pour stocker et récupérer les enregistrements officiels des affaires réglementaires et judiciaires des agences.

        En comparaison, plusieurs agences visitées utilisent plus d'un format de disque optique de données numériques. La Commodity Futures Trading Commission, par exemple, utilise la technologie WORM 12 pouces et la technologie multifonction 5,25 pouces (WORM et MO) au sein d'une plate-forme d'imagerie pour les clips d'actualités et les dossiers juridiques des agences. Un autre exemple est le système PERMS du ministère de l'Armée. Le site de conversion PERMS stocke les images numériques numérisées sur des disques magnéto-optiques réinscriptibles de 5,25 pouces. Ces données d'image sont ensuite transférées sur des disques optiques de données numériques WORM de 12 pouces pour un accès de récupération de juke-box. Aucun site d'agence interrogé n'utilisait de support WORM de 14 pouces.

        Le tableau 3 illustre les données recueillies lors des 15 visites de sites des agences fédérales concernant les tailles de disque, les méthodologies d'enregistrement et les dates de démarrage du système. Plus de la moitié des sites visités ont installé leurs systèmes de disques optiques de données numériques WORM de 12 pouces depuis 1990, le format magnéto-optique réinscriptible ayant connu une croissance en 1991㫴. Les administrateurs de programmes des agences fédérales ont noté que la sélection de critères fonctionnels critiques du système, tels que le format de disque optique de données numériques ou la technologie d'enregistrement de données, est basée de manière optimale sur une analyse des besoins de l'organisation et des utilisateurs finaux.

        Tableau 3. Taille du disque optique de données numériques/Méthodologie d'enregistrement
        Date de début du système VER 12 pouces VER 5,25 pouces 5,25 pouces MO (réinscriptible)
        1985-1988 3 0 0
        1989 1 0 0
        1990 3 0 0
        1991 3 0 2
        1992 2 1 2
        1993 0 1 1
        Totaux 12 2 5

        Sur la base d'une analyse des exigences et d'une étude de conception de systèmes des opérations d'une agence, sélectionnez le facteur de forme de stockage optique de la taille la plus appropriée qui satisfasse les besoins programmatiques à long terme de l'agence et se conforme aux normes de l'industrie.

        Systèmes de stockage de juke-box

        Un juke-box automatise le stockage et la récupération des disques optiques de données numériques. Les systèmes d'imagerie numérique avec seulement quelques disques ou des demandes de référence minimales peuvent s'appuyer à la place sur une configuration en tour à plusieurs lecteurs, un système de cartouches ou même le chargement manuel de supports optiques individuels dans des lecteurs optiques autonomes. Les facteurs à prendre en compte dans le choix d'un juke-box incluent les taux de croissance des données prévus, les besoins de récupération d'informations de l'agence et les coûts d'acquisition et de maintenance du système. Un système de stockage de juke-box est particulièrement utile dans les environnements d'accès public pour éviter les risques de dommages ou de vol inhérents à la sélection, l'insertion et le reclassement manuels de disques optiques de données numériques. Les avantages des juke-box incluent l'élimination du chargement manuel des disques, une sécurité physique accrue pour les disques de données numériques optiques et un accès utilisateur amélioré. À l'inverse, les inconvénients des juke-box incluent les coûts d'acquisition du système, une maintenance matérielle supplémentaire et un accès aux informations plus lent par rapport à la technologie de stockage magnétique.

        Les juke-box contiennent un ou plusieurs lecteurs optiques internes, un "sélecteur" ou un sélecteur de disque, mécanisme d'un nombre spécifié de bacs ou de fentes de stockage de disque et de contrôleurs d'interface système informatique. Des alignements mécaniques précis du juke-box interne sont nécessaires pour éviter d'endommager le support optique. Les données d'identification du disque sont lues lors du chargement et enregistrées dans la mémoire du contrôleur. Le disque optique de données numériques est ensuite transporté vers un emplacement ou un bac de stockage de juke-box disponible. Lors du traitement d'une requête d'utilisateur, le logiciel de base de données du système informatique fait automatiquement correspondre la requête à un emplacement de disque de données numériques optiques. Le mécanisme de sélection de disque du juke-box délivre le disque optique de données numériques demandé à un lecteur optique disponible. Après les opérations de lecture/écriture de données, le disque optique de données numériques est automatiquement remis dans son bac préaffecté. Ces étapes opérationnelles sont normalement invisibles pour les utilisateurs finaux.

        Les systèmes Jukebox peuvent être obtenus pour toutes les tailles de supports optiques existantes, bien que les formats 5,25 pouces et 12 pouces soient actuellement les plus demandés. Une variante du juke-box pleine taille est le juke-box de magasin, prenant en charge moins de plateaux optiques dans des magasins ou des cartouches amovibles de type modulaire. Ces systèmes peuvent être rentables pour les applications d'imagerie de petite à moyenne taille. Le mécanisme de sélection de disque de type cartouche est généralement plus rapide qu'un juke-box pleine taille, et le matériel prend en charge la lecture/écriture des deux côtés du support optique sans qu'il soit nécessaire de retourner physiquement le disque. Bien que plusieurs juke-box plus petits puissent être liés ou enchaînés, les applications à grande échelle des agences fédérales doivent toujours évaluer les juke-box hautes performances pleine grandeur.

        Une autre alternative envisageable à un juke-box est un réseau de plusieurs lecteurs autonomes chargés de disques de données numériques optiques en rotation continue. Cette configuration répond presque immédiatement aux demandes des utilisateurs d'informations stockées optiquement, limitées uniquement par l'accès aux données et les taux de transfert du lecteur optique. Les inconvénients de ces configurations à disques multiples et à disques dédiés sont l'augmentation des coûts d'achat de matériel, l'espace au sol de la salle informatique et les coûts de maintenance des équipements plus élevés.

        Les jukebox sont utilisés dans la plupart des 15 sites d'agences fédérales visités pour ce rapport. Un exemple est le Bureau des brevets et des marques, qui utilise une série de juke-box pour stocker des images 300 dpi pour répondre aux besoins d'impression de l'agence, complétés par des lecteurs de disque à accès rapide stockant des images 150 dpi. En comparaison, la Commodity Futures Trading Commission a des exigences de référence plus faibles et a par conséquent installé une librairie de disques optiques à magasin multi-cartouches. Plutôt que d'obtenir un juke-box, le système de capture de documents de l'armée a utilisé avec succès une configuration de tour multidrive pour les disques de données numériques optiques réinscriptibles. Les sites visités qui manquent d'équipement de juke-box attribuent cette condition à des problèmes d'approvisionnement ou à des contraintes budgétaires.

        Lors de la sélection d'un juke-box à disques de données numériques optiques, tenez compte des facteurs suivants : les besoins généraux d'accès à l'information (personnel et public), les considérations budgétaires et d'approvisionnement, et les besoins en personnel d'exploitation existant.

        Détection et correction des erreurs

        La technologie des disques optiques de données numériques utilise deux méthodes pour minimiser les erreurs d'enregistrement et de récupération des données numériques. Le premier utilise de puissants codes de correction d'erreurs algorithmiques pour détecter et corriger automatiquement les erreurs de lecture des données. La seconde technique utilise un logiciel de code de correction d'erreurs pour déterminer si et quand l'utilisation des codes de correction d'erreurs approche d'un point critique. Si tel est le cas, le secteur de données est automatiquement réécrit dans un autre secteur sur le disque optique de données numériques appelé zone de secteur de réserve.

        Les puces informatiques de détection et de correction d'erreur (EDAC) dans le sous-système électronique du lecteur optique surveillent régulièrement les informations sur les taux d'erreur bruts non corrigés et assurent une correction automatique. Le système EDAC contrôle également la gravité de la correction requise. Lorsque la correction d'erreur atteint ou dépasse certains seuils, le secteur en erreur est copié dans une autre zone et les tables appropriées sont mises à jour. Malheureusement, le système EDAC du lecteur de disque ne fournit pas toujours un avertissement avancé d'une opération de copie imminente vers le système d'exploitation de l'ordinateur. Pour les utilisateurs, et même pour le système informatique lui-même, tout peut paraître normal alors qu'en fait les seuils d'erreur pour invoquer la copie automatique (réaffectation) peuvent être invoqués lors de la prochaine opération de lecture. Si le taux d'erreur devait augmenter brutalement, comme dans le cas d'un nouveau défaut sur le support, la disponibilité de secteurs de réserve pour les opérations de copie de disque de données numériques optiques pourrait être sérieusement affectée. Cette situation peut conduire à une incapacité permanente à récupérer les données stockées optiquement. Les informations sur l'état de la correction d'erreur fournissent également une piste d'audit pour mesurer la progression et le degré de dégradation des données.

        Le comité C21 (Applications de disques optiques) de l'Association for Information and Image Management (AIIM) travaille avec les utilisateurs de disques de données numériques optiques et les fournisseurs de disques pour développer un ensemble standardisé d'outils pour surveiller et signaler les erreurs de support au système. Ces outils de surveillance et de rapport d'erreurs de support peuvent être utilisés par les utilisateurs pour surveiller une éventuelle dégradation des données. Ces efforts ont conduit à la proposition de norme nationale ANSI/AIIM MS59-199X intitulée Utilisation des techniques de surveillance et de rapport d'erreur de support pour la vérification des informations stockées sur des disques optiques de données numériques. Il est essentiel de prédire le point auquel un disque optique de données numériques n'est plus lisible afin que les données puissent être recopiées à temps. La norme ANSI/AIIM MS59 proposée fournit un ensemble d'outils de surveillance et de rapport d'erreur de support de disque de données numériques optiques qu'un utilisateur ou un intégrateur de système peut utiliser pour concevoir un utilitaire qui permettrait à l'utilisateur d'obtenir des informations sur les erreurs de support. Le comité AIIM C21 élabore également un rapport technique qui fournira des directives sur la façon d'utiliser les outils inclus dans ANSI/AIIM MS59.

        Les 15 visites sur site ont révélé qu'aucune information n'est systématiquement fournie aux administrateurs système détaillant dans quelle mesure les mécanismes automatisés de détection et de correction des erreurs sont invoqués pendant les opérations de lecture ou d'écriture du disque optique de données numériques. Une grande majorité d'administrateurs système ont indiqué qu'ils n'avaient pas une compréhension approfondie de l'utilisation de la capacité de détection d'erreurs fournie par le fabricant de l'équipement. Aucune perte d'informations stockées sur les supports optiques n'a été attribuée aux sous-systèmes de correction d'erreurs.

        Exiger que l'équipement soit conforme à la norme nationale proposée ANSI/AIIM MS59-199X, « Utilisation des techniques de surveillance et de rapport d'erreurs de support pour la vérification des informations stockées sur des disques de données numériques optiques ».

        Interface de petits systèmes informatiques

        L'interface des petits systèmes informatiques (SCSI) est l'un des développements de composants système les plus importants de ces dernières années. Le SCSI est la principale interface de communication utilisée dans les systèmes de disques de données numériques optiques. Le comité X3T9.2 de l'American National Standards Institute (ANSI) a développé l'interface parallèle intelligente pour le transfert d'informations vers et depuis des périphériques de stockage de masse tels que des bandes, des disques magnétiques et des lecteurs de disques optiques. C'est le mécanisme principal qui permet aux lecteurs optiques et autres périphériques de différents fabricants de communiquer librement entre eux. Bien que cette norme soit complète, de nombreux facteurs de mise en œuvre spécifiques de la méthode d'accès SCSI relèvent de la responsabilité des entreprises locales d'intégration de systèmes. Cette situation se traduit par des incompatibilités au niveau logiciel entre les lecteurs de disques des différents fabricants.

        La commande "Write and Verify" disponible dans le SCSI est une commande particulièrement utile pour évaluer la vérification des erreurs. Cette commande peut aider à garantir que des données précises sont écrites sur le disque optique de données numériques pendant le processus d'enregistrement initial. Dans le jargon SCSI, lorsque la commande « Write and Verify » est invoquée, elle nécessite que le périphérique cible (généralement la carte contrôleur du lecteur optique) écrive les données transférées depuis le périphérique initiateur (généralement l'unité centrale ou l'UC) sur le support et puis vérifiez que les données sont correctement écrites. La technologie des disques optiques de données numériques (y compris l'interface SCSI) ne s'est pas stabilisée au point qu'une « taille unique convient à tous ». L'existence de normes d'interface telles que SCSI-1 et SCSI-2 ne signifie pas nécessairement que toutes les interfaces SCSI seront compatibles. Un système de stockage de masse optique correctement conçu peut surmonter ce problème en incluant soit une capacité de communication à grande vitesse, soit un lecteur de bande magnétique avec un logiciel associé.

        Les données recueillies lors des visites sur site de l'agence fédérale ont indiqué que les détails techniques concernant la mise en œuvre du SCSI relèvent généralement de la responsabilité de l'intégrateur de systèmes. Les responsables de programme sont capables d'utiliser des systèmes de stockage de supports optiques sans aucune connaissance opérationnelle approfondie de SCSI. Aucune perte de fonctionnalité du système n'était attribuable à une interface SCSI particulière utilisée.

        Spécifiez la commande SCSI « Write and Verify » lors de l'écriture de données sur des disques de données numériques optiques.

        Exiger des fabricants de systèmes et des intégrateurs qu'ils fournissent une documentation complète sur la configuration spécifique du matériel et du logiciel SCSI (ou autre interface).

        Rétrocompatibilité des systèmes optiques

        Contrairement aux formats analogiques de papier ou de microfilm, les disques de données numériques optiques sont codés numériquement et ne sont pas « lisibles par l'homme », ce qui nécessite un accès continu à un équipement de récupération spécialisé. Par conséquent, un équipement de récupération compatible sera nécessaire aussi longtemps que les données doivent être accessibles. L'obsolescence technologique est un obstacle majeur à l'accès aux données numériques dans le temps. La rétrocompatibilité minimise l'impact de l'obsolescence lors de l'acquisition de systèmes de stockage d'informations nouveaux ou de remplacement, garantissant que les informations stockées par un ancien système de stockage numérique peuvent être lues, converties et intégrées dans la nouvelle génération.Étant donné que la durée de vie utile de la plupart des composants informatiques est limitée, les administrateurs d'agence sont responsables du transfert des données numériques vers tous les systèmes nouvellement acquis.

        Les 15 visites du site ont révélé que les problèmes de compatibilité descendante ne sont pas une préoccupation majeure. L'Office des brevets et des marques, le premier à avoir adopté la technologie de stockage optique interrogé, a réussi à « migrer » les données d'image d'une ancienne génération de disques de données numériques optiques vers une plus récente. Cette migration a été partiellement accomplie en convertissant un système de réseau propriétaire en un environnement de systèmes ouverts dans lequel les anciens contrôleurs d'entraînement (lorsqu'ils ont été mis à niveau) pouvaient communiquer avec le programme d'applications de la même manière que les systèmes d'entraînement plus récents. Une fois que les lecteurs optiques de nouvelle génération sont devenus opérationnels, il était alors possible de copier ou de charger les informations stockées sur les anciens supports sur les supports de technologie plus récente. Les administrateurs du programme ont noté que la réussite de la migration des données nécessite une planification de haut niveau et des prévisions technologiques critiques pour être efficace. Un architecte système interne, ou « visionnaire », est important pour s'assurer que les processus existants et de remplacement sont compatibles.

        Exiger des mises à niveau ou des systèmes de remplacement pour être rétrocompatibles avec les systèmes d'information existants.

        Convertissez les informations numériques existantes au nouveau format au moment de la mise à niveau ou de l'acquisition du système.

        Longévité des disques de données numériques optiques

        La longévité est définie dans ce rapport comme l'espérance de vie utile des disques optiques de données numériques avant écriture (pré-écriture), plus la durée de vie estimée des données après écriture. La plupart des fabricants de disques optiques de données numériques garantissent une durée de conservation minimale avant écriture de 5 ans, ce qui est considéré comme suffisant pour la plupart des programmes utilisant des contrôles d'inventaire des fournitures. Une espérance de vie post-écriture d'au moins 20 ans devrait être requise.

        Bien que la Commission technique mixte (JTC) de l'IT9-5 Committee of Image Permanence (qui est une organisation accréditée ANSI) et l'Audio Engineering Society (AES) élaborent ensemble des normes pour déterminer l'espérance de vie (LE) des systèmes de supports optiques, à à l'heure actuelle, il n'y a pas de normes approuvées pour LE. Les affirmations du fabricant concernant la longévité des disques de données numériques optiques, en particulier après l'écriture, doivent être soigneusement analysées. Étant donné que les valeurs d'espérance de vie extrapolées peuvent varier considérablement en raison d'hypothèses, d'approches et de méthodologies d'essai différentes, il est particulièrement important de déterminer la base du processus d'essai du fabricant. Cette détermination doit inclure une évaluation des données de fabrication, de la méthodologie de test, des procédures de test et des résultats de test basés sur les découvertes décrites dans le NIST SP-200. La nature de cette analyse nécessite que des utilisateurs techniquement qualifiés évaluent de manière adéquate les procédures de test, les résultats et d'autres critères. Idéalement, tous les résultats de test de vieillissement accéléré annoncés sont basés sur des tests de zones spécifiques (extérieur, milieu et intérieur), plutôt que sur une lecture moyenne de toute la surface du disque de données numériques optiques. Cette question importante restera une préoccupation jusqu'à ce qu'une méthodologie de test de référence standard à l'échelle de l'industrie pour les disques optiques de données numériques soit largement adoptée. Un groupe de travail conjoint de l'ANSI et de l'Audio Engineering Society a élaboré un projet de norme qui propose une méthodologie de test standard pour prédire l'espérance de vie des supports CD-ROM.

        Lors de l'enquête sur les 15 sites de l'agence, aucun problème d'enregistrement de données numériques ou de recherche d'informations lié à la longévité des supports optiques n'a été signalé. Étant donné qu'une majorité des 15 systèmes visités n'ont été installés qu'en 1990 ou plus tard, des problèmes de durée de conservation ou de longévité post-écriture n'étaient pas attendus. Les problèmes isolés lors de la récupération d'informations, s'ils surviennent à un stade aussi précoce, pourraient être mieux étudiés en tant que défauts de fabrication (ou défauts d'entretien ou de manipulation) dans des disques optiques de données numériques spécifiques.

        En plus d'effectuer une analyse minutieuse des méthodologies et procédures de test de la durée de vie des supports de chaque fabricant, il faut utiliser des disques de données numériques optiques avec une durée de conservation avant écriture d'au moins cinq ans.

        Exiger une durée de vie post-écriture minimale de vingt ans sur la base des tests d'espérance de vie des disques de données numériques optiques du fabricant conformes aux conclusions du NIST SP-200.

        Substrats de disques de données numériques optiques

        Le substrat d'un disque optique de données numériques constitue la base de base du support optique. Les substrats optiques nécessitent une fabrication de précision utilisant des matériaux tels que le polycarbonate et le verre trempé. Le choix des matériaux par le fabricant dépend de plusieurs facteurs : avantages en termes de coûts, stockage des données, caractéristiques de longévité et durabilité du support. Les informations enregistrées sur l'un de ces substrats sont susceptibles de survivre aux composants matériels et logiciels du système, en supposant que les disques optiques de données numériques sont fabriqués conformément aux spécifications indiquées et conservés dans des conditions de stockage environnementales contrôlées.

        Le verre trempé et le polycarbonate étaient les matériaux de substrat observés dans les 15 sites des agences fédérales étudiés. Les gestionnaires de programmes fédéraux ne semblent pas considérer les caractéristiques des substrats comme un facteur important dans la sélection des produits. Les agences fédérales permettent généralement à ces décisions techniques de rester avec les fabricants de médias individuels. Aucun problème de fonctionnement ou perte de données directement attribuable aux substrats de disque de données numériques optiques n'a été noté.

        Des substrats de disques de données numériques optiques en polycarbonate ou en verre optique trempé sont acceptables.

        Environnements de stockage de disques de données numériques optiques

        Les informations enregistrées sur des disques de données numériques optiques ne sont pas à l'abri de la dégradation causée par des environnements de stockage hostiles. Une humidité relative élevée peut oxyder les couches d'enregistrement d'un disque optique de données numériques et compromettre gravement la récupération d'informations. Les normes actuelles pour l'environnement de stockage sont basées sur le stockage de supports magnétiques, ou plus précisément, de bandes magnétiques. Généralement, les mêmes conditions conviennent aux supports optiques, mais quelques mises en garde s'imposent. Les supports optiques ne peuvent généralement pas tolérer des fluctuations rapides de température sur de larges plages. Des fluctuations de température très rapides peuvent entraîner la séparation partielle de certains supports optiques, ce qui permet à l'humidité de pénétrer entre les couches de substrat. De plus, les supports optiques doivent être stabilisés en température avant utilisation. Une humidité élevée peut également favoriser la croissance de moisissures sur les surfaces des disques optiques de données numériques. Idéalement, l'humidité relative ne doit pas dépasser 50 pour cent (une valeur inférieure est acceptable), avec une température ambiante ne dépassant pas 75 degrés Fahrenheit. La capacité à maintenir des conditions environnementales stables est plus importante que tout réglage de température et d'humidité prédéterminé.

        Les systèmes de disques optiques de données numériques ne doivent pas être utilisés, ou les disques individuels stockés, sous des niveaux élevés de poussière, de saleté ou d'autres matières particulaires. Cela s'applique aux particules de toner de carbone en suspension dans l'air libérées par les imprimantes laser et les photocopieuses électrostatiques. L'accumulation de particules de poussière sur les surfaces des supports optiques peut réduire la capacité de la diode laser à détecter les différences de réflectivité. Si les disques de données numériques optiques doivent être nettoyés pour éliminer la contamination telle que la poussière, les particules ou les empreintes digitales, cela ne doit être tenté que dans le strict respect des directives du fabricant. Des techniques de nettoyage de disque inappropriées peuvent entraîner des dommages permanents au support optique. Si le fabricant du support optique recommande le nettoyage du disque, suivez les procédures suggérées par le fabricant.

        Il n'est pas toujours possible de faire fonctionner des systèmes d'imagerie numérique ou de stocker des disques optiques de données numériques dans des conditions environnementales optimales. Par exemple, le système de capture de documents de l'Armée de terre scannait les dossiers et stockait les données sur des cartouches de bandes audionumériques (DAT) dans des conditions de terrain extrêmement défavorables. Bien que les données d'image aient finalement été renvoyées aux États-Unis, l'expérience de l'armée fournit un exemple des extrêmes dans lesquels la technologie d'imagerie numérique peut être utilisée (bien que de tels extrêmes ne soient pas préférables).

        L'Office des brevets et des marques a connu une dégradation progressive de la capacité de son système à accéder aux données d'image stockées optiquement. Des erreurs de lecture de données ont été diagnostiquées et attribuées à des particules de poussière et de saleté sur les surfaces des supports optiques. Une analyse plus poussée du problème a indiqué que la source de la matière particulaire était les imprimantes laser du système. Les particules de toner de carbone et la poussière de papier générées lors du fonctionnement normal de l'imprimante laser ont finalement causé des erreurs de lecture du disque. Le déplacement des imprimantes laser a éliminé le problème.

        Des recherches connexes de la NARA indiquent que ce problème de poussière et de saleté existe également dans d'autres technologies optiques. Les lecteurs de CD-ROM installés dans des zones d'environnement autres que les bureaux, tels que les entrepôts, les ateliers de réparation et les chantiers de construction, sont vulnérables. Dans ces environnements, un nettoyage de routine des disques et du mécanisme d'objectif du lecteur peut être nécessaire. Dans tous les cas, l'équipement optique doit être installé dans l'environnement le plus propre disponible et la maintenance préventive doit être effectuée conformément aux recommandations du fabricant de l'équipement.

        Les disques optiques de données numériques doivent être stockés dans des zones avec des températures ambiantes stables et des plages d'humidité relative compatibles avec le stockage de supports de bande magnétique. Évitez les zones de stockage avec une humidité excessive et des températures élevées, et ne soumettez pas les disques optiques de données numériques à des températures extrêmes rapides.

        Si possible, n'utilisez pas les systèmes et ne stockez pas de disques optiques de données numériques dans des environnements contenant un excès de particules en suspension dans l'air.

        Les procédures de nettoyage des disques optiques de données numériques doivent être strictement conformes aux recommandations du fabricant du support.

        Section 7 : Recherche d'informations

        Fournir aux utilisateurs un accès pratique et inclusif aux données d'image et d'index stockées est un objectif fondamental des systèmes de stockage et de récupération d'informations. Les agences fédérales reconnaissent les avantages inhérents aux systèmes d'imagerie numérique et de stockage de données optiques numériques sur disque pour :

        • Améliorer la conservation des documents originaux,
        • Réduction des coûts de stockage des documents et
        • Améliorer la recherche d'informations.

        Étant donné que les documents papier originaux sont exposés au risque de vol, de dommages physiques et de mauvais classement lors de la référence de l'utilisateur, les images électroniques numérisées offrent une mesure supplémentaire de contrôle des documents. En outre, les coûts de stockage peuvent être réduits en transférant les enregistrements originaux rarement consultés hors des espaces de bureau de premier ordre coûteux.

        Le sous-système de récupération est le principal point de contact de l'utilisateur avec le système de stockage optique sur disque de données numériques, et est généralement la seule connexion qu'un chercheur typique a avec le système d'imagerie. Il est crucial que le composant d'interface utilisateur du système d'imagerie soit puissant mais facile à comprendre et à prendre en charge les exigences d'accès à l'information du chercheur. La récupération d'informations comprend la recherche dans la base de données d'index, l'identification du fichier image et la création d'une copie papier ou électronique (c'est-à-dire un affichage à l'écran) pour la visualisation.

        Selon la nature des opérations de l'agence et la classification des informations stockées, l'accès aux informations stockées numériquement peut devoir être restreint. Ces restrictions peuvent être instituées par le biais de contrôles du logiciel système liés aux mots de passe ou aux codes d'identification de l'utilisateur ou aux deux. Ces contrôles peuvent être institués sur site et, dans le cas des systèmes d'imagerie dotés de capacités de télécommunications, hors site. Les administrateurs système peuvent également imposer des contraintes physiques, telles qu'interdire au grand public d'accéder personnellement aux postes de travail du système, et différents niveaux de restrictions logicielles, telles que permettre à certaines personnes autorisées d'accéder à des données d'index ou d'images spécifiques. Les contrôles logiciels peuvent également restreindre les types d'opérations que des utilisateurs spécifiques peuvent effectuer. Ainsi, un utilisateur ou un groupe d'utilisateurs donné peut être autorisé à accéder à certains enregistrements de la base de données mais pas à d'autres de la même manière, ces autorisations peuvent s'étendre à la récupération des informations de la base de données mais pas à la possibilité de modifier les données.

        Afin de récupérer un fichier d'image numérique, une recherche d'index doit être effectuée sur la base de la base de données d'index existante. Le logiciel de base de données est utile pour gérer les index de fichiers d'images, en s'appuyant sur des champs de données clés interrogeables avec l'aide de divers opérateurs de recherche booléens (tels que AND, OR et NOT) pour augmenter le processus de recherche. Les résultats d'une recherche réussie (lorsqu'au moins un fichier répond aux critères de recherche) sont généralement fournis dans une liste de résultats, le chercheur étant libre de sélectionner les images souhaitées pour la visualisation ou l'impression. Le chercheur peut également choisir de continuer à affiner le processus de recherche en utilisant le logiciel de base de données avant de récupérer réellement l'une des images stockées numériquement.

        Les systèmes optiques de disques de données numériques utilisent fréquemment une mémoire tampon de disque magnétique temporaire pour stocker des images localement. A la demande de l'utilisateur, les images numériques sont transférées des disques optiques de données numériques vers des tampons de stockage temporaires (primaires). Les images sont ensuite automatiquement mises en file d'attente vers les tampons de stockage de cache du poste de travail local ou du serveur d'impression, libérant le sous-système de support optique pour accepter d'autres demandes d'utilisateur ou exécuter d'autres fonctions. Pour accélérer la réponse apparente du système et permettre aux utilisateurs de commencer la référence dès que possible, le sous-système de récupération peut transmettre et afficher la première image d'un fichier tandis que les autres images sont ensuite transférées vers le poste de travail du demandeur. Le tampon de cache du poste de travail local, qui peut être soit un disque dur magnétique, soit un stockage en mémoire vive (RAM), fournit un site de stockage d'images pour la décompression d'images et facilite une réponse plus rapide au "tournage de page".

        Un poste de travail prenant en charge l'image est défini comme tout terminal équipé d'un écran d'affichage qui restitue une représentation d'une image de document. Un poste de travail d'imagerie est le principal outil de référence utilisateur dans un système basé sur l'image numérique. Puisqu'une image numérique peut être efficacement affichée et apparaître comme un fac-similé du document papier original, un système de référence sans papier est théoriquement possible. En réalité, cependant, de nombreux utilisateurs demanderont toujours des impressions papier (si disponibles), au moins jusqu'à ce qu'ils atteignent un niveau de confort avec les moniteurs d'affichage du système d'imagerie. La résolution d'affichage de l'écran est similaire à la résolution de numérisation, basée sur le nombre de lignes qui détermine la lisibilité de l'image. Du point de vue de l'acquisition du système, à mesure que la qualité d'affichage des images augmente, le coût unitaire du poste de travail augmente également. Étant donné que l'affichage d'images à l'écran peut ne pas être suffisant pour toutes les applications, pratiquement tous les systèmes d'images numériques nécessitent une capacité de sortie papier. L'équipement d'impression le plus courant est de loin la technologie d'impression laser, utilisant des composants similaires à ceux utilisés dans les copieurs électrostatiques, ce qui représente une technologie d'imagerie numérique éprouvée et fiable.

        Les systèmes d'imagerie numérique sont conçus pour répondre rapidement aux demandes d'informations des utilisateurs à l'aide d'affichages d'images haute résolution et d'impressions laser. L'industrie du stockage et de la récupération d'informations recherche et développe des technologies d'affichage et de sortie plus performantes pour inclure des écrans d'affichage de plus grande taille avec des capacités de résolution plus élevées, l'intégration de serveurs de fax sur le réseau, des imprimantes laser avec des qualités d'impression et des vitesses de sortie plus élevées, des techniques de compression d'image , les systèmes de sortie informatique sur disque laser (COLD) évoluant en remplacement des applications de microformes existantes, et la sortie informatique matricielle haute performance vers des enregistreurs de microfilms (COM).

        Postes de travail d'affichage d'images. L'une des principales préoccupations des concepteurs de systèmes et des utilisateurs est de déterminer le niveau exact de résolution d'écran qui est adéquat pour afficher lisiblement des images numériques. Bien que les moniteurs monochromes typiques fournis avec les ordinateurs personnels pour l'affichage de texte soient peu coûteux, ils n'ont pas une résolution suffisante pour afficher lisiblement une image numérique d'un document de bureau régénéré en taille réelle. Lorsque ces moniteurs basse résolution sont utilisés pour des systèmes d'imagerie numérique, la visualisation de zones d'image sélectionnées en mode zoomé ou agrandi doit être lisible.

        En règle générale, les écrans de moniteur sélectionnés pour les systèmes basés sur l'image ont un diamètre et une résolution d'écran suffisants pour afficher lisiblement un document de 8,5 sur 11 pouces en taille réelle, ce qui nécessite généralement une résolution d'affichage minimale de 100 dpi à la fois horizontalement et verticalement. Selon les caractéristiques des documents originaux, cette résolution d'écran d'affichage peut encore nécessiter des zooms fréquents sur l'image pour obtenir une lisibilité adéquate. Une résolution d'affichage plus élevée de 150 dpi à la fois horizontalement et verticalement est assez courante dans les systèmes d'imagerie et fournit un affichage lisible à l'écran, même de type 4 points, sans qu'il soit nécessaire de zoomer sur l'image. Un avantage supplémentaire de la technologie d'affichage plus large et à plus haute résolution est la possibilité d'afficher simultanément les données de caractères (index et système) et les données d'image.

        Il existe un certain nombre de processus qui peuvent être appliqués à une image numérique pour augmenter son utilité pour les utilisateurs. Dans la plupart des cas, les modifications d'image sont temporaires pour l'affichage uniquement et n'entraînent pas de modifications permanentes des fichiers image stockés. Les modifications permanentes des images prennent généralement la forme d'une retouche d'image qui implique l'ajout ou la suppression de pixels de l'image. Un exemple de modification temporaire de l'image est le dimensionnement de l'image, un processus qui fait référence à l'augmentation ou à la diminution de la taille de l'image par rapport aux dimensions physiques de l'écran d'affichage. Les images trop grandes pour être affichées complètement à l'écran peuvent être réduites à l'aide de la réduction de pixels, normalement effectuée de manière égale dans les dimensions horizontale et verticale pour éviter toute distorsion. Une technique pour afficher des images surdimensionnées sans recourir à la réduction de pixels utilise les capacités de défilement et de panoramique d'image, dans lesquelles l'écran n'affiche qu'une partie de l'image à la fois. Le chercheur effectue un panoramique horizontal ou fait défiler verticalement l'image à l'aide d'une souris ou des touches du curseur du clavier.

        Il est également possible d'afficher des parties sélectionnées d'images numériques à leurs résolutions de numérisation d'origine (par exemple, 200 dpi) sur des écrans d'affichage qui n'ont pas cette capacité de résolution spécifique. Cette fonction d'affichage est appelée agrandissement ou zoom d'image. Par exemple, si une image était numérisée à 200 dpi et affichée sur un écran de 100 dpi, le segment d'image serait agrandi d'un facteur deux dans les dimensions horizontale et verticale. Cela fournit un facteur de zoom effectif de 4:1 (dimensions x-y) et affiche tous les pixels numérisés pour cette fenêtre d'image spécifique.

        Une autre caractéristique d'altération visuelle est la possibilité de commuter sélectivement l'apparence positive et négative des images numériques. C'est-à-dire que le chercheur peut passer du format d'écran normal de caractères noirs et d'arrière-plan blanc à un mode inversé d'arrière-plan blanc sur noir. Ce processus est effectué électroniquement en modifiant les pixels numériques 1 et 0, et est particulièrement utile lors de la numérisation à partir de microformes d'apparence négative ou de photostats vieillis. un nombre de degrés prédéterminé ou variable.

        Imprimantes d'images numériques. Pratiquement tous les systèmes d'imagerie numérique ont une capacité intégrée pour produire une sortie papier. La qualité d'impression laser est supérieure à d'autres technologies d'impression telles que la matrice de points, le jet d'encre et autres.Les imprimantes laser sont la technologie d'impression la plus courante pour les systèmes d'imagerie, utilisant un faisceau laser ou une autre source lumineuse pour créer une image temporaire sur une surface photosensible. Des particules de toner électrostatiques sont appliquées à cette image temporaire et ensuite transférées et thermofusionnées sur une feuille de papier. À l'instar des scanners et des écrans de terminaux d'affichage, la résolution de l'image est un facteur critique de qualité d'image d'impression. La grande majorité des imprimantes laser sont actuellement basées sur une résolution de 300 dpi, tandis que les imprimantes laser plus récentes offrent une résolution de 400 dpi et plus. Si la résolution de numérisation d'origine correspond à la sortie de l'imprimante (c'est-à-dire 300 dpi), l'impression sera un simple processus d'échelle un à un. Cependant, si la résolution de numérisation est différente, la mise à l'échelle de l'image numérique est requise pour se synchroniser avec la résolution de l'imprimante. Les développements récents des composants du contrôleur d'imprimante laser peuvent améliorer considérablement la qualité et la résolution d'impression en modifiant la taille ou l'emplacement des points pour réduire l'apparence des lignes en escalier ou en escalier, imprimer à des résolutions supérieures à 300 ppp et imprimer de véritables demi-teintes. .

        Une autre considération est la vitesse de l'imprimante, généralement exprimée en pages par minute (ppm). Les imprimantes bas de gamme sont généralement évaluées à 7 à 8 pages par minute, les imprimantes de milieu de gamme peuvent atteindre 20 pages par minute et les imprimantes à grande vitesse peuvent produire plus de 100 pages par minute. La vitesse de l'imprimante est fonction de nombreux facteurs interdépendants, les performances de stockage de la mémoire tampon d'image étant un problème important. Étant donné que l'équipement d'impression ne peut imprimer que les données numériques dont il dispose, la mémoire tampon d'image peut influencer la quantité et la vitesse de sortie du processus de production d'impression. Les sérigraphies sont utiles pour fournir à un chercheur un "instantané" du contenu de l'écran d'affichage. Les utilisateurs trouvent cette capacité avantageuse lorsqu'ils utilisent un grand écran d'affichage qui fournit simultanément des données d'index et d'image. Les sérigraphies fournissent un enregistrement unifié de l'image numérique et des informations d'index associées.

        Logiciel d'applications de récupération. Cet élément vital des systèmes d'imagerie contribue également à l'amélioration du flux de travail en cours et de la sortie des données. Les processus du système d'imagerie numérique contrôlés par logiciel incluent les communications de données, la capture d'images et la gestion des flux de travail, la création d'index et de bases de données et la gestion du système. Le logiciel de flux de travail du système contrôle toutes les phases de la capture, du suivi, du routage, de l'indexation, de la récupération et de l'impression des images de documents. Un logiciel d'amélioration d'image permet la manipulation d'images pour améliorer la lisibilité et réduire la taille des fichiers numériques. Le logiciel d'affichage d'images de poste de travail permet de contrôler l'image pour des fonctions telles que le zoom, la rotation et le défilement, ainsi que les formats d'écran à plusieurs pages.

        Les sites des agences fédérales visités pour ce rapport étaient généralement équipés de composants matériels et logiciels de recherche d'informations adaptés aux applications prévues. Par exemple, les systèmes de capture et d'affichage d'images de documents étaient équipés de moniteurs d'affichage haute résolution et de matériel d'impression, tandis que les systèmes de stockage de données ASCII nécessitent des composants de récupération légèrement différents.

        Écrans haute résolution : Douze des quinze systèmes d'agences fédérales visités numérisent des documents et visualisent les images sur des écrans d'affichage d'une résolution de 114 à 150 dpi. La dimension prédominante de l'écran est de 19 pouces (diagonale), permettant l'affichage simultané de deux images numériques côte à côte.

        Affichages de données textuelles : Deux des systèmes visités qui capturent, stockent et récupèrent des données textuelles numériques (sans image) utilisent des terminaux d'affichage informatiques conventionnels de type caractère. Les terminaux d'affichage d'images à résolution plus élevée (et à coût plus élevé) sont inutiles pour ces applications.

        Affichage en niveaux de gris : Le National Earthquake Information Center (NEIC) de l'US Geological Survey utilise une technologie d'affichage comportant 800 x 1 000 pixels et 256 nuances de gris. Ces stations de travail prennent en charge l'affichage de plus haute résolution et des détails plus fins du format de données d'image numérique NEIC 24 bits.

        Impression laser : Les imprimantes laser étaient les périphériques de sortie de choix pour la majorité des systèmes visités. L'impression laser offre la possibilité d'imprimer des données d'image raster ainsi qu'une capacité de polices multiples. Les systèmes non équipés d'imprimantes laser utilisent des imprimantes informatiques classiques à impact.

        Sortie COM : le système PERMS du Département de l'armée de terre propose plusieurs options de sortie : l'ensemble du dossier personnel d'un soldat (ou des parties sélectionnées de celui-ci) peut être recréé à partir des disques de données numériques optiques à l'aide d'imprimantes laser, d'un enregistreur de microfiches ou d'une bande magnétique. L'enregistreur de microfiches PERMS produit un film à une résolution de 300 dpi à un débit de production de 60 images par minute.

        Réseaux locaux (LAN) : la plupart des sites visités utilisent un réseau local (ou étendu) en tant que capacité intégrale du système. La connectivité des postes de travail va de quelques terminaux reliés en interne au système d'imagerie à un vaste réseau de centaines de postes de travail, tel que celui prévu par l'Office des brevets et des marques. Plusieurs des systèmes comportent des connexions réseau à des mini-ordinateurs ou à des systèmes informatiques centraux pour l'accès aux données d'index ou la distribution électronique de données d'images à des utilisateurs distants.

        Rédaction d'images : Le système REDAC du Département d'État permet la révision en ligne et l'édition électronique sélective des images des documents avant leur diffusion. Le traitement sélectif des images électroniques permet à la sortie du système d'être adaptée pour répondre aux exigences de sécurité de l'information.

        Effectuer une analyse complète des besoins des utilisateurs finaux en matière d'accès à l'information et une étude de conception des systèmes avant d'acheter des composants de système d'imagerie.

        Section 8 : Politique de gestion de l'information

        Afin de maximiser les avantages des technologies de stockage optique numérique, les administrateurs des agences fédérales doivent prendre en compte quatre questions importantes de politique de gestion de l'information : (1) lier les technologies de disque optique de données numériques à une prestation de services plus efficace et moins coûteuse aux citoyens, (2) disposition des documents originaux convertis en un format numérique et stockés sur des supports optiques numériques, (3) l'admissibilité légale des images numériques stockées sur des supports numériques optiques, et (4) l'accès à long terme aux informations stockées. Les données recueillies lors des visites dans les 15 agences fédérales ont révélé plusieurs approches différentes pour résoudre ces problèmes. Bien qu'il n'ait pas été spécifiquement demandé aux administrateurs d'agences d'évaluer la viabilité de l'admissibilité juridique des images numériques, il existe de nombreuses preuves que l'admissibilité juridique est un sujet de préoccupation considérable. En règle générale, les administrateurs d'agence ne considèrent pas l'accès à l'information à long terme comme un problème important à l'heure actuelle.

        Rentabilité

        La viabilité à long terme d'un système de stockage sur disque d'images numériques et de données numériques optiques est améliorée lorsque le système fournit une valeur visible pour l'investissement dépensé. En termes d'objectifs de l'examen national des performances, les systèmes d'imagerie numérique et de stockage de données optiques numériques sur disque peuvent fournir des services d'information améliorés aux citoyens à moindre coût. Certes, la conception efficace des systèmes et l'administration des programmes devraient être au cœur de tout système d'information sur les dossiers d'une agence fédérale.

        Un facteur clé dans le développement de systèmes efficaces est d'établir dès le début du processus de conception l'objectif du système d'imagerie numérique ou de disque optique de données numériques proposé et comment le système fournira un meilleur service à un coût réduit. Les pratiques d'information sur papier existantes et les besoins généraux d'information doivent être réexaminés afin d'identifier tout changement nécessaire dans les pratiques opérationnelles internes, les procédures ou les responsabilités du personnel. Un système d'enregistrements papier mal conçu ou maladroit est susceptible d'être difficile à manier lorsqu'il est converti directement sous forme électronique, en particulier lorsque les processus existants ne sont pas évalués et que les modifications ne sont pas adoptées.

        Les administrateurs des agences fédérales qui envisagent un système d'imagerie numérique doivent reconnaître que l'intégration de la technologie des disques optiques de données numériques n'est pas un palliatif automatique aux mauvaises pratiques de gestion des documents. Si les systèmes d'imagerie se contentent d'automatiser les procédures de contrôle des documents existantes, les problèmes opérationnels et les inefficacités préexistants persisteront. Les administrateurs d'agence doivent être prêts à adopter de nouveaux processus organisationnels pour améliorer considérablement les fonctions internes de l'agence qui peuvent être réalisées avec les nouvelles technologies. Généralement connue sous le nom de « réingénierie des processus métier », cette approche considère l'introduction de nouvelles technologies comme une opportunité de réévaluer les procédures opérationnelles préexistantes des bureaux, de maximiser les avantages d'un accès accru à l'information et de réduire les interruptions administratives et les coûts opérationnels. Un objectif global devrait être d'améliorer la réactivité d'une agence fédérale à son électorat en éliminant les processus manuels à forte intensité de main-d'œuvre, en améliorant les contrôles internes des documents et en améliorant les processus organisationnels internes. Tout système qui atteint cet objectif est susceptible de conserver une valeur durable.

        Les réponses des 15 visites de sites indiquent que les administrateurs des agences sont souvent disposés à envisager de modifier les procédures organisationnelles existantes si les avantages correspondants semblent réalisables. Les enquêtes ont montré une diversité de bénéfices, souvent directement proportionnelle au niveau d'engagement à subir un changement. Les avantages obtenus dépendaient souvent de la taille et de la configuration du système d'imagerie, ainsi que des attentes des administrateurs d'agence et des utilisateurs finaux. Les modifications des zones de flux de travail fonctionnels pour s'adapter aux nouveaux systèmes allaient d'ajustements mineurs dans le traitement des dossiers existants à une refonte complète des processus organisationnels de routine.

        Par exemple, la Federal Communications Commission a adopté des modifications aux procédures des agences concernant le traitement et la conservation des documents papier originaux et en double. La Bibliothèque du Congrès a repensé les opérations au sein de son unité de fichiers maîtres pour capitaliser sur les avantages offerts par la technologie d'imagerie et a réalisé une amélioration immédiate dans un traitement d'entrée plus rapide. Suite à l'intégration de l'imagerie, l'Agence des substances toxiques et du registre des maladies a connu un changement majeur dans la manière dont les scientifiques (les principaux utilisateurs de l'agence) mènent leurs travaux de recherche. Les améliorations apportées au flux d'informations ont éliminé les mises à jour manuelles des fichiers papier, offrant un meilleur accès à l'information à la communauté scientifique. Les avantages directs comprenaient l'accès à une base de données scientifique plus efficace, ce qui a finalement amélioré la réponse de l'agence en matière de santé publique aux électeurs.

        Afin de maximiser la viabilité à long terme des systèmes, développer des applications d'imagerie numérique et de disques de données numériques optiques de manière rentable.

        Dans la mesure du possible, lier la conception du système aux initiatives d'amélioration du gouvernement telles que l'examen national du rendement.

        Réexaminer les systèmes d'enregistrements papier existants avant la conversion en systèmes de disques de données numériques optiques afin de maximiser la productivité et d'améliorer la prestation des services d'information.

        Disposition des documents originaux

        La disposition des dossiers fédéraux est régie par les règlements émis par la National Archives and Records Administration (NARA). Les dossiers ne peuvent pas être détruits ou autrement éliminés sans l'autorisation de l'archiviste des États-Unis. Cette autorisation est accordée par l'approbation d'un calendrier de disposition des documents ou l'émission d'un calendrier général des dossiers. L'approbation des calendriers de disposition des dossiers et des calendriers généraux des dossiers implique un processus d'évaluation pour déterminer la période de conservation appropriée pour les dossiers. En général, entre 3 et 5 pour cent des documents fédéraux ont une valeur suffisante pour mériter une conservation permanente dans les Archives nationales. Les enregistrements estimés par la NARA comme temporaires peuvent être stockés sur tout support, y compris des disques optiques de données numériques, qui assure la maintenance des informations jusqu'à l'expiration de leur période de conservation autorisée. Cependant, lorsque des enregistrements papier évalués comme permanents sont convertis dans un autre format, les enregistrements papier d'origine et les enregistrements dans le nouveau format doivent tous deux être programmés. Aucun enregistrement permanent converti en disques optiques de données numériques ne peut être détruit sans l'approbation de la NARA. Dans certains cas, la NARA peut autoriser une agence à détruire des enregistrements permanents après copie sur un disque optique de données numériques à condition que l'agence accepte de convertir les enregistrements sur un support acceptable pour NARA au moment du transfert sous la garde légale de NARA.

        Les règlements de la NARA précisent les conditions dans lesquelles les enregistrements sur des supports autres que le papier, tels que les enregistrements sur microforme, les supports numériques ou électroniques, peuvent être acceptés pour transfert aux Archives nationales. Les Archives nationales acceptent les documents sur supports magnétiques conformes aux normes ANSI (bande à bobine ouverte 6250 bpi et bande à cartouche de classe 3480) et sur CD-ROM. Les réglementations de la NARA ne couvrent pas le processus de conversion proprement dit. Par conséquent, les agences qui souhaitent détruire des enregistrements permanents après les avoir copiés sur des disques optiques de données numériques doivent soumettre à la NARA une proposition de calendrier de disposition des enregistrements. L'agence doit certifier sur un formulaire standard 115 que soit les disques optiques répondent aux exigences du bulletin NARA 94-4, soit que l'agence convertira les images de disque optique en un support qui répond aux normes spécifiées dans le sous-chapitre B de 36 CFR chapitre XII avant le transfert à la garde légale de la NARA.

        Les 15 agences fédérales interrogées pour ce rapport ont adopté des systèmes d'imagerie numérique pour le traitement des enregistrements à la fois non permanents et à valeur permanente. Les systèmes d'imagerie numérique pour les dossiers fédéraux avec des calendriers de conservation de plus de 10 ans étaient majoritaires. Les types de documents permanents les plus courants examinés comprenaient les dossiers du personnel militaire, les dossiers de concession de terres, les dossiers de recouvrement des coûts environnementaux, les documents juridiques et réglementaires et les dossiers d'enregistrement de brevets. Par exemple, les dossiers de la Federal Communication Communication contiennent des dossiers relatifs à l'élaboration de règles et à des questions juridictionnelles et sont donc désignés pour une conservation permanente.

        Le système d'imagerie REDAC du département d'État numérise les photocopies qui sont ensuite jetées, mais les documents originaux restent dans leurs systèmes de classement pour soutenir les opérations quotidiennes. L'Environmental Protection Agency conserve généralement ses archives pendant 20 ans après la fin du litige en matière de recouvrement des coûts. À l'exception des dossiers de l'Office des brevets et des marques, où les originaux sont conservés dans une installation de stockage souterraine à Boyers, en Pennsylvanie, le coût supplémentaire de la conservation des dossiers papier originaux n'a pas pu être vérifié. Dans le cas de l'Office des brevets et des marques, d'autres avantages substantiels ont plus que compensé le coût de stockage des documents originaux.

        Des exemples d'enregistrements temporaires ou à plus court terme (conservés pendant une période de 1 à 10 ans) comprenaient des formulaires standard (enregistrements d'achats et de comptes), des rapports techniques, des informations de journaux et périodiques et la correspondance générale du bureau. Dans ces cas, les systèmes de stockage optique sur disque de données numériques offrent un accès amélioré aux fichiers, en particulier lorsque plusieurs services ou utilisateurs peuvent avoir besoin d'un accès simultanément. À la Bibliothèque du Congrès, par exemple, une partie de la littérature des revues et d'autres documents numérisés sont détruits après la numérisation, tandis que d'autres sont conservés pendant une période intérimaire (3 ans ou moins).

        Se conformer à la politique de la NARA concernant la disposition des enregistrements originaux lors de la conversion en un système de stockage optique sur disque de données numériques.

        Admissibilité légale

        Au cours des dernières années, il y a eu un débat et des discussions considérables concernant l'admissibilité légale des images numériques stockées sur des disques optiques de données numériques, en particulier les disques utilisés pour stocker les dossiers fédéraux après la destruction des dossiers papier originaux. Une directive publiée par le ministère de la Justice (DOJ) en 1992, ainsi qu'une étude et des recommandations de l'Association for Information and Image Management (AIIM), attirent l'attention sur le fait que la question clé n'est pas le support de stockage mais plutôt l'intégrité du enregistre eux-mêmes. Par conséquent, le rapport du ministère de la Justice fait référence aux « enregistrements électroniques » et soutient que les informations stockées sur un disque optique de données numériques « ne devraient pas être traitées différemment des informations stockées sur un disque ou une bande magnétique en ce qui concerne leur admissibilité et leur fiabilité ». La question clé pour les gestionnaires de documents fédéraux est de se familiariser avec la manière dont les règles de preuve s'appliquent à ces documents et de s'assurer que les contrôles procéduraux qui protègent l'intégrité des documents fédéraux sont en place et respectés.

        Le rapport technique de l'AIIM TR31-1992, "Performance Guideline for the Legal Acceptance of Records Produced by Information Technology Systems", s'appuie sur la directive du DOJ en identifiant les stratégies à suivre pour créer, stocker et conserver des documents électroniques afin de garantir l'admissibilité légale. Le rapport AIIM est conçu pour aider les organisations gouvernementales fédérales et étatiques à promulguer des lois, la promulgation de règlements et l'adoption de politiques concernant l'acceptation légale des documents produits par les systèmes de technologie de l'information. En outre, le rapport fournit des orientations dans des domaines tels que les types de langage juridique et les procédures organisationnelles qui devraient être adoptées pour garantir l'admissibilité des documents devant un tribunal. Bien que l'AIIM TR31-1992 soit indépendant du support, dans la mesure où les directives s'appliquent au stockage sur microfilm ou magnétique, les directives de performance qui y sont contenues sont particulièrement pertinentes pour les enregistrements papier convertis en images numériques.

        AIIM TR31 identifie et discute trois questions cruciales qui établissent l'exactitude et l'authenticité des enregistrements électroniques. Premièrement, il doit être démontré que le système utilisé pour produire les informations est capable de produire des enregistrements précis et fiables. Une mesure de cette capacité est que les documents sont produits « dans le cadre d'une activité menée régulièrement comme celles produites dans le cours normal des affaires » et sont utilisés pour mener à bien les activités quotidiennes. Le deuxième problème crucial est que « des procédures [écrites] établies démontrent ce qu'une organisation prévoit de faire pour gérer et contrôler le processus ou le système - par opposition à ce qu'elle fait réellement », en particulier lorsque les enregistrements sont modifiés, dupliqués, convertis ou détruits. . La troisième question cruciale est l'utilisation d'audits périodiques pour documenter « que le processus ou le système produit des résultats précis ». Les lignes directrices de performance définies dans le rapport AIIM sont ancrées dans de saines pratiques de gestion, soutenues par des procédures écrites qui prennent en compte les trois domaines cruciaux précédents. Il convient de noter qu'en vertu de la règle de la meilleure preuve, les tribunaux fédéraux sont plus susceptibles d'accepter comme preuve les documents sur lesquels les agences se sont appuyées dans la conduite de leurs activités quotidiennes.

        Comme indiqué précédemment dans ce rapport, l'étude de la NARA sur 15 applications d'agences fédérales stockant des images de documents sur des disques de données numériques optiques n'a pas spécifiquement identifié l'admissibilité légale comme un problème. Plusieurs explications peuvent expliquer ce manque d'inquiétude. La principale raison est que bon nombre des documents papier convertis en images numériques étaient des documents périmés et qu'il était peu probable qu'ils fassent l'objet d'un litige. Deuxièmement, dans de nombreux cas, les dossiers papier originaux ont été conservés en tant que "copie d'enregistrement", de sorte que les dossiers papier seraient les "meilleures preuves disponibles" dans tout litige. Bien entendu, ces circonstances particulières seront probablement moins fréquentes à l'avenir.

        Familiarisez-vous avec la façon dont les règles de preuve s'appliquent aux dossiers fédéraux et assurez-vous que les contrôles procéduraux qui protègent leur intégrité sont en place et respectés.

        Mettre en œuvre les recommandations fournies dans l'AIIM TR31, parties I et II, applicables aux projets d'agence utilisant des technologies d'imagerie numérique et de stockage optique de données numériques sur disque, soit dans la conversion de documents papier sous forme numérique, soit dans leur création initiale sous forme numérique.

        Accès à long terme

        Les technologies d'imagerie numérique et de stockage de données numériques optiques sur disque évoluent rapidement. Les deux domaines sont marqués par un développement presque continu de nouvelles approches de conversion, de stockage et de récupération d'informations. Garantir un accès à long terme aux enregistrements de valeur durable stockés sur des systèmes de disques optiques de données numériques est plus qu'une question de qualité d'image, de fonctionnalité du système et de stabilité du support. L'adoption de l'imagerie et du stockage optique des données numériques sur disque nécessite un engagement de l'agence dans une évolution technologique qu'elle ne maîtrise pas. Par conséquent, les besoins à long terme des utilisateurs du système ne seront pas satisfaits en prenant simplement la décision organisationnelle d'acquérir la technologie des disques optiques de données numériques. Les agences gouvernementales fédérales utilisant la technologie des disques optiques de données numériques pour le stockage et la récupération des enregistrements nécessaires pour une durée de vie supérieure à 7 à 10 ans doivent prendre des mesures pour garantir que les informations restent accessibles à l'avenir.

        L'importance de la planification de l'obsolescence technologique et de la reprise après sinistre, ainsi que la nécessité de migrer les données dans ces conditions défavorables doivent être reconnues par la haute direction. Un plan cohérent aidera à éviter d'être submergé par l'incertitude et de gaspiller des ressources précieuses dans un jeu perpétuel de rattrapage technologique. Les administrateurs des agences fédérales qui adoptent la technologie des disques optiques de données numériques doivent également continuer à surveiller les tendances technologiques, planifier la maintenance systématique, la mise à niveau et la migration éventuelle vers des technologies plus récentes et, dans l'ensemble, agir de manière responsable pour garantir que la qualité, l'intégrité et la valeur des informations importantes de l'agence sont conservé.

        Élaborer un plan de migration des données et de reprise après sinistre à l'échelle de l'agence bien avant un tel événement pour le système d'imagerie numérique et de stockage de données optiques numériques sur disque.

        Obstacles à l'accès

        La viabilité à long terme des systèmes de stockage sur disque d'imagerie numérique et de données optiques numériques est limitée par leur incapacité actuelle à conserver le contenu, le contexte et les fonctionnalités au fil du temps. Ces limitations sont principalement motivées par trois considérations :

        • Instabilité des fournisseurs
        • Espérance de vie du disque optique de données numériques
        • Obsolescence du système (matériel ou logiciel)

        Instabilité des fournisseurs. C'est dans la nature du comportement fabricant-fournisseur que les avantages à court terme pour le client priment sur les besoins à plus long terme, même clairement définis. Par conséquent, les administrateurs système doivent évaluer soigneusement la viabilité des fournisseurs lors de l'acquisition de systèmes optiques qui dépendent manifestement de fournisseurs ou de fabricants spécifiques. Une situation dans laquelle un fournisseur de système cesse ses activités ou retire brutalement la maintenance pourrait entraîner une perte de support logiciel et le fonctionnement continu d'un système pourrait être compromis. Pour minimiser ces risques, il existe deux signes avant-coureurs d'obsolescence imminente auxquels les responsables doivent être attentifs : (1) lorsque les fabricants annoncent l'arrêt d'un produit ou d'une gamme de produits en particulier ou (2) lorsque le fabricant ou le vendeur annonce la fin du support de maintenance. Dans l'un ou l'autre cas, les responsables doivent planifier immédiatement la migration de l'application des enregistrements vers un nouveau système de stockage.

        Certaines agences fédérales explorent la possibilité de placer les codes logiciels des applications informatiques propriétaires des fournisseurs et des fabricants dans un endroit sécurisé et accessible en cas de défaillance de l'entreprise. Les vendeurs pourraient, par exemple, être tenus de déposer auprès d'une banque ou d'un établissement similaire une copie des codes d'application du logiciel informatique. La direction de l'agence fédérale aurait accès au code du logiciel informatique et en serait propriétaire en cas de réorganisation ou de dissolution de l'entreprise.

        En cas d'apparition de signes avant-coureurs d'obsolescence imminente, les responsables doivent planifier immédiatement la migration de l'application vers un nouveau système.

        Exiger des fournisseurs qu'ils déposent une copie des codes du logiciel d'application du système informatique et de la documentation associée auprès d'une banque, d'archives ou d'un service d'enregistrement sécurisé en cas de défaillance de l'entreprise.

        Espérance de vie des supports/transfert de données et sauvegardes. L'espérance de vie des supports est basée sur des tests de vieillissement accéléré qui ne sont qu'un indicateur général et pas nécessairement un prédicteur de l'espérance de vie des disques de données numériques optiques individuels. Par conséquent, les administrateurs d'agence ne devraient pas se fier exclusivement à une espérance de vie prévue pour déterminer quand recopier sur de nouveaux supports. La vérification périodique de la dégradation du disque obtenue grâce aux informations sur la détection d'erreurs et l'activité de correction d'erreurs est essentielle.

        La combinaison de l'espérance de vie projetée des supports et de la vérification périodique de la dégradation des disques optiques de données numériques est utile pour identifier quand recopier les supports, mais elle n'offre aucune solution en cas de catastrophe naturelle ou causée par l'homme. La création d'une copie des informations, de préférence stockées dans un emplacement hors site, offre la meilleure protection en cas d'une telle catastrophe. Une approche possible pour obtenir une copie de sauvegarde consiste à enregistrer les données sur deux disques optiques de données numériques simultanément au moment de la création. Sans aucun doute, cette duplication entraînerait un coût plus élevé et pourrait éventuellement dégrader les performances globales du système. Une deuxième alternative consiste à copier les informations sur des supports de stockage magnétiques peu coûteux et à haute densité. Une troisième alternative, la conservation des documents originaux sur papier ou la création d'une copie sur microfilm de l'information, réduirait au minimum les problèmes d'obsolescence de la technologie.

        Recopiez les données stockées sur des disques de données numériques optiques sur la base des informations obtenues grâce à la vérification périodique de la dégradation des supports.

        Créez une copie de sauvegarde des informations stockées sur des disques de données numériques optiques à conserver dans une installation hors site, en utilisant le support de stockage approprié (optique, magnétique, papier ou microfilm) qui répond le mieux aux exigences de l'agence.

        Obsolescence du système. Les disques optiques de données numériques sont beaucoup plus durables et stables que le matériel et les logiciels requis pour maintenir l'accès. Toutes les technologies en évolution rapide, y compris l'imagerie numérique et les systèmes optiques de stockage sur disque de données numériques, rendent des applications spécifiques obsolètes à un rythme intimidant. La haute technologie impose un processus de mise à niveau sans fin à ceux qui sont chargés de maintenir l'accès à l'information. Les archivistes, les gestionnaires de documents et les administrateurs de programme doivent supposer que l'accès continu aux données stockées sur des disques optiques de données numériques peut nécessiter un certain degré de mise à niveau du système. La mise à niveau nécessite une planification et une budgétisation à partir du moment où le système d'origine est acquis.

        Les systèmes d'information des agences fédérales stockant des enregistrements ou d'autres données numériques ayant une valeur à long terme doivent être capables de transférer des données aux futures générations technologiques. La capacité de garantir la mise à niveau du système et la transférabilité des données à un coût minimum implique des compromis entre un certain nombre de facteurs, notamment la sécurité du système, les performances du système et l'efficacité du stockage. Comme indiqué ailleurs dans ce rapport, le respect des normes internationales garantissant la rétrocompatibilité entre les nouvelles et les anciennes générations de technologies est un outil efficace pour lutter contre l'obsolescence des systèmes. Cependant, il faudra plusieurs années avant que toutes ces normes ne soient en place, et il est possible que les fournisseurs choisissent de ne pas créer de compatibilité descendante avec certains des systèmes actuels. Dans ce cas, il peut être nécessaire que l'agence assume la responsabilité directe du transfert de données. Par conséquent, il est important que les agences reçoivent une documentation technique complète des composants du système, des logiciels d'application et des systèmes d'exploitation. Les exigences minimales en matière de documentation comprennent :

        • Un manuel de l'administrateur des systèmes matériels, spécifiant les configurations matérielles standard (y compris le câblage) et d'autres configurations spécialisées (c'est-à-dire les communications de données)
        • Documentation des applications logicielles des développeurs appropriés (c.-à-d. manuels d'utilisation, documentation de conception et manuels de maintenance)
        • Procédures opérationnelles spécifiques à l'application pour la numérisation des images, l'indexation et la vérification de l'exactitude des termes de l'index et de la qualité de l'image et des mesures de protection pour empêcher la falsification ou l'utilisation non autorisée.

        Précisez que le fournisseur fournit un ensemble complet de documentation, y compris le code source avec des organigrammes, le code objet, les manuels d'exploitation et de maintenance en tant que livrable contractuel.

        Examiner et réviser périodiquement la documentation du système pour s'assurer que toutes les modifications et améliorations ultérieures du système sont décrites de manière adéquate.

        Stratégies de migration

        Il incombe aux administrateurs d'agences, aux archivistes et aux gestionnaires de documents de travailler ensemble, plutôt qu'aux fournisseurs et fabricants, d'assurer un accès à long terme aux documents soumis à l'obsolescence technologique. S'acquitter de cette responsabilité implique un continuum d'actions déjà examinées dans cette section. En fin de compte, cependant, une stratégie explicite de migration des systèmes de disques optiques de données numériques vers des générations technologiques successives encore non définies doit être adoptée et suivie de manière cohérente. Il existe au moins trois approches pour gérer ce continuum :

        • Mise à niveau sélective de l'équipement et copie programmée de disques de données numériques optiques
        • Recopie en gros des données, sur la base des informations sur une éventuelle dégradation des données obtenues à l'aide d'outils qui testent périodiquement les supports pour vérifier l'intégrité des données
        • Transfert de données vers une toute nouvelle génération de technologies de l'information.

        La première approche est un processus continu de maintien de la fonctionnalité du système grâce à des mises à niveau sélectives de l'équipement au fur et à mesure de l'évolution de la technologie, combiné à une recopie systématique programmée des données selon les besoins. L'avantage de cette approche est la possibilité de travailler avec des fournisseurs et des fabricants établis au fur et à mesure que leurs gammes de produits évoluent pour tirer parti des dernières avancées technologiques. Dans un marché en évolution rapide, cette approche comporte le moins de risques. Les inconvénients sont les coûts de mise à niveau continue de l'équipement et de recopie périodique des données et la dépendance vis-à-vis de la stabilité et de l'engagement du fabricant à mettre à niveau plutôt qu'au remplacement en gros de l'équipement existant d'un client. Dans un marché en évolution rapide, aucun de ces facteurs n'est certain.

        La seconde approche implique une recopie en gros des données selon un calendrier périodique lié aux informations sur les erreurs de support possibles obtenues par la vérification périodique de la dégradation du disque, mais indépendante de la durée de vie prévue du système. Une telle stratégie suppose que la compatibilité matérielle et logicielle est un problème « incontrôlable » qui dépend davantage de la dynamique du marché que des besoins de la communauté des archives et de la gestion des documents. L'avantage de cette approche est qu'elle concentre les énergies des administrateurs système sur la protection de l'intégrité des données. L'inconvénient est le risque que l'hypothèse de compatibilité future des systèmes soit incorrecte.

        La troisième approche consiste à transférer des images optiques et des données d'index d'une génération presque obsolète à une génération nouvellement émergente, en contournant dans certains cas une génération qui commence à devenir obsolète. Dans un sens, cette stratégie « saute » de la technologie optique sur le point de perdre son utilité au profit d'une technologie de pointe, qui peut ou non utiliser des supports de stockage optiques sur disque de données numériques. Le principal avantage de cette stratégie est le temps qu'elle fait gagner aux administrateurs système pendant que l'industrie des disques optiques de données numériques s'installe dans une routine de développement plus prévisible ou est remplacée par des technologies encore non développées. La stratégie impose les plus grandes exigences aux fabricants de systèmes pour garantir la « compatibilité descendante », c'est-à-dire la capacité d'un nouvel équipement à fonctionner de la même manière que l'équipement qu'il remplace, en plus de ses capacités nouvelles et différentes. L'adoption de la stratégie de saute-mouton exige que les administrateurs système surveillent de près les tendances et n'aient pas une foi aveugle dans la viabilité future d'une technologie.

        Plutôt que d'acquérir initialement un grand système intégré, les agences fédérales peuvent choisir d'installer un prototype ou un système de recherche pour acquérir de l'expérience avec les technologies d'imagerie numérique et de disque optique de données numériques. Cette approche permet l'expérimentation dans des conditions opérationnelles, sans encourir le risque et les dépenses d'un achat de système majeur. Les systèmes prototypes permettent également de tester des concepts de conception, d'obtenir les commentaires des utilisateurs du système et d'aider à démontrer la viabilité technologique et à valider les capacités opérationnelles. Cependant, les administrateurs des agences fédérales doivent être conscients de plusieurs facteurs, notamment les difficultés inhérentes à l'extension d'un système unique ou d'un prototype à capacité limitée à une configuration de production complète, les problèmes d'obsolescence de la technologie des composants du système et les défis de la migration. les informations stockées numériquement d'un système prototype à un système ultérieur à plus grande échelle.

        Mettre à niveau l'équipement au fur et à mesure que la technologie évolue et recopier périodiquement les disques de données numériques optiques au besoin. Ou Recopiez les disques optiques de données numériques sur la base d'une vérification périodique. Ou Transférer les données d'une génération presque obsolète de disques de données numériques optiques vers une nouvelle génération émergente, en contournant dans certains cas la génération intermédiaire qui est arrivée à maturité mais qui risque de devenir obsolète.

        Normes de technologie de l'information

        Le fondement sur lequel reposent les approches de gestion précédentes est le respect de normes technologiques non exclusives. Les normes non propriétaires minimisent et, dans certains cas, éliminent peut-être l'échange de données et les incompatibilités informatiques. Bien que ces normes doivent inévitablement changer à mesure que la technologie évolue, elles offrent néanmoins un minimum de stabilité au milieu d'un changement rapide. Par conséquent, leur utilisation augmente la probabilité que les informations stockées dans un système de stockage d'images numériques optiques particulier puissent encore être lisibles, récupérables et intelligibles à l'avenir. Il ne fait aucun doute que les configurations de systèmes propriétaires peuvent créer de sérieux obstacles à l'accès à long terme aux enregistrements stockés sur des disques optiques de données numériques. Par conséquent, les administrateurs doivent exiger une architecture de systèmes ouverts qui utilise des produits conformes aux normes non propriétaires pour les systèmes d'application de disques de données numériques optiques. Si cette stratégie n'est pas possible, le fournisseur devrait être tenu de fournir une « passerelle » vers des systèmes conformes aux normes non propriétaires.

        L'annexe B de ce rapport résume les normes non exclusives actuelles et émergentes que les administrateurs système doivent intégrer aux stratégies de migration technologique des agences fédérales. Une stratégie de migration technologique viable et agressive est essentielle car il est peu probable que la lisibilité, la récupérabilité et l'intelligibilité des données d'images optiques dans les systèmes puissent être maintenues dans le temps sans la participation active de toutes les parties concernées. Le principal défi pour les administrateurs d'agences responsables de la gestion des systèmes de données numériques optiques dans les années à venir est de s'assurer que la stratégie de migration technologique :

        • Prend en compte les tendances de l'environnement technologique
        • Utilise des normes technologiques non exclusives existantes et émergentes et prend en charge le développement continu de normes d'échange de données
        • Adopte des mesures de conservation prudentes dans l'intervalle

        L'adoption de la technologie des disques optiques de données numériques par un organisme gouvernemental est une décision majeure qui comporte des responsabilités qui s'étendent bien au-delà de l'acquisition du matériel et des logiciels d'origine. Ce n'est qu'avec une planification minutieuse que la viabilité à long terme des systèmes d'imagerie numérique et de stockage de données optiques numériques sur disque peut être assurée.

        Surveiller régulièrement les tendances de l'environnement technologique conforme aux normes des systèmes ouverts.

        Spécifier les normes technologiques non propriétaires existantes et émergentes dans la conception du système. Dans la mesure du possible, les composants du système doivent être conformes aux pratiques non exclusives ou communément acceptées.

        Évaluer régulièrement la dégradation possible des données des informations stockées sur les disques de données numériques optiques et les fonctionnalités du système à l'aide des outils de surveillance et de rapport des erreurs de média décrits dans les normes proposées et en évolution telles que ANSI/AIIM MS59-199X.

        Soutenir le développement continu de normes non propriétaires pour l'échange de données et l'interopérabilité.

        Le nom de ce bureau a été changé pour Technology Research Staff en 1992 dans le cadre d'une réorganisation globale de la NARA.

        Le disque optique est un terme générique qui inclut à la fois les technologies analogiques et numériques. Le lien commun est la méthodologie optique utilisée pour lire/écrire les informations pour divers formats tels que les disques optiques de données numériques, les bandes optiques, les disques vidéo et les CD-ROM. Le terme disque optique de données numériques apparaît abondamment dans ce rapport pour décrire la forme de support de disque optique utilisé pour stocker des données numériques.

        National Archives and Records Administration et National Association of Government Archives and Records Administrators, "Digital Imaging and Optical Media Storage Systems: Guidelines for State and Local Government Agencies", décembre 1991.

        Les questions concernant cette politique ou les demandes d'informations sur les bulletins NARA actuellement en vigueur peuvent être adressées aux Archives nationales de College Park, Office of Record Administration, Agency Services Division (NIA), 8601 Adelphi Road, College Park, MD 20740, 301-713 -6677.

        National Institute of Standards and Technology, "Développement d'une méthodologie de test pour prédire les valeurs d'espérance de vie des disques optiques", publication spéciale NIST 500-200, 1991.

        Yvonne Kidd, "Federal Imaging in 1993: Electronic Imaging Comes of Age – Part I," Inform (mars 1993): 14㪳 "Federal Imaging in 1993: Electronic Imaging Comes of Age–Part II," Inform (juin 1993 ): 36㫀.

        De plus amples informations concernant les politiques et les bulletins de la NARA actuellement en vigueur peuvent être obtenues en contactant l'Office of Record Administration, Agency Services Division (NIA), 8601 Adelphi Road, College Park, MD 20740, 301-713-6677.

        National Archives and Records Administration, "Optical Digital Image Storage System", mars 1991. Pour plus d'informations sur ce projet, contactez le directeur, Standards and Technical Services, Association for Information and Image Management, 1100 Wayne Avenue, Suite 1100, Silver Spring, DM 20910.

        Voir également American National Standards Institute et Association for Information and Image Management, ANSI/AIIM MS52-1991, « Pratiques recommandées pour les exigences et les caractéristiques des documents originaux destinés à la numérisation optique », 1991.

        Association pour la gestion de l'information et des images, AIIM TR25-1990, "L'utilisation de disques optiques pour les archives publiques", 1990.

        Association pour la gestion de l'information et des images, AIIM TR25-1990, "L'utilisation de disques optiques pour les archives publiques", 1990.

        Pour une définition du concept de valeur intrinsèque, voir National Archives and Records Administration, « Intrinsic Value in Archival Material », Staff Information Paper 21, Washington, DC, 1982.

        Le projet de norme internationale doit être connu sous le nom d'ISO 12087. Les travaux sur cette norme avancent à un bon rythme et l'approbation est attendue dans le courant de 1994.

        National Archives and Records Administration, "Optical Digital Image Storage System", mars 1991.

        Adapté des États-UnisGeneral Services Administration, "Applying Technology to Record Systems: A Media Guideline", mai 1993. Les capacités de stockage sur disque optique de données numériques reflètent l'état de l'art au moment de la publication de ce rapport stratégique et sont sujettes à changement.

        Les totaux indiquent plus que les 15 agences visitées à l'origine en raison de plusieurs sites utilisant plus d'un format de disque optique de données numériques.

        Une espérance de vie après écriture ne doit pas être utilisée exclusivement pour déterminer quand recopier les données sur des disques de données numériques optiques.

        Le Groupe de travail a terminé un projet de méthodologie d'essai pour prédire la durée de vie des supports CD-ROM et prévoit qu'il portera son attention sur l'élaboration d'une méthodologie d'essai pour les supports réinscriptibles, en particulier magnéto-optiques. Par la suite, le groupe de travail se concentrera sur une méthodologie de test pour les supports WORM. Ces priorités reflètent ce qui est perçu comme les préoccupations du marché, en particulier du point de vue des vendeurs.

        Un projet de l'Institut national des normes et de la technologie (NIST) financé par les Archives nationales étudie actuellement les problèmes critiques concernant l'entretien, la manipulation et le stockage des disques optiques de données numériques.

        National Archives and Records Administration, "Optical Digital Image Storage System", mars 1991.

        Association pour la gestion de l'information et des images, AIIM TR25-1990, "L'utilisation de disques optiques pour les archives publiques", 1990.

        Vice-président Al Gore, "De la paperasserie aux résultats : créer un gouvernement qui fonctionne mieux et qui coûte moins cher : rapport de l'examen national des performances", 7 septembre 1993.

        Des informations supplémentaires sur la politique ou les bulletins de la NARA actuellement en vigueur sont disponibles auprès des Archives nationales de College Park, Office of Record Administration, Agency Services Division (NIA), 8601 Adelphi Road, College Park, MD 20740, 301-713-6677.

        La plupart de ces documents datent des XVIIIe et XIXe siècles et sont susceptibles d'avoir une valeur intrinsèque qui empêche leur élimination après conversion en images numériques.

        Beaucoup de ces documents datent du début du XIXe siècle et ont une valeur intrinsèque.

        Département de la justice des États-Unis, Division de la gestion de la justice, « Admissibilité des documents fédéraux déposés électroniquement en tant que preuve », Washington, DC, 1991.

        TR31-1992 Partie 1 : Directives de performance pour l'admissibilité des documents produits par les systèmes de technologie de l'information en tant que preuves, et TR31-1993 Partie 2 : Acceptation des documents produits par les systèmes de technologie de l'information par les agences fédérales ou étatiques (rapports publiés) Partie 3 : Directives de l'utilisateur, et Partie 4 : Règle type et Loi type (projets de rapports).

        Association for Information and Image Management, « Directives de performance pour l'acceptation légale des documents produits par les systèmes de technologie de l'information », Partie I, « Directive de performance pour l'admissibilité des documents produits par les systèmes de technologie de l'information en tant que preuve », Silver Spring, MD, 1992, p. dix.

        Les cartouches quart de pouce (QIC), les bandes magnétiques 8 mm et 4 mm sont peu coûteuses, tout comme les lecteurs de bande eux-mêmes. La capacité de stockage varie de 3 à 6 gigaoctets. Leurs principaux inconvénients sont les taux de transfert de données lents, qui sont nominalement d'environ 1 gigaoctet par heure, et une espérance de vie prévue d'environ 10 ans.

        De plus amples détails décrivant l'approche de la NARA pour le développement et l'adoption de normes pour la gestion des documents électroniques et les archives sont fournis dans : « A National Archives Strategy for the Development and Implementation of Standards for the Creation, Transfer, Access, and Long-Term Storage of Electronic Records of the Federal Government », Document d'information technique n° 8, juin 1990.

        Cette page a été révisée pour la dernière fois le 15 août 2016.
        Contactez-nous avec des questions ou des commentaires.


        Introduction

        Les récifs coralliens font partie des écosystèmes les plus diversifiés et les plus complexes au monde et fournissent des services écosystémiques précieux (Moberg et Folke 1999 ). Les récifs coralliens du monde entier subissent des facteurs de stress mondiaux accrus, dus à des événements de blanchissement de masse plus fréquents et plus graves (Berkelmans et al. 2004 Hughes et al. 2017 ), ainsi qu'à une série de facteurs de stress anthropiques locaux. Il est essentiel de développer des méthodes d'évaluation des communautés de récifs coralliens dans de vastes zones géographiques pour soutenir les actions de gestion urgentes, sans les contraintes de temps et les coûts élevés associés à in situ enquêtes de terrain. La télédétection a été utilisée pour la première fois pour étudier les écosystèmes des récifs coralliens lorsque le capteur multispectral Landsat a été utilisé dans les années 1970 (Smith et al. 1975 ). Depuis la première application de la télédétection dans un environnement de récifs coralliens, la technologie et les capacités des capteurs à distance ont considérablement progressé et deviennent de plus en plus importantes pour la cartographie, la surveillance et la compréhension des systèmes marins mondiaux.

        La cartographie et l'identification d'habitats structurellement complexes qui représentent d'importants points chauds de la biodiversité ont des implications de gestion importantes pour les communautés côtières qui dépendent des nombreux services fournis par des populations de poissons de récif en bonne santé (par exemple, la sécurité alimentaire de la pêche, le tourisme, la culture, etc.). L'avènement récent de la technologie de télédétection qui permet d'incorporer la structure verticale de l'habitat est prometteur pour l'avancement de l'écologie de l'analyse du paysage (Turner 2005 ). Le LiDAR (light detection and range) est un télécapteur actif qui permet la quantification et l'analyse spatiale d'habitats structurellement complexes (Lefsky et al. 2002 ). LiDAR a été appliqué dans l'environnement marin pour cartographier la structure des récifs coralliens (Storlazzi et al. 2003 ), mesurer la complexité de l'habitat récifal (Brock et al. 2004 ) et s'est également avéré démontrer de fortes relations prédictives avec plusieurs mesures de la structure des assemblages de poissons (Wedding et Friedlander 2008 Wedding et al. 2008 ).

        Les données de télédétection peuvent éclairer les cartes et modèles prédictifs des assemblages de poissons de récif qui mettent en évidence des habitats critiques à haute valeur de conservation et représentent une étape essentielle pour faire avancer la planification de la conservation, le zonage des océans et l'évaluation des réserves marines (Pittman et al. 2007b Mellin et al. 2009 ). Les deux principaux types de données de télédétection utilisées dans la modélisation prédictive sont (1) les cartes catégoriques bidimensionnelles [2D] (p. ). La majorité des études de modélisation prédictive ont été menées à l'aide de variables environnementales basées sur des cartes catégorielles 2D du milieu marin (Kendall et al. 2003 Pittman et al. 2004 , 2007a ). Jusqu'à récemment, cela limitait l'écologie du paysage marin à une science bidimensionnelle axée sur la structuration spatiale des surfaces planes, ce qui représente une simplification excessive de la véritable variabilité de la complexité structurelle qui existe dans la nature (Lausch et al. 2015). Cependant, il y a eu une évolution vers l'application de surfaces 3D à variation continue pour dériver des variables environnementales qui caractérisent la complexité physique pour soutenir la modélisation prédictive (Pittman et al. 2009 Knudby et al. 2010 Darling et al. 2017 Stamoulis et al. 2018 ).

        Le passage des cartes catégoriques 2D à la morphométrie de surface 3D, qui intègre la structure verticale et la complexité de l'habitat, est très prometteur pour l'avancement de la quantification des modèles de paysage (Turner 2005 McGarigal & Cushman 2005 Pittman et al. 2009 Wedding et al. 2011 ). Comprendre le monde d'un point de vue 3D offre un grand potentiel pour faire progresser notre connaissance des modèles et des processus du paysage (Davies et Asner 2014) et peut élargir notre compréhension de la relation entre les organismes et la géométrie du paysage marin. Pittman et al. (2007b) ont utilisé des données 2D et 3D pour expliquer les réponses de la faune à la structure du paysage marin et ont découvert que lorsque la complexité topographique 3D à petite échelle était intégrée aux métriques 2D du paysage marin, elle devenait le meilleur prédicteur. Cela indique qu'un modèle intégré de paysage marin 2D et 3D (modèle patch-mosaïque-continuum) capture davantage l'hétérogénéité écologiquement significative du paysage marin (Pittman et al. 2007b). Il est nécessaire d'évaluer les modèles de paysages marins 2D et 3D intégrés afin de déterminer si ces modèles prennent en charge une modélisation prédictive plus robuste des communautés de poissons par rapport à l'approche classique basée sur la métrique 2D. Ici, nous avons émis l'hypothèse que les covariables tridimensionnelles dérivées du LiDAR soutiennent une modélisation spatiale prédictive plus robuste de la structure des assemblages de poissons des récifs coralliens lorsqu'elles sont couplées à des modèles utilisant des variables environnementales 2D dérivées de cartes d'habitat benthique. Pour tester cette hypothèse, nous avons appliqué des modèles statistiques qui contiennent à la fois des ensembles de covariables 2D et 3D et les avons comparés à des modèles avec uniquement des covariables 2D et uniquement des covariables 3D.


        INTRODUCTION

        L'un des buts ultimes des sciences biologiques est de relier le génotype au phénotype. Alors que ces dernières années ont produit une pléthore de séquences génomiques, la quantification systématique des phénotypes complexes dans les organismes multicellulaires, tels que ceux liés à la croissance et au développement, reste un énorme défi. La plante modèle Arabidopsis thaliana est très approprié pour la quantification des caractères liés à la croissance puisque la croissance se produit de manière continue tout au long de la durée de vie de l'organisme. Il se prête à des approches transgéniques très efficaces ( Lloyd et al., 1986 Clough et Bent, 1998), possède de grandes collections de mutants ( Alonso et al., 2003) et de nombreuses souches isogéniques d'origine géographique diverse (accessions) qui sont séquencées ou densément génotypés sont disponibles pour la communauté ( Horton et al., 2012), fournissant une puissante boîte à outils pour étudier les relations génotype à phénotype ( Atwell et al., 2010). En particulier, le Arabidopsis root est un modèle qui promet de faciliter une compréhension au niveau des systèmes des relations génotype à phénotype grâce à une collection unique de ressources génomiques fonctionnelles au niveau des types cellulaires et pour de multiples conditions de croissance ( Brady et al., 2007, 2011 Dinneny et al., 2008 Iyer-Pascuzzi et al., 2011 Breakfield et al., 2012 Petricka et al., 2012). Ce qui est actuellement nécessaire, c'est la capacité d'évaluer avec précision les phénotypes racinaires de grandes populations de racines génétiquement distinctes afin de quantifier systématiquement les conséquences phénotypiques de différents génotypes. Cependant, alors que les traits de croissance racinaire ont été quantifiés dans de nombreux laboratoires, les outils de phénotypage disponibles ne sont pas optimaux pour la quantification des traits racinaires de grandes populations. Une limitation est que la production d'images de haute qualité est un défi technologique et nécessite souvent des investissements importants. De plus, bien qu'il existe un ensemble diversifié de solutions logicielles pour extraire par ordinateur les traits de ces images (pour une collection complète, voir http://www.plant-image-analysis.org/), la plupart des logiciels d'analyse de racines existants nécessitent une entrée interactive de l'utilisateur, entravant ainsi la capacité de mise à l'échelle et limitant ainsi le nombre de racines qui peuvent être quantifiées. Ce qui manque donc pour rendre les analyses de croissance des racines à haut débit largement exploitables, ce sont des outils efficaces, facilement utilisables et peu coûteux pour acquérir des données d'images de racines de haute qualité associées à des outils de traitement et d'analyse d'images largement automatisés.

        Nous avons développé un système de phénotypage économique pour Arabidopsis racines qui permettent une acquisition et un traitement d'images évolutifs, ainsi que le stockage des informations de position des génotypes végétaux et l'annotation automatisée de plusieurs génotypes par plaque, et qui peuvent être facilement mis en place dans d'autres laboratoires. Ici, nous décrivons sa configuration et évaluons ses performances pour produire et traiter un grand ensemble de données ainsi que sa robustesse vis-à-vis de différentes conditions de croissance. De plus, nous montrons son utilité en effectuant une cartographie d'association pangénomique (GWA) sur tous les traits quantifiés pendant une durée de 5 jours. Enfin, nous évaluons un rôle biologique du gène candidat présentant l'association la plus significative pour un caractère de taux de croissance des racines. Nous constatons que la perturbation génétique de ce gène capteur de calcium entraîne des altérations significatives de la croissance des racines et fournit des preuves d'une signification adaptative de la variation allélique à ce locus pour la croissance dans les environnements côtiers.


        Les imprimantes non professionnelles telles que les imprimantes à jet d'encre, laser et autres imprimantes courantes peuvent mieux imprimer des images d'au moins 200 à 300 ppp et plus. Pour les images qui ont juste besoin d'être "bonnes", 200 ppi fonctionneront. Il est recommandé que les tirages photographiques soient d'au moins 300 ppp. Les images pour l'impression d'affiches grand format peuvent être d'environ 150-300ppi selon la proximité de l'image sera visualisée.*

        Les images d'écran sont différentes des images pour l'impression car nous devons penser aux dimensions en pixels des moniteurs, téléviseurs, projecteurs ou écrans, plutôt qu'aux PPI. Utilisez PPI pour les images imprimées, mais utilisez les dimensions en pixels de l'image qui déterminent vraiment la taille de l'image et la qualité de son affichage sur le Web ou sur les appareils.

        L'idée a été pendant de nombreuses années que les images doivent être enregistrées avec une résolution de 72 PPI. . Mais l'idée fausse commune est que cette résolution ou valeur PPI est le facteur décisif de la qualité d'image pour les images Web, où il s'agit en fait des dimensions en pixels (http://medialoot.com/blog/high-resolution-web/).

        Chaque moniteur est différent et a une résolution différente, il est donc difficile de concevoir un site Web contenant des images qui s'afficheront parfaitement sur chaque type d'écran. Au fil des ans, la technologie s'est améliorée, tout comme la qualité de nos écrans. Les plus populaires sont les nouveaux écrans Retina d'Apple qui se trouvent sur les Macbooks, iPhones et iPads les plus récents.


        DISCUSSION

        La détermination du volume 3-D de PilQ a un certain nombre d'implications importantes pour les processus de sécrétion en général et le mécanisme de la biogenèse de Tfp en particulier. Des travaux antérieurs ont établi que les complexes de sécrétine purifiés forment des canaux de conductance fermés lorsqu'ils sont reconstitués dans des membranes lipidiques (3, 27, 31). La structure présentée ici établirait une explication structurelle de ce phénomène, fournissant la preuve d'un “plug” ou d'une constriction dans le canal qui devrait traverser la membrane externe. Il est clairement avantageux pour la cellule bactérienne de réguler l'accessibilité des sous-unités de piline à PilQ puisque cette sécrétine est exprimée de manière constitutive à des niveaux élevés (50) et un canal de 6,5 nm constamment ouvert permettrait aux protéines périplasmiques et à d'autres molécules périplasmiques précieuses de se diffuser loin de la cellule. Une limitation de la structure actuelle est qu'elle n'affecte pas les faces externes ou internes du complexe. Nous supposons que la bouche ouverte de la cavité est tournée vers l'extérieur de la cellule car elle doit abriter le Tfp lors de son extrusion, mais il n'y a aucune preuve directe de cette supposition dans les données présentées ici. Si tel est effectivement le cas, cela suggérerait que l'extrémité rétrécie du canal se trouve du côté périplasmique de la membrane externe. C'est une proposition intéressante car elle permettrait à cette région de PilQ d'interagir avec d'autres protéines de biogenèse Tfp du périplasme et de la membrane interne.

        Il est également tentant de spéculer sur la manière dont PilQ pourrait interagir avec la fibre Tfp en croissance ou en rétraction. La structure présentée ici suggère deux possibilités. La première est que l'assemblage de la fibre pilus se produit à l'extérieur de la cavité PilQ et que la fibre est extrudée à travers la protéine sous sa forme intacte. Pour que cela se produise, les dimensions de la cavité devraient s'étendre légèrement, peut-être par un changement de conformation induit par les interactions de PilQ avec d'autres composants protéiques, et la région P devrait s'étendre. La deuxième possibilité est que le site de formation du pilus est en fait à l'intérieur de la cavité PilQ elle-même et que des sous-unités de piline individuelles sont délivrées ou retirées de ce site en fonction des activités relatives des protéines d'assemblage ou de rétraction de Tfp telles que PilT. Il n'est pas possible, sur la base de ces données structurelles, de distinguer entre ces modèles alternatifs, bien qu'il soit intéressant qu'ils nécessitent tous deux un degré substantiel de flexibilité conformationnelle de la région P de la molécule. Il est important de souligner, à titre de mise en garde, que les résultats présentés ici ont été obtenus à partir de protéines purifiées et solubilisées par un détergent et que l'extraction de PilQ de la membrane méningococcique et l'élimination d'autres composants protéiques pourraient affecter la conformation ou la structure de la protéine. Une autre question importante est la position de la membrane externe : encore une fois, cela est impossible à discerner à partir de ces observations sur le matériel solubilisé par un détergent, bien que la taille et la morphologie de la région R suggèrent que cette partie pourrait contenir les parties couvrant la membrane du complexe. .

        Notre structure de PilQ peut être comparée aux structures à faible résolution de deux autres complexes de sécrétine. Des observations EM par transmission par balayage de deux orientations du canal du phage filamenteux pIV ont montré que le complexe formait un assemblage cylindrique de 12 à 14 monomères (26). Plus récemment, la structure du multimère pIV a été déterminée à une résolution de 22-Å par cryo-EM (34). Le complexe pIV présente une symétrie de rotation de 14 au lieu de 12 et forme une structure en forme de tonneau. Le canal à travers la molécule est bloqué, comme c'est le cas avec PilQ, mais dans une partie centrale du pore, plutôt qu'à une extrémité. Une autre sécrétine qui a été étudiée en détail est le complexe PulD-PulS de K. oxytoca (31). Les résultats ont montré un complexe cylindrique asymétrique composé de 12 monomères d'une hauteur de 19 nm et d'un diamètre de 25,8 nm. Autour de la périphérie du complexe, 12 densités radiales distinctes ont été observées : il a été proposé que ces caractéristiques proviennent de la lipoprotéine d'assemblage de sécrétine PulS. La cavité centrale était de grand diamètre (𢏇,5 à 8,0 nm) et apparemment continue dans tout le complexe, bien qu'il y ait eu des preuves biochimiques que le canal était fermé (31). D'autres observations de PulD-PulS en coloration négative ont montré une vue latérale du complexe, dans une organisation dimère avec une symétrie pseudo-miroir (32). Étant donné que PulD et PilQ présentent une homologie uniquement dans les domaines C-terminaux de leurs gènes, il est possible que certaines de ces différences structurelles soient attribuables à des variations dans la structure de la moitié N-terminale de chaque protéine.

        En fournissant de nouvelles informations sur la cavité des pores, la structure PilQ présentée ici représente un premier pas vers une compréhension de la structure de l'appareil biosynthétique Tfp. Il existe de nombreux aspects intrigants de cette machine moléculaire complexe, notamment les questions concernant la façon dont l'extrusion du pilus est régulée et la façon dont le processus d'extension est inversé en rétraction. Il est clair que les études en 3D apportent une contribution significative à l'explication de ces phénomènes.