Suite

Cellules raster sans données générées par las2dem ?


Quelqu'un a-t-il une idée d'où viennent ces lignes (sans données d'altitude) ? Ils sont générés lors de l'utilisation dulas2demoutil de LAStools.

Que faut-il faire pour éviter cela ? Les données brutes (fichier .las) ne contiennent pas de données avec la valeur 0.


J'ai compris (obtenu l'indice du forum d'utilisateurs sur rapidlasso.com): comme mdsumner l'a indiqué avec sa question, c'est un problème de la version open source de lastools (LGPL 2.1). Avec le modèle sous licence, ces bandes ne seront pas générées.


Comprendre les données statistiques à des fins de cartographie

De nombreuses cartes présentent des données statistiques. Si la carte est bien exécutée, vous comprendrez intuitivement et correctement la statistique cartographiée. Il est plus facile de juger de l'efficacité d'une carte statistique si vous comprenez les données cartographiées et la méthode utilisée pour les cartographier. Cet article explore les problèmes liés à la cartographie des données statistiques.

Qualitatif versus quantitatif

Fondamentalement, les cartes n'affichent que deux types de données : qualitatives et quantitatives. Les données qualitatives font la distinction entre différents types de choses. Les données quantitatives communiquent un message d'ampleur.

Bien que les deux types de données puissent être exprimés dans une carte à l'aide de points, de lignes, de polygones et de cellules raster, les méthodes de mappage de ces deux types de données sont quelque peu différentes. Les différences catégoriques dans les données qualitatives peuvent être affichées avec des symboles qui varient selon la teinte de couleur (par exemple, rouge, vert, bleu) et la forme (par exemple, cercles, carrés, triangles). Les données quantitatives peuvent également être représentées efficacement à l'aide de variations de symboles telles que l'orientation et l'espacement des motifs, mais la teinte, la forme, la luminosité et la taille sont le plus souvent utilisées car ce sont les symboles les plus faciles et les plus correctement compris.

Un certain nombre de méthodes de cartographie ont été développées qui combinent diverses caractéristiques et symboles cartographiques. La cartographie choroplèthe utilise la légèreté pour symboliser les polygones. Les cartes de symboles proportionnels affichent les résultats sous forme de points dont la taille varie en fonction de leurs valeurs associées.

Étant donné que la plupart des données statistiques sont de nature quantitative, cet article se concentre sur la cartographie des données quantitatives. Cependant, pour cartographier correctement les données quantitatives, vous devez les comprendre. Toutes les méthodes ne fonctionnent pas pour toutes les données quantitatives.

Les données démographiques fournissent un exemple. Il montre les caractéristiques statistiques d'une population et est l'un des types de données les plus courants affichés sur les cartes statistiques. Les données démographiques, qui peuvent inclure des données sur la race, le sexe, l'âge, le statut d'emploi et d'autres facteurs, sont tabulées sur des unités de dénombrement telles que les comtés, les secteurs de recensement, les zones de code postal ou les districts scolaires. Les totalisations comprennent le nombre de caractéristiques, telles que les personnes, les ménages, les unités de logement ou les étudiants, au sein de ces unités. Ils peuvent également inclure des caractéristiques qui décrivent ces caractéristiques, telles que l'âge, la race et le revenu pour décrire les personnes ou l'âge et le type d'unité de logement.

Les nombres et les caractéristiques peuvent être utilisés pour dériver des mesures qui expriment soit des résumés (par exemple, moyenne, médiane) soit des relations (par exemple, densités, proportions). Les totalisations et les valeurs dérivées pour les unités de dénombrement sont supposées être uniformes dans toute la région et changent aux limites des unités (c'est-à-dire qu'elles ne se mélangent pas d'une unité à une autre).

Les indicateurs de paysage pour les bassins versants ou sous-bassins versants et les valeurs fiscales dans les parcelles cadastrales sont deux exemples de données collectées pour l'unité dans son ensemble qui sont supposées être distribuées uniformément à travers l'unité et changer aux limites de l'unité. En plus de déterminer si les données évaluées ont ces caractéristiques, il y a une autre chose que vous devez savoir avant de les mapper.

Données spatialement étendues contre données spatialement intensives

Vous devez également déterminer si la statistique mappée dépend de la taille de l'unité. Les nombres ou totaux et les mesures, telles que la superficie et le périmètre, sont des statistiques récapitulatives pour l'unité et ne sont vraies que lorsqu'elles représentent l'unité dans son ensemble. Ces statistiques sont dites spatialement extensives. La statistique est la somme des propriétés des éléments qui composent l'unité. Par exemple, les totaux sont la somme des éléments comptés dans l'unité. Le périmètre est la somme de la longueur des segments de ligne qui composent la limite de l'unité. Si vous modifiez la taille de l'unité, ces statistiques changeront.

En revanche, des valeurs telles que la densité de population ou les taux de cancer peuvent décrire n'importe quelle partie de l'unité (si l'unité est supposée être homogène). Ces statistiques sont spatialement intensives et ne dépendent pas de la taille de l'unité. Si vous divisez l'unité, la valeur restera la même.

Des données spatialement intensives peuvent être dérivées de données spatialement extensives. Par exemple, la division des dénombrements par superficie donne la densité ou la division du dénombrement d'une unité par la somme des dénombrements de toutes les unités donne une proportion.

Pour mieux comprendre cela, regardez la figure 1. Les données pour les cinq unités de dénombrement montrent le nombre de personnes, la superficie et la densité de population pour chaque unité. Le recalcul des valeurs sur la base d'une division arbitraire des unités d'origine révèle que les mesures spatialement intensives, telles que la densité, ne dépendent pas de la taille de la zone, alors que les variables spatialement étendues, telles que la zone ou le nombre, dépendent spatialement.

Vous pouvez recalculer toutes les statistiques si vous supposez que les dénombrements d'origine sont uniformes au sein des unités, l'une des hypothèses de données démographiques discutées précédemment. La superficie peut être facilement recalculée, de même que le pourcentage de l'ancienne superficie que comprend la nouvelle superficie (nouvelle superficie/ancienne superficie). Pour calculer le nouveau nombre, l'ancien nombre est multiplié par le pourcentage de surface de la nouvelle unité, ce qui donne une nouvelle valeur. Cette nouvelle valeur ne sera correcte que si l'on suppose que le nombre de personnes est uniformément réparti au sein de l'unité. Cependant, le recalcul de la densité donne la même valeur qu'auparavant, car le nombre change en proportion directe avec la surface.

Les cartes de la figure 2 montrent les données cartographiées à l'aide de la méthode choroplèthe. Lorsque les comptes sont symbolisés en utilisant la clarté (en notant que plus sombre est toujours interprété comme plus), la carte des valeurs recalculées varie considérablement de la carte des valeurs d'origine.

Cela contrevient à l'hypothèse selon laquelle les valeurs des unités de dénombrement sont uniformes dans toute la région. Cependant, lorsque la densité est cartographiée, les distributions apparaissent exactement les mêmes. La division arbitraire des unités illustre les propriétés des données spatialement intensives et étendues, mais ce n'est probablement pas quelque chose dont vous auriez besoin ou que vous voudriez faire.

Regardons les données réelles. Les données ne sont pas réparties uniformément au sein de l'unité, comme c'est le cas avec la plupart des données surfaciques. Les unités d'origine (illustrées à la figure 3) se rapportent aux comtés et sont ensuite subdivisées en secteurs de recensement. La cartographie de la densité de population pour ces parcelles révèle que pour l'ensemble de la zone, la population est concentrée dans le sud-ouest. Cependant, la cartographie de la population par comté masque cette variation de la répartition.

Il existe également un autre problème avec la cartographie des dénombrements ou des totaux et d'autres données spatialement étendues dans les zones à l'aide de la méthode choroplèthe. Les distributions uniformes seront masquées. Les cartes des figures 4A, 4B et 4C montrent les données cartographiées d'abord sous la forme d'une distribution uniforme, puis sous la forme de deux cartes choroplèthes qui affichent le nombre de caractéristiques et la densité des caractéristiques. Le nombre varie largement selon la zone, provoquant une gamme de luminosités sur la carte de la figure 4B. Bien que la densité soit la même pour toutes les zones, cette variation donne une fausse idée de la façon dont les caractéristiques sont réparties dans les zones. En revanche, la carte de la figure 3C a la même densité pour chaque unité. L'absence de variation de luminosité entre les unités donne une impression correcte de la répartition des caractéristiques.

Les figures 2 à 4 montrent une mise en garde très importante : les dénombrements ou totaux et autres données spatialement étendues ne doivent jamais être symbolisés à l'aide de la méthode de cartographie choroplèthe.

Parce que cette méthode ne représente pas avec précision la nature des données. La cartographie de données spatialement étendues à l'aide d'une méthode choroplèthe masque la concentration des caractéristiques dans les zones car elle suppose que la distribution est uniforme, comme le montrent les cartes de la figure 2. La méthode choroplèthe masque également les distributions qui sont uniformes, comme le montrent les cartes de la figure 4 Bien qu'il ne s'agisse que d'un exemple de l'utilisation d'une méthode de mappage qui n'est pas appropriée au type de données, il s'agit d'une méthode grave et trop courante.

Normaliser ou standardiser les données

Maintenant que vous comprenez la nécessité de faire correspondre la méthode de mappage à la nature des données, l'étape suivante consiste à apprendre à travailler avec les données afin qu'elles soient sous la forme correcte pour le type de méthode de mappage que vous utilisez.

Pour corriger les problèmes causés par le mappage des décomptes à l'aide de la méthode choroplèthe, vous pouvez convertir les données dans le type correct afin qu'elles puissent être affichées par la clarté dans les zones. Cela est souvent nécessaire pour les données représentées sous forme de points, de lignes ou de rasters et avec d'autres méthodes de mappage telles que le cercle proportionnel.

Pour ce faire, normalisez ou standardisez les données. Ces deux termes, souvent utilisés de manière interchangeable, sont légèrement différents. La normalisation des données met toutes les valeurs numériques à l'échelle dans une plage de zéro à un. La normalisation transforme les données de manière à ce qu'elles aient une moyenne et une variance unitaire nulles. Les deux techniques ont des inconvénients. Si l'ensemble de données a des valeurs aberrantes, la normalisation mettra les données normales à l'échelle à un très petit intervalle. Lors de l'utilisation de la normalisation, l'hypothèse est que les données ont été générées avec une certaine moyenne et un certain écart type, bien que cela puisse ne pas être le cas.

Méthodes pour dériver des mesures appropriées

En cartographie, les cartographes utilisent souvent le terme données dérivées faire référence à des données qui ont été transformées par la normalisation ou la standardisation afin qu'elles puissent être comparées de manière significative. Les transformations couramment utilisées dans la cartographie incluent les rapports ou les taux, les proportions, les pourcentages et les densités.

Il est important de faire la différence entre les mesures spatialement intensives et les mesures spatialement extensives. La densité est une mesure spatialement étendue. Une proportion, générée en divisant le nombre d'éléments dans une unité par le nombre total d'éléments, est spatialement étendue car le nombre par unité a été divisé par une constante (le nombre total d'éléments). Pour les valeurs dérivées telles que les proportions, les pourcentages et les taux, les nombres résultants ne peuvent être vrais que pour le tout unité, pas des parties de celle-ci. Pour les unités d'importance intrinsèque (par exemple, les comtés), la proportion de la valeur attribuée à chaque unité ne doit pas être cartographiée à l'aide de la méthode choroplèthe. Dans de tels cas, il peut être préférable d'utiliser des symboles gradués.

La figure 5 montre des cartes pour certains types de données dérivées. La figure 5A montre deux des statistiques dans les données originales qui ont été utilisées dans les calculs—le nombre d'élèves et d'enseignants dans chaque unité. La superficie de chaque unité peut être calculée à l'aide du SIG. À l'aide des formules du tableau 1, des cartes ont été créées qui montrent la densité d'enseignants (5B), le pourcentage d'enseignants (5C) et le ratio élèves/enseignants (5D) pour chaque unité. Ces cartes très différentes seraient utilisées pour répondre à des questions très différentes.

Par exemple, connaître la densité d'enseignants aide à répondre à des questions telles que : Où sont concentrés beaucoup d'enseignants ? Cela peut être utile si vous souhaitez organiser une réunion à un endroit qui minimisera la distance de déplacement pour la plupart des enseignants présents. Connaître le pourcentage d'enseignants dans chaque unité permet de répondre à des questions telles que : Combien d'enseignants sont affectés à chaque unité ? Cela serait utile pour décaisser des fonds aux enseignants pour les fournitures scolaires.

Un problème est que les valeurs dérivées peuvent masquer la nature des données utilisées dans les calculs. Par exemple, la carte de la figure 3 peut masquer le fait que tous les enseignants ne sont pas employés à temps plein. Deux enseignants à mi-temps peuvent compter pour deux enseignants, mais ne constituent ensemble qu'un équivalent temps plein (ETP). Cet aspect des données n'est saisi que si le nombre d'ETP est cartographié plutôt que le nombre d'enseignants.

De même, les quantités qui ne sont pas comparables ne doivent pas être utilisées pour calculer les ratios. Par exemple, vous ne calculeriez (ou ne cartographieriez) pas le nombre d'enseignants par école à moins que toutes les écoles aient à peu près la même taille. Pour que ce ratio ait un sens, les écoles doivent être comparables.

Résumé

Mieux comprendre la nature des données statistiques utilisées à des fins de cartographie vous aidera à mieux comprendre les méthodes qui peuvent être utilisées pour les cartographier. En fin de compte, l'objectif est de faire correspondre les données appropriées avec la méthode la plus efficace afin que votre carte puisse être interprétée facilement, rapidement et correctement par vos lecteurs.

Les références

Brewer, Cynthia A. 2006. “Basic Mapping Principles for Visualizing Cancer Data Using Geographic Information Systems (GIS),” www.ajpmonline.org/article/S0749-3797%2805%2900358-2/fulltext.

Côté, Paul. Cartographie efficace : cartographier avec des données quantitatives.

Kimerling, A. Jon, Aileen R. Buckley, Phillip C. Muehrcke et Juliana O. Muehrcke. 2011. Utilisation de la carte : lecture, analyse, interprétation, Septième édition. Redlands, Californie : Esri Press, 581 pages.

Longley, Paul A., Michael F. Goodchild, David J. Maguire et David W. Rhind. 2011. Systèmes d'information géographique et science, Troisième édition, New York : Wiley, chapitre 4.

Pitzl, Gérald. 2004. Encyclopédie de géographie humaine. “Cartes choroplèthes.”

Robinson, Arthur H., Joel L. Morrison, Phillip C. Muehrcke, A. Jon Kimerling et Stephen C. Guptill. 1995. Éléments de cartographie, Cinquième édition. New York : John Wiley & Sons, Inc., 674 pages.


Cellules raster sans données générées par las2dem ? - Systèmes d'information géographique

Géoréférencement : l'enregistrement de l'emplacement absolu d'un ou de plusieurs points de données

Géorectification : suppression des distorsions géométriques entre les ensembles de points de données

Le géoréférencement, ou l'enregistrement de l'emplacement absolu d'un ou de plusieurs points de données, et la géorectification, ou la suppression des distorsions géométriques entre des ensembles de points de données, sont souvent confondus dans la conversation. Cela est probablement dû en partie au fait qu'ils sont souvent complétés par des processus simultanés et que la géorectification affecte directement la précision de la position des pixels dans les données de télédétection géoréférencées. Le géoréférencement est une tâche requise pour toutes les données spatiales, car les données spatiales ne peuvent pas être positionnées dans l'espace ou évaluées par rapport à d'autres données auxquelles aucune coordonnée spatiale n'est attribuée dans un système de coordonnées défini (par exemple, des projections). La géorectification ne nécessite pas la localisation des points avec seulement un ajustement spatial de la position relative de ces points les uns sur les autres. Le géoréférencement est une condition préalable à l'utilisation des données dans les systèmes d'information géographique (SIG), tandis que la géorectification est un processus le plus souvent appliqué à l'imagerie de télédétection pour améliorer la précision du géoréférencement en supprimant les distorsions induites par le terrain, la plate-forme et les capteurs.

De nombreuses données sont implicitement géoréférencées (c. Les données qui ne sont pas étiquetées avec des informations de référence spatiale peuvent être géoréférencées à l'aide d'un certain nombre d'approches, notamment le gauchissement empirique, la projection directe ou l'ajustement des blocs de faisceaux.

La déformation empirique fonctionne en reliant les emplacements relatifs au sein de cet ensemble de données à référencer à une carte ou à un ensemble de données spatiales qui représente la même zone géographique et est déjà étiqueté avec des informations de référence spatiale. L'exigence clé pour la déformation empirique est que les caractéristiques uniques puissent être identifiées à la fois dans la carte à référencer et dans la source de ces caractéristiques uniques, lorsqu'elles sont liées sous forme de paires qui représentent l'emplacement relatif dans l'ensemble de données à référencer et l'emplacement absolu extrait de la référence source, sont appelés points de contrôle au sol (GCP). Voir la figure 1 pour un exemple de GCP situés sur un modèle de terrain ombragé de collines. Les sources d'informations de référence couramment utilisées comprennent l'orthophotographie, les cartes de base existantes et les points GNSS collectés sur le terrain. La précision de position des données géoréférencées à l'aide de techniques de déformation empiriques est fondamentalement limitée par la précision de position de la source de référence utilisée. Lors de l'examen d'une source de référence, il est donc important de considérer la précision de position de cette source de référence. Il est également important de prendre en compte l'échelle des données à référencer et la meilleure pratique de la source de référence consiste à utiliser des sources de référence dont la résolution spatiale ou l'échelle sont plus fines que les données à référencer. Cette exigence est motivée par le fait que tout écart dans l'identification des emplacements des caractéristiques dans l'image se traduit par une erreur dans les positions estimées de l'ensemble de données référencé. Pour limiter l'erreur de position du modèle de terrain extrait par photogrammétrie de la figure 1, les GCP illustrés à la figure 1 ont été collectés à l'aide d'un GNSS de qualité topographique.

Figure 1. Points de contrôle au sol dans le canyon de la rivière Chama, au Nouveau-Mexique. La distribution des points de contrôle au sol est présentée sur un modèle de terrain à l'ombre des collines généré à l'aide d'une triangulation aérienne calibrée par ces points de contrôle. Source de l'image : auteur.

Le gauchissement empirique peut être effectué avec une variété de modèles, y compris des fonctions polynomiales, de feuilles de caoutchouc et de spline (Voir Toutin, 2004 pour plus de détails). La déformation polynomiale est l'approche de déformation empirique la plus courante en raison de son efficacité de calcul et de sa résilience aux valeurs aberrantes. La déformation polynomiale du premier, du deuxième et du troisième ordre permet d'augmenter la flexibilité du modèle, respectivement, le premier ordre n'autorisant que les ajustements d'échelle, de rotation et d'inclinaison. Plus le polynôme d'ordre supérieur adopté est élevé, plus il faut de GCP pour calibrer le modèle. Mathématiquement, le premier ordre nécessite un minimum de 3 points pour s'adapter à un modèle, le deuxième ordre en nécessite 6 et le troisième ordre nécessite un minimum de 9 GCP. En pratique, le nombre minimum de points recommandé est au moins le double de ce nombre car seuls les GCP au-delà de ce nombre minimum permettent d'évaluer l'ajustement du modèle, qui est généralement mesuré par la racine carrée de l'erreur quadratique (RMSE) entre les données connues (c'est-à-dire les entrées aux GCP ) les emplacements et les emplacements estimés par le modèle.

Les trois ordres de déformation polynomiale sont souvent confondus avec un processus connexe, le rééchantillonnage. Les processus de géoréférencement estiment simplement l'emplacement de chaque point de données. Lors du géoréférencement des données vectorielles, l'emplacement de chaque point peut être estimé. Cependant, lors du géoréférencement de données raster (par exemple, photographie aérienne, imagerie satellitaire, cartes numérisées), l'emplacement de la nouvelle grille estimée ne s'aligne pas sur la grille avant la déformation, ce qui nécessite la réaffectation des valeurs de cellule à la nouvelle grille. Ceci est réalisé en utilisant l'une des trois méthodes de rééchantillonnage : plus proche voisin, bilinéaire ou convolution cubique.Le voisin le plus proche adopte simplement la valeur de la cellule du raster avant la déformation à la cellule la plus chevauchante dans la grille déformée. Cela signifie que les valeurs raster d'origine sont conservées, ce qui en fait la méthode préférée pour les données de télédétection qui seront utilisées pour d'autres tâches analytiques ou pour les données raster catégorielles où les valeurs de classe entière doivent être conservées. La limitation du rééchantillonnage du voisin le plus proche est l'effet "en marche" qui peut se produire le long des entités linéaires et des limites. Les convolutions bilinéaires et cubiques, qui font la moyenne des valeurs de 4 et 16 cellules voisines, respectivement, minimisent les distorsions apparentes dues au gauchissement, et sont donc préférables pour le géoréférencement des images à des fins d'affichage et d'interprétation visuelle.

Lorsque la déformation empirique est effectuée sur des images de télédétection, la géorectification a lieu implicitement si la source de référence est orthographiquement corrigée, mais cette géorectification est purement empirique et dépend de la flexibilité de la fonction de déformation utilisée et du nombre et de l'emplacement des GCP utilisés. Le géoréférencement basé sur la projection directe et l'ajustement des blocs de faisceaux utilise une mesure directe des facteurs introduisant des distorsions géométriques (c'est-à-dire la géométrie interne du capteur, l'attitude de la plate-forme, le terrain) et, par conséquent, rectifie l'imagerie d'entrée de manière inhérente. Le Manuel de photogrammétrie, publié par l'American Society for Photogramtry and Remote Sensing, sert de référence définitive sur le sujet (McGlone, Lee, & American Society for Photogramtry and Remote Sensing, 2013). La photogrammétrie fait référence à la pratique de la mesure à partir de données d'image et est donc principalement concernée par la précision de position des données d'image.

La projection directe utilise un modèle de capteur (c'est-à-dire une estimation de la relation géométrique entre le détecteur/film et la scène capturée) pour projeter l'emplacement des mesures de l'emplacement du capteur à un plan de masse, nécessitant des informations sur l'emplacement et l'attitude de la plate-forme à partir des informations inertielles de la plate-forme (par exemple, GNSS, accéléromètres, gyroscopes) et des informations sur le terrain de la surface projetée. La précision du géoréférencement et de la géorectification, dans ce cas, dépend directement de l'exactitude et de la précision du modèle de capteur, des informations d'attitude de la plate-forme et du modèle de terrain utilisés dans le processus. Les trames de données de télédétection sont projetées indépendamment, ce qui entraîne des erreurs de géoréférencement/géorectification apparentes entre les trames individuelles. L'avantage de la projection directe est qu'elle ne nécessite aucune intervention humaine et qu'elle est extrêmement efficace sur le plan informatique, ce qui en fait une méthode privilégiée pour les applications sensibles au temps de la télédétection. Le principal inconvénient est l'exigence de mesures précises de la géométrie du capteur et de l'attitude de la plate-forme, ce qui est coûteux et nécessite une configuration a priori du système de capteurs.

Les routines d'ajustement de bloc de faisceau utilisent ou estiment directement des modèles de capteurs, des informations d'attitude de plate-forme et des informations de terrain pour estimer un modèle unique de la géométrie de plusieurs trames de données de télédétection, contraignant et répartissant les erreurs géométriques sur les trames. Une étape clé de ce processus est l'identification des points de liaison qui définissent des points corollaires entre les trames, qui, lorsqu'ils sont couplés aux GCP, créent un modèle géométrique unique qui peut répartir les erreurs via l'estimation des moindres carrés. L'ajustement par blocs et les approches associées sont l'option la plus rigoureuse pour la géorectification et sont utilisés dans la création de la plupart des orthophotos. L'ajustement des blocs de paquets est la principale technique utilisée dans la photogrammétrie électronique, qui comprend aujourd'hui un continuum allant des approches traditionnelles nécessitant une identification manuelle des points de liaison et des GCP à des approches entièrement automatisées (par exemple, Structure-from-motion et MultiView Stereo, SFM-MVS) . Les approches automatisées d'ajustement de blocs de faisceaux telles que SFM-MVS peuvent générer un nombre suffisant de points de liaison pour que la hauteur du terrain puisse être directement estimée à partir de la parallaxe différentielle, mesurée en tant que déplacement différentiel du relief entre les trames d'image, éliminant ainsi le besoin d'utiliser des informations externes sur le terrain ( ex., Zhang, Lippitt, Bogus, Loerch, & Sturm, 2016). Le modèle de terrain de la figure 1 a été extrait à l'aide d'une approche photogrammétrique basée sur SFM-MVS, produisant les erreurs verticales et horizontales indiquées dans les points de contrôle indiqués dans le tableau 1.

Tableau 1. Résidus et erreurs quadratiques moyennes (RMSE) pour des exemples de points de contrôle

Quelle que soit l'approche de géoréférencement, la quantification des erreurs dans ce géoréférencement est une étape critique. La RMSE horizontale (X&Y) et verticale (Z) peut être calculée entre des emplacements connus (par exemple, une étude) et des emplacements modélisés (voir le tableau 1). Ces paires sont appelées points de contrôle (PC) et ont chacune des résidus à l'horizontale et, dans les données tridimensionnelles, à la verticale. La figure 2 montre les résidus pour les CP représentés dans le tableau 1. Les CP sont similaires aux GCP, comparant les emplacements de terrain connus aux emplacements d'images, mais sont distincts en ce sens qu'ils comparent les emplacements de terrain aux emplacements modélisés une fois le géoréférencement terminé. Les CP doivent être indépendants du processus d'étalonnage du modèle (c'est-à-dire qu'ils ne doivent pas être utilisés comme GCP). La photogrammétrie manuelle de l'American Society for Photogramtry and Remote Sensing (ASPRS) (McGlone et al., 2013) fournit les meilleures pratiques pour la validation. Les directives générales sur la précision de la position pour les données d'images satellitaires à résolution spatiale modérée sont un point de contrôle RMSE de 0,5 pixel, tandis que les données aéroportées peuvent varier de 1 à 3 pixels. Les directives relatives aux données vectorielles varient considérablement, mais les normes de précision doivent être déterminées par l'utilisation prévue des données géoréférencées. Les fournisseurs d'images satellitaires et aériennes produisent régulièrement des images avec des niveaux variables de précision géométrique, chacune produite avec des versions des techniques décrites ici, offrant des niveaux plus élevés de précision géométrique produits à l'aide de techniques de géoréférencement et de géorectification plus sophistiquées à un coût plus élevé.

Figure 2. Résidus horizontaux entre les valeurs des points de contrôle au sol modélisés et de contrôle. Source : auteur.

McGlone, J.C., Lee, G.Y.G., & American Society for Photogrammetry and Remote Sensing (Eds.). (2013). Manuel de photogrammétrie (6. éd). Bethesda, Maryland : ASPRS, American Soc. pour la photogrammétrie et la télédétection.

Toutin, T. (2004). Article de synthèse : Traitement géométrique des images de télédétection : modèles, algorithmes et méthodes. Revue internationale de télédétection, 25(10), 31. DOI : 10.1080/0143116031000101611

Zhang, S., Lippitt, C. D., Bogus, S., Loerch, A., & Sturm, J. (2016). La précision des produits de triangulation aérienne générés automatiquement à partir de photographies aériennes numériques à résolution hyper-spatiale. Lettres de télédétection, 7(2), 160-169. DOI : 10.1080/2150704X.2015.1121299


Cellules raster sans données générées par las2dem ? - Systèmes d'information géographique

UNITÉ 66 - CRÉATION DE BASE DE DONNÉES

Cette unité est la plus longue incluse dans le curriculum. Il sera impossible de couvrir tout ce matériel en une seule conférence, mais il n'y a pas de pause claire pour le diviser proprement. Une partie du matériel est technique et une partie orientée vers la gestion. Vous devrez décider ce qu'il faut omettre, si nécessaire, en fonction des intérêts et des antécédents scolaires de vos élèves.

UNITÉ 66 - CRÉATION DE BASE DE DONNÉES

  • un FRS établit :
    • les produits à générer par le système
    • les données nécessaires pour générer les produits
    • les fonctions qui doivent opérer sur les données

      cette unité examine les questions de gestion et de planification impliquées dans la création physique de la base de données

      les bases de données pour la gestion des installations sont souvent des extensions de bases de données non géographiques existantes
        dépendent trop des spécificités des systèmes

      • définition du contenu de la base de données et de ses "vues externes"
        • voir l'unité 43 pour une discussion sur les différentes "vues" d'une base de données

          fournit un cadre complet pour la base de données

        • données non pertinentes qui ne seront pas utilisées
        • données omises
        • pas de potentiel de mise à jour
        • représentation inappropriée des entités
        • manque d'intégration entre les différentes parties de la base de données

          rappel de l'unité 10, que les étapes de la conception de la base de données sont :

        • indépendant du logiciel et du matériel
        • décrit et définit les entités et objets spatiaux inclus

        • spécifique au logiciel mais indépendant du matériel
        • déterminé par le système de gestion de base de données (discuté dans l'unité 43)

        • spécifique au matériel et au logiciel
        • liés aux problèmes de structure de fichier, de taille de mémoire et d'exigences d'accès
        • cette unité se concentre principalement sur cette dernière étape

        • quel support de stockage utiliser ?
          • quelle est la taille de la base de données ?
          • combien peut-on stocker en ligne ? quelle vitesse d'accès est requise pour quelles parties de la base de données ?
          • comment la base de données doit-elle être disposée sur les différents supports ?
          • quelle croissance faut-il prévoir pour l'acquisition de périphériques de stockage ?

          • de nouveaux attributs seront-ils ajoutés ?
          • le nombre de fonctionnalités stockées va-t-il augmenter ?

          • les données sources sont-elles partitionnées ?
          • les produits seront-ils partitionnés ?

          • qui devrait pouvoir redéfinir le schéma - de nouveaux attributs, de nouveaux objets, de nouvelles classes d'objets ?
          • qui devrait pouvoir éditer et mettre à jour ?

            s'il est distribué, comment sera-t-il partitionné entre les hôtes ?

            qui est responsable du maintien des normes de définition ? normes de format? précision? la documentation doit-elle inclure l'accès au compilateur des données ?

            d'où viendront les données ?

          • les bases de données pour les applications SIG vont de quelques mégaoctets (un petit projet de gestion des ressources) à des téraoctets
            • un petit projet raster utilisant IDRISI, 100 par 200 cellules, 50 couches peut nécessiter une base de données de 10 Mo sur un PC/AT
            • un projet vectoriel de taille moyenne pour une forêt nationale utilisant ARC/INFO peut nécessiter 300 Mo
            • une base de données d'archives nationale peut atteindre plusieurs centaines de gigaoctets
            • la base de données spatiale représentée par les images actuellement accumulées de Landsat est de l'ordre de 1013 octets

            • pour être en ligne, les données doivent être stockées sur un disque fixe ou amovible
            • par rapport à d'autres formes de stockage permanent, les coûts de disque sont élevés et il existe une limite supérieure effective de 100 Go pour le stockage en ligne lors de l'utilisation de la technologie de disque magnétique commune

            • seuls les extraits seront en ligne pour analyse à tout moment
            • les systèmes d'archivage prennent plus de temps pour monter les médias sur le matériel
            • le temps d'accès pour extraire les sous-ensembles des données d'archives une fois montés est de 1 minute

            • Bande magnetique
            • disque amovible
            • CD ROM
              • pas de possibilité de modifier les données une fois écrites - ceci est acceptable pour de nombreux types de données géographiques
              • les copies sont très bon marché
              • les magasins de bandes magnétiques peuvent être automatisés, augmentant la capacité effective à 1 To (commandez 10 000 bandes)
                • commander 10 000 bandes est également une limite supérieure efficace à la taille d'une bibliothèque de bandes (classique, montage manuel)

                  la base de données doit-elle être centralisée ou distribuée ?

                  • chaque service responsable du maintien de sa propre part de la base de données
                  • optimise l'utilisation de l'expertise

                    dans certaines applications, tous les fichiers, attributs, objets peuvent être anticipés lorsque la base de données est définie
                      par exemple. les systèmes de gestion des installations ne permettent généralement pas de redéfinir la structure de la base de données par utilisateur

                      cette capacité est généralement importante dans les applications de gestion des ressources

                    • administrateur de base de données uniquement ?
                    • chef de projet uniquement ?
                    • n'importe quel utilisateur ?

                      de nombreuses bases de données spatiales sont partitionnées en interne
                        les partitions peuvent être définies spatialement (comme des feuilles de carte) ou thématiquement ou les deux

                        capacité des périphériques de stockage
                          peut limiter la quantité de données que le système peut gérer en tant qu'unité physique

                          plus facile de mettre à jour une partition (par exemple, une feuille de carte) à la fois

                          peut être plus rapide si une seule partition est accessible à la fois

                        • plus facile de copier une partition que d'extraire une partie d'une base de données plus importante
                          • par exemple. Le US Bureau of the Census a choisi de partitionner ses fichiers TIGER par comté pour une distribution en fonction des besoins des utilisateurs
                          • par exemple. L'US Geological Survey partitionne les données cartographiques numériques par feuille de carte au 1:100 000

                          • les utilisateurs ont besoin de certaines combinaisons de zone géographique et de thème plus souvent que d'autres
                          • illustré par la disposition conventionnelle des séries de cartes topographiques et thématiques
                            • par exemple. les informations sur les sols ne sont normalement pas affichées sur les cartes topographiques standard

                              malgré la présence de partitionnement, les concepteurs de système peuvent choisir de masquer les partitions à l'utilisateur et de présenter une vue homogène et transparente de la base de données
                                par exemple. sont des systèmes disponibles pour mosaïquer automatiquement les scènes Landsat, afin que les utilisateurs puissent travailler indépendamment des limites normales des scènes

                              • les parties d'un objet qui s'étendent sur des partitions géographiques doivent être logiquement liées
                                • les entités qui s'étendent à travers les limites des tuiles doivent avoir des coordonnées géographiques et des attributs identiques sur les bords adjacents
                                • chaque objet doit avoir un identifiant unique sur l'ensemble de la base de données

                                  les documents sources (cartes) déterminent généralement le découpage thématique initial des données en couches
                                    ces couches initiales n'ont pas besoin de coïncider avec la façon dont les données sont structurées en interne
                                      par exemple. l'application peut considérer les lacs et les ruisseaux comme une seule couche tandis que la structure de données peut les voir comme deux objets différents - des polygones et des lignes

                                    • quels types de données ont des relations qui doivent être stockées dans la base de données
                                    • ceux-ci devront être sur la même couche ou stockés de manière à ce que les relations entre eux puissent être rapidement déterminées

                                      quels ensembles de données ont tendance à être utilisés ensemble lors de la création de produits
                                        il peut être plus efficace de les stocker sur une seule couche

                                        les données qui doivent être mises à jour fréquemment doivent être isolées

                                        les caractéristiques communes à de nombreuses couvertures, telles que les rivages et les rivières, peuvent être stockées séparément puis utilisées pour créer d'autres couvertures qui incorporent ces lignes comme limites

                                      • Les systèmes de CAO traitent chaque classe d'objets comme une couche distincte
                                      • de nombreux systèmes raster traitent chaque attribut comme une couche distincte, bien que les objets puissent avoir de nombreux attributs
                                      • certaines conceptions SIG plus récentes évitent entièrement le concept de couches, stockant ensemble toutes les classes d'objets et leurs interrelations

                                        les tuiles peuvent couvrir la même zone dans toute la base de données, ou elles peuvent avoir des tailles variables

                                      • généralement inefficace en termes de stockage puisque certaines tuiles auront beaucoup de données et d'autres très peu
                                      • bon lorsque le volume de données change dans le temps car il n'est pas nécessaire de restructurer les tuiles avec des mises à jour

                                      • efficace en terme de stockage
                                      • difficile à restructurer si de nouvelles données sont ajoutées

                                      • par exemple. un gestionnaire forestier veut des cartes d'inventaire du bois à l'échelle 1:24 000
                                      • la taille des parcelles est limitée par le traceur lui-même, et par les contraintes physiques de manutention et de stockage
                                      • il est logique de générer des cartes d'inventaire du bois en quadrangles de 7,5 minutes
                                      • étant donné que les données seront entrées à partir de quadrangles, pourquoi ne pas également mettre en mosaïque toute la base de données en quadrangles ?
                                      • cependant, un bibliothécaire sera nécessaire lorsque des produits à petite échelle doivent être générés en utilisant plusieurs tuiles à la fois

                                        le processus de saisie des données pour créer la base de données est souvent appelé conversion de données
                                          implique la conversion de données provenant de diverses sources au format requis par le système sélectionné

                                        • la prise en compte de ces options est essentielle dans la planification de la création de la base de données
                                        • L'unité 7 aborde plusieurs questions liées à l'intégration de données provenant de différentes sources

                                        • besoin de considérer les exigences de la base de données en termes de :
                                            • échelle
                                            • précision
                                            • priorités de planification
                                            • Coût

                                              peut ne pas avoir besoin d'augmenter les dépenses et le temps pour saisir des données à plus grande échelle

                                            • la saisie des données est laborieuse et chronophage
                                              • certains fournisseurs de SIG aident à l'effort de conversion, et il existe un certain nombre d'entreprises spécialisées dans la conversion
                                              • certaines agences effectuent leur conversion en interne, mais il y a une réticence à le faire, dans de nombreux cas, car le personnel supplémentaire peut ne pas être nécessaire une fois la conversion initiale terminée

                                              • le personnel de l'agence, qui connaît la « vérité terrain » et les situations uniques des zones d'intérêt, est capable de superviser l'effort de conversion
                                                • cela peut être important pour les situations imprévues dans lesquelles les règles générales ne peuvent pas être appliquées uniformément
                                                • si les cartes sont envoyées pour numérisation, ce que vous envoyez est tout ce que vous obtenez

                                                • des équipements et du personnel supplémentaires doivent être ajoutés au plan de projet
                                                • un engagement à long terme envers des employés à temps plein peut être coûteux

                                                  la création de base de données est une opération longue et coûteuse qui doit être échelonnée sur plusieurs années de fonctionnement
                                                    le coût total de la création de la base de données dépassera probablement les coûts du matériel et des logiciels d'un facteur de quatre ou cinq
                                                      par exemple. sur une période de 5 ans, sur un coût total de 5 millions de dollars d'un projet SIG typique pour la gestion des ressources, 4 millions de dollars ont été consacrés à la collecte et à la saisie de données, seulement 1 million de dollars au matériel, aux logiciels, à l'administration et au développement d'applications

                                                      par exemple. nombres de points, polygones, longueurs de lignes, nombre de caractères d'attribut

                                                      pour générer une tuile d'un produit, les couches de données requises pour la tuile correcte doivent avoir été saisies

                                                      • les mieux classés sont ceux qui présentent des avantages élevés et un faible coût des intrants nécessaires
                                                      • les moins bien classés sont les avantages faibles et les coûts d'entrée de données élevés
                                                      • certaines couches peuvent être utilisées par plusieurs produits - une fois saisies, le coût pour les autres produits est nul

                                                      • de nombreuses couches de données peuvent ne pas exister, peuvent devoir être compilées à partir de photos aériennes ou d'observations sur le terrain
                                                      • le calendrier de saisie des données devra tenir compte de la disponibilité des données ainsi que des priorités des produits

                                                      • Flathead NF situé dans le nord-ouest du Montana sur le versant ouest de Continental Divide
                                                        • à côté du parc national des Glaciers
                                                        • siège social à Kalispell, MT

                                                          Superficie forestière répartie sur 133 quadrangles 1:24 000 (7,5 minutes)

                                                        • important de noter que ce plan considère les besoins de Flathead NF isolément
                                                          • peut ne pas être compatible avec les besoins nationaux du service forestier ou la politique nationale élaborée dans le cadre du plan national de SIG
                                                          • peut entrer en conflit avec les concepts émergents d'informations d'entreprise à l'échelle du service (voir l'unité 71)

                                                            FRS identifie 55 produits d'information

                                                            extrait d'une étude de Tomlinson Associates, Inc.

                                                            total de 58 ensembles de données d'entrée requis

                                                            volume total de la base de données estimé à 1 Go

                                                          • 3 interprété à partir de Landsat, disponible sous forme de trame
                                                          • 9 numérisés sous forme vectorielle, rastérisés par VICARS

                                                          • les échelles de carte vont de 1:24 000 à 1: 250 000
                                                          • les ensembles de données varient en complexité
                                                          • le nombre de feuilles de carte varie selon l'échelle

                                                          • Le quadrangle 1:24 000 de 7,5 minutes domine les exigences d'entrée et de sortie
                                                            • par conséquent, il est logique d'utiliser des quadrangles comme tuiles dans la base de données si elle doit être en mosaïque (dépend du système choisi)
                                                            • pourrait utiliser des agrégations de quadrangles de 7,5 minutes, par ex. quadrangulaires de 15 minutes

                                                            • j'avais besoin de:
                                                              • affecter des données d'entrée à des types d'objets, des calques
                                                              • déterminer les relations à stocker dans la base de données
                                                              • déterminer les conventions de nommage pour les fichiers, les attributs

                                                              • nécessité de permettre les mises à jour ainsi que la saisie initiale des données
                                                                • certaines couches mises à jour régulièrement - par ex. récolte de bois
                                                                • certains irrégulièrement - par ex. feux de forêt

                                                                  l'arrangement préféré est une base de données centralisée au siège de Forest, accès à partir de postes de travail à travers la forêt

                                                                • la conception du système offre peu d'accès à la base de données en mode requête
                                                                • par conséquent, la génération de produits peut être groupée et les données doivent être en ligne uniquement pendant la génération de produits
                                                                • cependant 1 Go est facilement hébergé en ligne

                                                                • le calendrier de création de la base de données détermine la capacité à générer des produits
                                                                  • FRS appelle à la génération de 4 513 produits cartographiques individuels et de 3 871 produits de liste au cours des mêmes 6 années
                                                                  • le besoin de numérisation sera le plus important en début de période
                                                                  • la capacité à produire sera la plus élevée à la fin

                                                                  • routes, limites de la section PLSS - toutes les entrées dans l'année 1
                                                                  • lacs et ruisseaux - échelonnés sur les années 2 à 4
                                                                  • peuplements forestiers - échelonnés sur les années 2-4
                                                                  • zones de récolte - entrée à partir de l'année 4

                                                                  Comité ACSM-ASPRS GIMS, 1989. "Directives de base de données géographiques polyvalentes pour les gouvernements locaux," Bulletin ASCM, numéro 121:42-50. Fournit un aperçu général pour la prise en compte de l'échelle et du contenu des bases de données SIG municipales.

                                                                  Calkins, H.W. et D.F. Marble, 1987. "La transition vers la cartographie de production automatisée: conception de la base de données cartographique principale," The American Cartographer 14:105-119. Souligne la nécessité d'une conception rigoureuse de la base de données et illustre l'utilisation du modèle entité-relation pour les bases de données spatiales.

                                                                  Nyerges, T.L., 1989. "Analyse d'intégration de schéma pour le développement de bases de données SIG," International Journal of Geographical Information Systems 3:152-83. Décrit les méthodes d'analyse des différences et des similitudes entre deux ou plusieurs bases de données

                                                                  Nyerges, T.L. et K.J. Dueker, 1988. "Systèmes d'information géographique dans les transports," Département américain des transports, Washington, DC. Le rapport décrit l'utilisation potentielle du SIG dans les bureaux des transports de l'État et les types de données et de fonctionnalités qui seraient nécessaires.

                                                                  Tomlinson Associates Inc., 1985. Analyse des charges de travail des systèmes d'information géographique avancés : rapport sur les forêts individuelles de la forêt nationale de Flathead. Rapport au US Forest Service.

                                                                  1. Discutez des avantages et des inconvénients des bases de données distribuées par rapport aux bases de données centralisées pour les agences de gestion des ressources.

                                                                  2. La plupart des applications SIG pour la gestion des ressources à ce jour ont été développées autour d'un hôte dédié, plutôt que de partager l'espace sur un ordinateur central à usage général. En fait, le développement des mini-ordinateurs à la fin des années 1970 a donné un formidable élan au SIG car il a rendu disponibles des ordinateurs dédiés à des coûts qui étaient à la portée de nombreux organismes. Pourquoi les développeurs SIG préfèrent-ils un hébergeur dédié ? Ces arguments sont-ils compatibles avec l'idée d'une base de données distribuée sur un réseau ?

                                                                  3. Décrire les fonctions d'un gestionnaire de base de données pour une installation SIG.

                                                                  4. Malgré l'importance de la conception dans les bases de données SIG, il existe actuellement très peu de littérature sur le sujet. Pourquoi?

                                                                  5. Le produit Caribou pour le Service forestier demande des informations sur l'élévation et l'aspect. Quelles sont les différentes sources et modèles de données qui pourraient être utilisés pour fournir ces informations ? Quels effets chaque choix peut-il avoir sur la génération du produit ?

                                                                  6. Supposons que le Service forestier détermine que son SIG serait mis en œuvre en mode requête plutôt qu'en mode produit, c'est-à-dire qu'il formerait ses gestionnaires à travailler directement avec la base de données, au lieu de définir des produits à générer par le système. Comment procéderiez-vous pour identifier les exigences d'entrée et de sortie d'un système basé sur des requêtes ? Quels autres éléments seraient importants dans la planification du système ?


                                                                  Veuillez envoyer vos commentaires concernant le contenu à : Brian Klinkenberg
                                                                  Veuillez envoyer vos commentaires concernant les problèmes du site Web à : Le Techmaster
                                                                  Dernière mise à jour : 30 août 1997.


                                                                  Famille

                                                                  Texte en format libre: AFFECTATION CORRECTIVE POUR CORRIGER LA SECTION NUMÉROS DE PROPRIÉTÉ. LES NUMÉROS DE BREVET 10003946 ET 10119825 ONT ÉTÉ INCORRECTEMENT DÉSIGNÉS COMME NUMÉROS DE DEMANDE. PRÉCÉDEMMENT ENREGISTRÉ SUR LA BOBINE 052323 CADRE 0254. LE(S) CESSIONNAIRE(S) CONFIRME PAR LA PRÉSENTE LA CESSION D'INTÉRÊTS DE SÉCURITÉ DANS LE CESSIONNAIRE DE BREVETS : BANK OF AMERICA, N.A., EN TANT QU'AGENT EXISTANT/CADRE : 056304/0891

                                                                  Date effective: 20200402

                                                                  Le nom du propriétaire: GOLUB CAPITAL MARKETS LLC, EN TANT QU'AGENT SUCCESSEUR, NEW YORK

                                                                  Texte en format libre: AFFECTATION CORRECTIVE POUR CORRIGER LA SECTION NUMÉROS DE PROPRIÉTÉ. LES NUMÉROS DE BREVET 10003946 ET 10119825 ONT ÉTÉ INCORRECTEMENT DÉSIGNÉS COMME NUMÉROS DE DEMANDE. PRÉCÉDEMMENT ENREGISTRÉ SUR LA BOBINE 052323 CADRE 0304. LE(S) CESSIONNAIRE(S) CONFIRME PAR LA PRÉSENTE LA CESSION DE L'INTÉRÊT DE SÉCURITÉ DANS LE CESSIONNAIRE DE BREVETS : BANK OF AMERICA, N.A., EN TANT QUE AGENT/FRAME EXISTANT : 056305/0117

                                                                  Date effective: 20200402

                                                                  Le nom du propriétaire: VISION SOLUTIONS, INC., NEW YORK

                                                                  Texte en format libre: PREMIER LIEN DE LIBÉRATION DE L'INTÉRÊT DE SÉCURITÉ DANS LE CESSIONNAIRE DE BREVETS : JEFFERIES FINANCE LLC, EN TANT QU'AGENT DE GARANTIE/CADRE : 056038/0001

                                                                  Date effective: 20210423

                                                                  Le nom du propriétaire: PRECISELY SOFTWARE INCORPORATED (F/K/A SYNCSORT INCORPORATED), NEW YORK

                                                                  Texte en format libre: PREMIER LIEN DE LIBÉRATION DE L'INTÉRÊT DE SÉCURITÉ DANS LE CESSIONNAIRE DE BREVETS : JEFFERIES FINANCE LLC, EN TANT QU'AGENT DE GARANTIE/CADRE : 056038/0001

                                                                  Date effective: 20210423

                                                                  Le nom du propriétaire: PITNEY BOWES SOFTWARE INC., NEW YORK

                                                                  Texte en format libre : PREMIER LIEN DE LIBÉRATION DE L'INTÉRÊT DE SÉCURITÉ DANS LE CESSIONNAIRE DE BREVETS : JEFFERIES FINANCE LLC, EN TANT QU'AGENT DE GARANTIE/CADRE : 056038/0001

                                                                  Date effective: 20210423

                                                                  Le nom du propriétaire: PITNEY BOWES SOFTWARE INC., NEW YORK

                                                                  Texte en format libre: DEUXIÈME LIBÉRATION DE L'INTÉRÊT DE SÉCURITÉ DANS LE CESSIONNAIRE DE BREVETS : GOLUB CAPITAL MARKETS LLC, EN TANT QU'AGENT DE GARANTIE/CADRE : 056107/0233

                                                                  Date effective: 20210423

                                                                  Le nom du propriétaire: PRECISELY SOFTWARE INCORPORATED (F/K/A SYNCSORT INCORPORATED), NEW YORK

                                                                  Texte en format libre: DEUXIÈME LIBÉRATION DE L'INTÉRÊT DE SÉCURITÉ DANS LE CESSIONNAIRE DE BREVETS : GOLUB CAPITAL MARKETS LLC, EN TANT QU'AGENT DE GARANTIE/CADRE : 056107/0233

                                                                  Date effective: 20210423

                                                                  Le nom du propriétaire: VISION SOLUTIONS, INC., NEW YORK

                                                                  Texte en format libre: DEUXIÈME LIBÉRATION DE L'INTÉRÊT DE SÉCURITÉ DANS LE CESSIONNAIRE DE BREVETS : GOLUB CAPITAL MARKETS LLC, EN TANT QU'AGENT DE GARANTIE/CADRE : 056107/0233


                                                                  8128 À mi-parcours

                                                                  Pyramide de tolérance Z
                                                                  -Meilleur pour les données "terre nue"
                                                                  -Valeur de tolérance z initiale basée sur la précision des données à pleine résolution
                                                                  -Spécifiez l'échelle à laquelle vous souhaitez afficher la pleine résolution, puis réduisez l'échelle et augmentez la tolérance Z pour chaque "niveau"

                                                                  Peut être affiché dans ArcMap et ArcGlobe mais pas dans ArcScene

                                                                  Peut être initialement collecté sous forme d'image raster ou créé à partir de données ponctuelles

                                                                  Les TIN et les rasters peuvent être utilisés comme surfaces d'altitude dans une scène et les couches 2D ajoutées à la scène seront "drapées" sur le TIN ou le raster et en obtiendront les valeurs d'altitude

                                                                  Les terrains peuvent être visualisés en les ajoutant en tant que couche à une scène mais ne peuvent pas être utilisés comme surface d'altitude - convertissez-le en raster si vous souhaitez l'utiliser comme surface

                                                                  Plusieurs outils d'analyse 3D disponibles
                                                                  -Outils de gestion des données
                                                                  -Outils de conversion
                                                                  -Surface fonctionnelle, surface tronquée, outils de visibilité
                                                                  -3D Fonctionnalités Outils
                                                                  -Ensembles d'outils raster
                                                                  -Outils Lidar

                                                                  Fonctionnalités 3D
                                                                  -Les hauteurs des bâtiments peuvent être estimées à partir des empreintes de bâtiments et du lidar
                                                                  -Les bâtiments texturés peuvent être importés à partir d'autres formats
                                                                  -Les fonctionnalités peuvent être créées à l'aide de CityEngine

                                                                  Le volet Catalogue "affecte" le dessin CAO en 5 types standard de classes d'entités, tous ne contiennent pas de données

                                                                  Les données CAO peuvent être visualisées et interrogées dans Arc Pro mais sont en lecture seule

                                                                  Chaque classe d'entités DAO "représentative" peut être convertie en fichier de formes ou en géodatabase à l'aide de classe d'entités en classe d'entités

                                                                  L'importation rapide effectuera les conversions et conservera les fonctionnalités 3D

                                                                  CAD to Geodatabase importera un ou plusieurs fichiers DAO entiers dans un ensemble de classes d'entités qui se trouvent dans un jeu de classes d'entités dans une géodatabase

                                                                  Shapefile développé plus tard, et géodatabase après cela

                                                                  Encore beaucoup de données numériques au format couverture et shapefile

                                                                  Doit tout convertir en géodatabase pour éditer et analyser b/c c'est un modèle de données plus puissant

                                                                  Conversion de couverture - classe d'entités en classe d'entités (permet le mappage de champs) ou copier des entités (pas de mappage de champs)

                                                                  Les couvertures sont des points, des arcs ou des polygones

                                                                  Chacun contient des images et des paramètres d'éléments graphiques

                                                                  Les outils KML en couche convertissent KML ou KMZ en classe d'entités et en fichier de couche

                                                                  Couche en KML - Couche, fichier de couche ou fichier raster converti en KMZ

                                                                  Format standard ouvert pouvant être manipulé par de nombreux langages de programmation

                                                                  Toutes les données raster ne représentent pas des images, mais toutes les images sont stockées en tant que rasters

                                                                  Les images peuvent représenter des zones géographiques

                                                                  Les images de télédétection peuvent être "géoréférencées" et incorporées dans un SIG
                                                                  -afficher les images dans le gis
                                                                  -numériser directement sur les images
                                                                  -extraire des points/lignes/polygones de l'image aux données vectorielles
                                                                  -Certains SIG peuvent faire de la classification d'images

                                                                  Un SIG capable d'afficher et d'analyser des images doit :
                                                                  -Avoir un zoom/panoramique rapide
                                                                  -avoir plusieurs fenêtres
                                                                  -être capable d'aligner géographiquement les images avec des caractéristiques vectorielles
                                                                  -Avoir des algorithmes précis pour la transformation d'image / les changements de projection / les conversions raster en vecteur

                                                                  Pour utiliser des images avec des données géographiques, elles doivent être "géoréférencées" afin que les coordonnées des pixels soient dans les coordonnées du monde réel

                                                                  Dans ArcGIS Pro, les coefficients peuvent être générés à l'aide de l'onglet Géoréférence pour créer au moins 3 points de contrôle (coordonnées connues du monde réel)

                                                                  Appliquer ensuite les transformations
                                                                  -Affine (premier ordre) le plus courant - met à l'échelle, déplace et fait pivoter les données d'image brutes pour s'adapter aux coordonnées du monde réel
                                                                  -Polynôme (deuxième et troisième ordre) également disponible - coudes et courbes raster
                                                                  -Méthodes de transformation supplémentaires disponibles - utilisation dépendante des données sources
                                                                  -Lorsque les coefficients appliqués aux transformations sont calculés et l'erreur résiduelle donnée (erreur RMS)
                                                                  -L'erreur doit être dans la précision des données - si elle est trop grande, vous aurez peut-être besoin de différents points de contrôle
                                                                  -"Save" enregistre les coefficients dans le fichier auxiliaire mais ne modifie pas le raster - la transformation est appliquée "à la volée" lors de la visualisation


                                                                  Types organisationnels de mosaïques

                                                                  L'organisation de vos mosaïques peut devenir plus complexe car vous devez gérer différents types de données. Ci-dessous, illustre deux combinaisons standard qui pourraient être utilisées pour gérer et publier vos images.

                                                                  Il est généralement avantageux de séparer les mosaïques en deux types : celles qui sont principalement utilisées pour la gestion et celles qui sont publiées. Cette séparation peut aider à l'organisation.

                                                                  Au fur et à mesure que vous créez et organisez votre collection d'images à l'aide de mosaïques, il peut être utile de comprendre les différents types de mosaïques et à quoi elles peuvent servir. Les mosaïques source et dérivée décrites ci-dessous sont des noms symboliques utilisés pour aider à comprendre la structure organisationnelle des mosaïques, tandis qu'une mosaïque de référence est une forme physiquement différente d'une mosaïque.

                                                                  Mosaïque source

                                                                  Utilisé pour la gestion des images. Il contient généralement une collection d'images similaires. Vous pouvez utiliser plusieurs de ces mosaïques sources pour gérer différentes collections. Celles-ci peuvent être publiées directement ou utilisées comme source pour d'autres mosaïques. Il est recommandé de fournir l'accès à (publier) cette mosaïque à l'aide d'une mosaïque de référence pour la sécuriser. L'image et les données raster sont directement ajoutées à une mosaïque source.

                                                                  Une mosaïque source est créée à l'aide de l'outil Créer une mosaïque. Si l'imagerie d'entrée a une profondeur de bits ou un nombre de bandes cohérent, ces valeurs n'ont pas besoin d'être définies dans cet outil car elles seront extraites de la première image ajoutée. Le système de référence spatiale sera probablement le même que les entrées, mais si les données d'entrée couvrent plusieurs systèmes de référence spatiale, choisissez-en un approprié pour tous. Utilisez ensuite l'outil Ajouter des rasters à la mosaïque et utilisez le type de raster approprié.

                                                                  Dans la plupart des cas, les images d'une mosaïque source auront le même nombre de canaux et la même profondeur de bits. Ces mosaïques sources sont gérées et utilisées pour affiner des aspects de la collection : affinage des empreintes ou des processus de mise en place tels que l'orthorectification.

                                                                  Vous pouvez modifier les fonctions pour des images individuelles en accédant à la fenêtre du visualiseur pour chacune via la table attributaire, ou en modifier plusieurs à l'aide de l'assistant de l'éditeur de fonctions raster accessible à partir de la couche Footprint dans la table des matières d'ArcMap.

                                                                  En règle générale, si cette imagerie représente un seul jeu de données, comme une imagerie couvrant une date spécifique, vous créerez des aperçus pour cette mosaïque.

                                                                  Mosaïque dérivée

                                                                  Ceci est utilisé pour définir des collections d'images souvent vues par les utilisateurs comme une seule collection. La source d'une mosaïque dérivée est généralement une ou plusieurs mosaïques source. Par exemple, il peut s'agir d'une collection de toutes les images en couleurs naturelles, la source provenant de plusieurs mosaïques de sources. Il est recommandé de fournir l'accès à (publier) cette mosaïque à l'aide d'une mosaïque de référence pour la sécuriser. En outre, vous pouvez créer d'autres mosaïques à partir de celle-ci pour fournir des produits d'imagerie spécifiques, tels qu'une combinaison de canaux spécifique, ou uniquement sur une zone spécifique. Les données image et raster sont ajoutées via une mosaïque à une mosaïque dérivée.

                                                                  Une mosaïque dérivée est également créée à l'aide de l'outil Créer une mosaïque. Souvent, l'imagerie d'entrée aura différentes profondeurs de bits et bandes, vous devez donc spécifier ces valeurs ou définir une définition de produit pour contrôler la sortie de la mosaïque. De plus, choisissez un système de référence spatiale pouvant accueillir toutes les images.

                                                                  Le système de référence spatiale est utilisé pour générer les emprises, les limites et d'autres éléments associés dans la mosaïque, ainsi qu'une valeur par défaut avec laquelle l'imagerie mosaïquée sera rééchantillonnée. Vous devez en choisir un qui convient à toutes les images que vous pouvez ajouter. Il peut s'agir d'un système de pays ou d'une zone UTM. Cependant, si vous créez une mosaïque qui peut avoir une étendue globale ou qui sera mélangée avec des services Web, vous souhaiterez peut-être utiliser la projection WGS 1984 Web Mercator Auxiliary.

                                                                  Il est recommandé d'ajouter une mosaïque source à une autre mosaïque à l'aide du type raster Table. L'utilisation du type raster Table créera une mosaïque contenant la totalité ou une sélection des éléments de la table dans les mosaïques source, et pas seulement un seul élément représentant la mosaïque source. Cela vous donnera la possibilité d'effectuer des requêtes et de continuer à accéder aux métadonnées individuelles pour chaque élément. Vous pouvez également ajouter des fonctions à des éléments individuels et personnaliser plus facilement la mosaïque avec des lignes de raccord, des méthodes de mosaïque et des corrections de couleur. De plus, l'outil Synchroniser la mosaïque avec l'option Mettre à jour les plages de taille de cellule désactivée peut être utilisé pour mettre à jour cette mosaïque si l'une des sources a été modifiée, comme des empreintes modifiées ou de nouvelles images qui ont été ajoutées.

                                                                  Si vous ajoutez les mosaïques source à l'aide du type raster Jeu de données raster au lieu du type raster Table, chaque mosaïque source sera représentée comme un élément unique dans la mosaïque dérivée. Cela limitera ainsi votre capacité à effectuer des requêtes, limitera l'accès aux métadonnées à la mosaïque source au lieu de chaque image et limitera l'évolutivité de la mosaïque.

                                                                  En règle générale, vous ne créerez pas de vues d'ensemble pour cette mosaïque, car les vues d'ensemble existeront dans les mosaïques sources. Cependant, il peut être nécessaire de les construire si la mosaïque dérivée couvre une étendue beaucoup plus grande que chaque source. Au lieu de créer des vues d'ensemble, vous pouvez utiliser une autre image ou un autre service d'imagerie pour fournir une couverture d'imagerie pour toute l'étendue de la mosaïque. Lors de l'ajout de cette image, vous devez décocher l'option pour construire la limite car la limite sera étendue à l'étendue de cette image, ce qui peut ne pas être idéal.

                                                                  Mosaïque référencée

                                                                  Cela se comporte de la même manière qu'une mosaïque standard, mais vous ne pouvez pas ajouter de rasters supplémentaires à la mosaïque, vous ne pouvez pas créer de vues d'ensemble et vous ne pouvez pas calculer les plages de tailles de pixels. Vous pouvez redéfinir la limite, par exemple, pour restreindre l'accès à des zones spécifiques ou définir des fonctions supplémentaires à appliquer à toutes les images. Il est utilisé pour fournir un accès aux mosaïques (ou servir des catalogues d'images en tant que services d'imagerie) avec différentes fonctions au niveau de la mosaïque. Le partage de l'accès à une mosaïque référencée garantit que ceux qui y accèdent ne peuvent pas apporter de modifications à la mosaïque source ou dérivée, ce qui pourrait avoir un impact sur d'autres utilisateurs.

                                                                  Les mosaïques de référence sont créées à l'aide de l'outil Créer une mosaïque référencée et en définissant une autre mosaïque comme source. En règle générale, cette source peut être une mosaïque source ou une mosaïque dérivée. Les mosaïques de référence sont uniquement créées à partir d'autres mosaïques (ou d'un catalogue d'images).

                                                                  Toutes les propriétés définies sur la mosaïque en entrée seront transférées vers la mosaïque de référence, telle que la méthode de mosaïque par défaut, ou les fonctions de la mosaïque. Vous pouvez modifier ou supprimer l'un de ces éléments sans affecter la mosaïque en entrée. Vous pouvez modifier les fonctions ou les propriétés en ouvrant la boîte de dialogue Propriétés de la mosaïque à partir de la fenêtre Catalogue.


                                                                  Étapes minimales pour créer une mosaïque et ajouter des données

                                                                  1. Créez la mosaïque.
                                                                    1. Pour créer la mosaïque, cliquez avec le bouton droit sur la géodatabase dans la fenêtre Catalogue ou ArcCatalog et sélectionnez Nouveau > Mosaïque . Cela ouvrira l'outil Créer un ensemble de données en mosaïque. Ou vous pouvez accéder directement à l'outil Créer un ensemble de données en mosaïque et l'ouvrir.
                                                                    2. Vous devez spécifier un nom et une référence spatiale. La référence spatiale n'a pas besoin de correspondre aux données raster que vous ajoutez, mais elle sera utilisée pour créer l'un des composants supplémentaires, tels que la limite et les emprises. Ce sera également la référence spatiale par défaut de la mosaïque lors de l'accès. Par conséquent, tout jeu de données raster dans une référence spatiale différente sera reprojeté à la volée pour créer l'image mosaïquée.
                                                                    1. Pour ajouter des données à la mosaïque, vous pouvez cliquer dessus avec le bouton droit dans la fenêtre Catalogue ou ArcCatalog et cliquer sur Ajouter des rasters . Vous pouvez faire glisser et déposer les données que vous souhaitez ajouter à la mosaïque. Ces deux actions ouvriront l'outil Ajouter des rasters à la mosaïque. Vous pouvez également accéder directement à l'outil Ajouter des rasters à un jeu de données en mosaïque et l'ouvrir.
                                                                    2. Vous devez choisir un type raster et entrer l'emplacement des données d'entrée.
                                                                    3. Vérifiez les aperçus de mise à jour .

                                                                    Lorsque cet outil s'exécute, il ajoute les données, calcule les informations dont il a besoin et génère les aperçus. Une fois l'opération terminée, votre mosaïque sera prête à être utilisée ou publiée.

                                                                    Lorsque vous ajoutez une mosaïque à ArcMap, elle est ajoutée en tant que groupe de couches personnalisé. Par défaut, vous verrez un calque Limite, Empreinte et Image.

                                                                    Si les systèmes de référence spatiale des données et de la mosaïque ou de l'utilisateur sont basés sur des sphéroïdes différents, vous devrez peut-être définir une transformation géographique spécifique. Vous pouvez définir la transformation à deux emplacements. Lors de l'ajout d'images à la mosaïque ayant un système de référence différent de celui de la mosaïque, définissez la transformation géographique dans la boîte de dialogue Paramètres d'environnement. Si vous savez que l'utilisateur ou l'application utilisera une référence différente de celle de l'imagerie source ou de la mosaïque, ouvrez les propriétés de la mosaïque (via ArcCatalog ou la fenêtre Catalogue) et cliquez sur l'onglet Valeurs par défaut, puis définissez la propriété Transformation du système de coordonnées géographiques.

                                                                    Une mosaïque référencée est un type spécial de mosaïque. Cette mosaïque a des limites et est principalement utilisée pour distribuer une mosaïque afin que les utilisateurs ne puissent pas modifier les propriétés de l'original et pour fournir des moyens supplémentaires d'afficher les données dans une mosaïque.

                                                                    Si vous créez la mosaïque dans une géodatabase personnelle, la structure ne sera pas verrouillée lorsque vous modifierez la structure de la mosaïque, par exemple en ajoutant un champ ou une table. Par conséquent, vous devez éviter d'effectuer des opérations qui modifieront le schéma lorsque d'autres utilisateurs peuvent afficher la mosaïque. Si vous préférez que la structure soit verrouillée, créez-la dans une géodatabase fichier ou d'entreprise.


                                                                    Problèmes de gestion des données dans les systèmes cyber-physiques

                                                                    Venkat N. Gudivada , . Seshadri Srinivasan , dans Systèmes cyber-physiques de transport , 2018

                                                                    3.1 Choix du système de gestion des données

                                                                    Les systèmes de gestion de bases de données relationnelles (SGBDR) sont jusqu'à récemment l'épine dorsale de presque toutes les applications logicielles. Le SGBDR repose sur le modèle de données relationnelles pour la structuration des données et la norme SQL ISO/ANSI pour la manipulation et l'interrogation des données. Le modèle de données relationnelles est basé sur la logique des prédicats du premier ordre et se prête naturellement à fournir une méthode déclarative pour spécifier des requêtes sur la base de données [6] . Le langage SQL est à l'origine basé sur l'algèbre relationnelle et le calcul relationnel tuple [7] .

                                                                    Tenez compte des besoins de gestion de bases de données d'applications telles que CPS, IoT, Big Data, informatique mobile, Web 2.0 et services basés sur la localisation. Selon Gartner [8] , 8,4 milliards d'« objets » connectés (c'est-à-dire l'IoT) seront utilisés en 2017. Une application IoT telle que Villes intelligentes générera des volumes de données sans précédent en temps réel uniquement à partir de capteurs de température et d'humidité. Les applications Big Data, par exemple, traitent des données hétérogènes et éparses. Ces applications nécessitent une nouvelle fonctionnalité de base de données pour prendre en charge des tâches telles que la personnalisation, l'analyse prédictive en temps réel, la tarification dynamique, la détection des fraudes et des anomalies et l'état des commandes en temps réel grâce à la visibilité de la chaîne d'approvisionnement.

                                                                    Dans la plupart des applications ci-dessus, le schéma de base de données complet n'existe pas à l'avance et évolue au fil du temps. De plus, certaines applications nécessitent un modèle de données simple, mais des insertions et des recherches rapides sont essentielles. Ils nécessitent des opérations d'insertion et de récupération à très grande échelle. Cela implique efficacement prenant en charge les opérations d'insertion et de lecture à l'exclusion des opérations de mise à jour et de suppression. Les mises à jour sont souvent implémentées sous la forme d'une suppression suivie d'une insertion. Les mises à jour partielles des enregistrements sont la norme pour certains. Pourtant, pour d'autres, les transactions conformes à l'atomicité, à la cohérence, à l'isolation et à la durabilité (ACID) sont exagérées, car seule la cohérence détendue est la norme [9] . De plus, les applications nécessitent plusieurs langages de requête allant de la simple interface de programmation d'application (API) Representational State Transfer (REST) ​​aux requêtes complexes et ad hoc. Le traitement interactif des requêtes ad hoc nécessite un calcul parallèle massif à l'aide de frameworks tels que Hadoop et Spark. L'utilisation d'un SGBDR pour de telles applications équivaut à la cheville carrée proverbiale dans un trou rond.

                                                                    Le partitionnement de données sans chevauchement est nécessaire pour traiter de gros volumes de données. Le partitionnement automatique fait référence à la distribution de données entre les nœuds de calcul sans chevauchement par un système de gestion de données d'une manière transparente pour l'utilisateur. Certains systèmes assurent la réplication : plusieurs copies des mêmes données sont stockées sur différents ordinateurs pour améliorer la disponibilité des données et les performances des requêtes. Certaines applications nécessitent une prise en charge intégrée du contrôle de version et de la compression. La tolérance aux pannes au niveau matériel est essentielle pour garantir une haute disponibilité. En résumé, ces besoins particuliers nécessitent un système de gestion de base de données (SGBD) qui (1) présente des modèles de données flexibles qui peuvent évoluer au fil du temps, (2) stocke des volumes de données à l'échelle du téra/pétaoctet en les répartissant sur plusieurs centres de données pour améliorer la localité, ( 3) offre une haute disponibilité et mise à l'échelle élastique sans temps d'arrêt du système, (4) offre une cohérence détendue et configurable par l'utilisateur pour les situations qui ne nécessitent pas de transactions de base de données, (5) fournit des temps de réponse aux requêtes en temps quasi réel et (6) prend en charge un nombre d'utilisateurs simultanés de l'ordre de millions.

                                                                    Ces dernières années, un grand nombre de nouveaux systèmes de gestion de données ont vu le jour pour répondre aux besoins ci-dessus [9] . Ces nouveaux systèmes sont désignés dans la littérature sous divers noms dont NoSQL, NewSQL et Pas seulement SQL. Le terme fourre-tout NoSQL est utilisé pour désigner les systèmes qui n'utilisent pas SQL comme langage de requête principal. Les systèmes NewSQL sont des SGBDR dotés de fonctionnalités nouvelles et innovantes. Certains systèmes NoSQL peuvent utiliser SQL et sont appelés Pas seulement SQL.

                                                                    Selon les moteurs DB [10] , il existe plus de 341 systèmes de gestion des données en janvier 2018. Les moteurs DB classent également ces systèmes sur la base d'un score mis à jour mensuellement qui est calculé à l'aide de plusieurs mesures. Ils incluent la fréquence d'apparition du nom du système dans les requêtes de recherche Google et Bing, les profils LinkedIn et Upwork, les moteurs de recherche d'emploi En effet et Embauché simplement, les tweets Twitter, Google Trends et les forums de questions-réponses tels que Stack Overflow et DBA Stack Exchange. Les caractéristiques fonctionnelles de ces systèmes varient considérablement [11] .

                                                                    De par leur conception, les systèmes NoSQL ne fournissent pas toutes les fonctionnalités du SGBDR et se concentrent principalement sur la fourniture de lectures et d'écritures en temps quasi réel pour les applications avec des millions d'utilisateurs simultanés. Le terme performances à grande échelle est utilisé pour décrire la caractéristique principale de tels systèmes. Les systèmes NoSQL répondent à des degrés divers aux nouveaux besoins des applications. De plus, leurs fonctionnalités varient considérablement les unes des autres. Par exemple, (1) Redis est connu pour ses structures de données et ses mécanismes de requête élégants, (2) Riak est hautement évolutif et disponible, (3) MongoDB gère efficacement les documents structurés profondément imbriqués et calcule des agrégats sur les documents et (4) Neo4j excelle à gérer des données riches en relations.

                                                                    Du point de vue CPS, nous catégorisons les SGBD en : (1) SGBD relationnel, (2) SGBD orienté document, (3) SGBD orienté graphe, (4) SGBD famille de colonnes, (5) SGBD XML natif, (6) temps SGBD série, (7) magasins Resource Description Framework (RDF) et (8) magasins clé-valeur. Le tableau 7.1 résume les principales caractéristiques de chaque classe de systèmes de SGBD et répertorie les systèmes représentatifs pour chaque classe. Certains systèmes appartiennent à plusieurs catégories et sont appelés systèmes multimodèles. Par exemple, Microsoft Azure Cosmos DB propose des fonctions de systèmes de base de données de document, de graphique, de clé-valeur et de famille de colonnes.

                                                                    Tableau 7.1. Une taxonomie et une classification des systèmes de gestion de bases de données (SGBD)


                                                                    Cellules raster sans données générées par las2dem ? - Systèmes d'information géographique

                                                                    Comment rechercher avec la carte dans Geodisy ?

                                                                    Déplacez la carte pour afficher votre zone d'intérêt

                                                                    • Utilisez les boutons + et - en haut à gauche de la carte pour zoomer et dézoomer
                                                                    • Utilisez la molette de votre souris pour zoomer et dézoomer
                                                                    • Cliquez et faites glisser dans la carte
                                                                    • Maintenez la touche Maj enfoncée et cliquez pour dessiner un cadre vers lequel zoomer la carte
                                                                    • Sur un appareil mobile, utilisez deux doigts pour zoomer et faire glisser dans la carte

                                                                    Cliquez sur Cherche ici pour voir les résultats

                                                                    La « pertinence » des résultats de la recherche est déterminée par la taille de la zone de délimitation. Les données avec des cadres de délimitation qui correspondent le mieux à la zone que vous recherchez seront amplifiées, tandis que les cadres de délimitation qui sont beaucoup plus grands ou plus petits que la zone illustrée seront supprimés.

                                                                    Que fait le indéterminé type de données signifie-t-il lorsque je vois des résultats dans Geodisy ?

                                                                    Geodisy récolte toutes sortes de données, et tous ces types de données ne sont pas explicitement géospatiaux. Indéterminé peut avoir plusieurs sens :

                                                                    Les données en question sont liées au lieu, mais ne constituent pas un fichier géospatial traditionnel. Les exemples comprennent:

                                                                    • Données statistiques sur un lieu, comme un sondage auprès des résidents de Vancouver
                                                                    • Données météorologiques telles qu'un fichier de valeurs séparées par des virgules d'informations météorologiques pour une province. Bien que les données concernent un lieu, il s'agit d'un fichier CSV sans, par exemple, de coordonnées géospatiales ponctuelles

                                                                    L'ensemble de données est géospatial, mais les systèmes de détection de Geodisy n'étaient pas en mesure de classer par type. Les données géospatiales se présentent sous une grande variété de formats, et tous ne sont pas communs ou détectables par tous les logiciels. Les exemples comprennent:

                                                                    • Données dans des formats plus anciens, tels que les formats d'échange Esri .e00
                                                                    • Types de données spatiales rares, tels que les bases de données Spatialite

                                                                    Cela ne signifie pas que les jeux de données ne fonctionneront pas avec un système d'information géographique, mais seulement qu'ils ne sont pas téléchargeables sous forme de fichiers de formes ou de données raster depuis l'interface Geodisy. Ils sont toujours téléchargeables à partir du référentiel source d'origine, en suivant les La source de données relier

                                                                    Quel type de données est recherché dans Geodisy ?

                                                                    Bien que Geodisy soit un outil de recherche géospatiale, il recherche tout type de données ayant une composante géographique dans le la description des données. Cela signifie qu'il est possible de trouver des données à propos de un lieu. Une recherche basée sur une carte n'a traditionnellement renvoyé que des éléments pouvant être affichés dans une application spécifiquement pour la cartographie, mais Geodisy renvoie tous les types de données. La recherche de données au Nigéria renverra des données d'enquête à propos de Nigéria, même si l'ensemble de données peut ne pas contenir de points de latitude/longitude ou d'imagerie.

                                                                    Actuellement en version bêta, la recherche cartographique comprend des ensembles de données provenant de référentiels indexés par FRDR avec des métadonnées de cadre de délimitation. Des ensembles de données du référentiel Dataverse indexés par FRDR avec des métadonnées de localisation et/ou des fichiers géospatiaux sont également inclus. Geodisy du FRDR continuera d'étendre sa collection pour inclure davantage d'ensembles de données de la liste source des référentiels institutionnels du FRDR

                                                                    Geodisy contient-il des données restreintes ?

                                                                    Geodisy utilise uniquement des métadonnées et des données accessibles au public.

                                                                    Qu'est-ce que le lien de métadonnées ISO 19139 ?

                                                                    Tous les éléments apparaissant dans Geodisy auront des métadonnées géospatiales ISO 19115 créées lors de leur ajout à Geodisy qui sont disponibles au format XML ISO 19139. ISO 19115 est une norme internationale utilisée pour décrire les données géographiques. Cela garantit que :

                                                                    • Toutes les métadonnées apparaissant dans Geodisy auront un schéma cohérent et standardisé
                                                                    • Les informations géographiques non présentes dans l'enregistrement source mais découvertes par Geodisy seront ajoutées aux métadonnées de manière cohérente
                                                                    • Les métadonnées seront lisibles et utilisables par les systèmes d'information géographique modernes

                                                                    Comment les enregistrements du référentiel de données deviennent-ils des enregistrements Geodisy ?

                                                                    Les chercheurs n'ont qu'à déposer leurs données dans un référentiel connecté au FRDR. Si le dépôt contient des informations appropriées dans le dossier ou dans les fichiers associés :

                                                                    • Le record sera récolté par Geodisy
                                                                    • Toute information géographique trouvée dans le dossier de l'étude et les fichiers associés sera automatiquement récoltée
                                                                    • Un enregistrement unique pour chaque fichier contenant des données sera créé dans Geodisy, et une zone géographique sera créée pour lui en fonction de sa description ou du contenu du fichier
                                                                    • Dans le cas de plusieurs fichiers avec des données, un enregistrement Geodisy distinct sera créé pour chaque donnée appropriée, et les fichiers associés seront indiqués
                                                                    • Des métadonnées normalisées ISO 19115 seront créées
                                                                    • Des liens vers le référentiel source seront créés
                                                                    • Les cadres de délimitation des données récoltées seront générés et rendus consultables par l'interface
                                                                    • Des liens de téléchargement seront générés pour les types de fichiers valides

                                                                    Pour des conseils spécifiques à Dataverse sur l'ajout de métadonnées aux enregistrements pour les rendre détectables par Geodisy, consultez notre guide du déposant Dataverse


                                                                    6.5 Logiciel SIG

                                                                    Dans cette section, nous examinerons brièvement trois aspects du logiciel SIG. Après une introduction, nous discutons des caractéristiques variées du milieu des logiciels SIG. Contrairement à d'autres sous-sections du SIG, toute discussion sur les logiciels est difficile à structurer de manière logique. Il semble important de montrer pourquoi il en est ainsi. Notre intention ne sera pas d'embrouiller le lecteur, mais de lui faire prendre conscience de l'extraordinaire complexité de cet aspect du SIG ! Nous concluons par une revue de quelques progiciels SIG variés. D'autres sources d'informations sur les logiciels SIG seront données dans la section 6.8.

                                                                    6.5.1 Une introduction au logiciel SIG

                                                                    Tout logiciel informatique est essentiellement un programme codé qui est entré dans l'ordinateur pour le faire fonctionner. Les programmes peuvent être écrits dans divers langages informatiques et peuvent être écrits sur plusieurs types de supports d'entrée tels que les CCT et les disques. Les logiciels peuvent être généralement classés comme :

                                                                    Systèmes d'exploitation (logiciels système) qui contrôlent les tâches individuelles d'ordinateurs particuliers, par ex. MS-DOS ou UNIX.

                                                                    Programmes assembleur, compilateur et interprète qui sont utilisés pour traduire les langages informatiques en codes machine.

                                                                    Programmes écrits individuellement (logiciels d'application) que toute personne ayant les compétences nécessaires peut écrire.

                                                                    Programmes d'applications commerciaux pré-écrits - qui permettent d'exécuter n'importe quelle tâche ou jeu parmi une vaste gamme.

                                                                    Grands programmes polyvalents - appelés packages, qui effectuent généralement une gamme de tâches connexes.

                                                                    Un vrai logiciel SIG relèverait de la rubrique (v), bien que pour le fonctionnement du SIG, les logiciels de systèmes d'exploitation soient essentiels, et des logiciels classés sous les rubriques (ii), (iii) et (iv) pourraient être utilisés, en particulier ce dernier. L'interface utilisateur avec les programmes logiciels peut se faire en tapant des commandes, en sélectionnant parmi &ldquomenus&rdquo qui sont de plus en plus du type &ldquopull-down&rdquo ou &ldquopop-up&rdquo.

                                                                    Le logiciel SIG est principalement conçu pour exécuter certaines ou toutes les fonctions énumérées dans le tableau 6.1. Les premiers programmes et progiciels spécifiquement SIG ont été produits au milieu des années 1970 en Amérique du Nord, par une variété d'entreprises ou de départements privés et publics. Leur évolution et leur catégorisation ont été complexes mais il existe aujourd'hui plus de 50 véritables progiciels SIG sur le marché mondial (Montgomery, 1989). Ce marché est certain de croître rapidement à mesure que les prix baissent et que la tendance à la production de logiciels SIG pour micro-ordinateur se poursuit, c'est-à-dire que plus de la moitié de tous les logiciels SIG fonctionnent désormais sur des micro-ordinateurs, et les prix de certains packages assez sophistiqués sont inférieurs à 100 $. Le tableau 6.3, compilé récemment par Dennison Parker (1989), donne des détails sur la plupart des logiciels SIG disponibles. Maguire (1989) soutient que « Telle est l'importance des logiciels à l'heure actuelle que de nombreux ordinateurs sont achetés et vendus, non pas sur la base des spécifications du matériel, mais sur la capacité d'exécuter des logiciels populaires ». (p.208).

                                                                    6.5.2 Les caractéristiques variées des logiciels SIG

                                                                    À certains égards, il n'est même pas pratique de considérer séparément les logiciels et le matériel SIG car, dans de nombreux cas, ils sont intégralement liés. Ainsi, de nombreux logiciels sont spécifiquement écrits pour les systèmes matériels et de nombreux distributeurs SIG proposent des packages complets & ldquoturn-key&rdquo, ayant non seulement du matériel et des logiciels intégrés, mais également des installations complètes de support utilisateur. Cela dit, nous pouvons examiner certaines façons dont le logiciel SIG est si variable.

                                                                    6.5.2.1 Evolution du logiciel

                                                                    Une grande partie de ce que l'on pourrait maintenant appeler un logiciel SIG entièrement fonctionnel a évolué à partir d'autres domaines connexes ou a évolué à partir des besoins d'exécuter des fonctions SIG individuelles. La force évolutive majeure était peut-être celle du dessin assisté par ordinateur (CAO), bien que plus récemment le domaine de l'infographie ait engendré de nombreux logiciels. L'industrie de la RS a donné des incitations aux logiciels de traitement d'images, dont une grande partie est maintenant intégrée dans un SIG complet. Certains des composants logiciels de manipulation et de statistique ont largement emprunté aux programmes statistiques existants et les programmes de SGBD dérivés de l'extérieur sont de plus en plus intégrés au SIG. Plus récemment, l'accent a été mis sur la conception de logiciels basés sur les besoins de l'analyse géographique (spatiale). Le logiciel a tendance à conserver sa base de stockage de données matricielles ou vectorielles, selon la ligne d'évolution qu'il a suivie.

                                                                    6.5.2.2 Propriété du logiciel

                                                                    Aux États-Unis en particulier, d'où proviennent la plupart des logiciels, il existe deux classes principales de logiciels SIG en termes de propriété légale, à savoir ceux du domaine public (financés et recherchés par le gouvernement) et privés (appartenant à l'auteur ou à son employeur), plus certains qui tombent dans la zone grise où la propriété est incertaine. Cela pose certains problèmes car les logiciels du domaine public peuvent être vendus à des prix qui couvrent à peine plus que les coûts de distribution, et comme ils sont si bon marché qu'ils sont souvent copiés ou "acquis de manière abusive" pour être intégrés dans des packages commerciaux coûteux. La plupart des packages du domaine public fournissent peu ou pas d'installations de support, bien que certains, tels que GRASS (développé par le U.S. Army Corps of Engineers), soient bien pris en charge.

                                                                    6.5.2.3 Liens entre entreprises ou organisations

                                                                    Étant donné qu'une grande partie du logiciel a ses racines dans divers domaines, c'est-à-dire dans les ministères, les universités ou les grandes et petites entreprises privées, dont chacune peut produire un produit logiciel différent, un certain nombre de liens complexes se créent alors que l'industrie parvient à à la fois un équilibre de production optimal (en termes de variété des systèmes) et des économies d'échelle. Alternativement, certaines universités ou départements gouvernementaux commercialisent leurs propres produits ou créent des entreprises privées pour le faire.

                                                                    6.5.2.4 Politiques tarifaires

                                                                    Les progiciels sont extrêmement difficiles à tarifer et les prix présentent d'énormes écarts. Cela résulte de :

                                                                    1. Le problème de propriété publique contre propriété privée mentionné précédemment.
                                                                    2. Le fait que différents logiciels remplissent une vaste gamme de fonctions possibles.
                                                                    3. Le logiciel est produit pour une grande variété de types d'ordinateurs.
                                                                    4. Les éditeurs de logiciels déterminent leurs prix de différentes manières, bien que cela soit généralement déterminé en divisant l'investissement réalisé par le marché perçu.
                                                                    5. Il existe fréquemment des prix différents pour le même produit s'il est vendu à des étudiants, ou pour la recherche ou vendu à des entreprises privées.

                                                                    6.5.2.5 Plage fonctionnelle du logiciel

                                                                    Il ressortira clairement de ce qui précède que les logiciels vont de programmes simples ou modulaires, qui peuvent être liés à un SIG pour exécuter des fonctions spécifiques, à de grands progiciels intégrés qui peuvent exécuter toutes les fonctions SIG. Certains progiciels sont spécifiquement conçus pour les ordinateurs centraux ou les mini-ordinateurs, d'autres pour les micro-ordinateurs, bien que de plus en plus les grandes sociétés SIG conçoivent leurs programmes pour s'adapter à n'importe quelle taille d'ordinateur. De nombreux packages sont &ldquopersonnalisés&rdquo pour répondre aux besoins spécifiques des utilisateurs finaux. En raison de cette gamme fonctionnelle, il n'y a pas deux programmes ou progiciels identiques, et il est donc impossible de les comparer les uns aux autres ou de lancer un système de classification de logiciels significatif.