Suite

Déterminer si les pixels raster sont dans ou hors de la zone

Déterminer si les pixels raster sont dans ou hors de la zone


J'exécute ArcGIS 10.2.2 et j'utilise souvent les outils de statistiques zonales et de tabulation. Je voulais confirmer que la zone d'un pixel ne sera incluse dans la zone tabulée que si le centroïde du pixel est dans la zone et que toute la zone du pixel sera incluse, même si une partie du pixel est en dehors de la zone. Vice versa, si le centroïde du pixel est en dehors de la zone, la zone ne sera pas incluse même si une partie du pixel est à l'intérieur de la zone.


Malheureusement, étant donné que le code source d'ArcGIS n'est pas disponible publiquement, nous ne pouvons pas savoir avec certitude comment ESRI traite les emplacements des limites lorsque vous fournissez une entrée de couche de zone vectorielle. Cependant, comme le souligne DanC ci-dessus, il est très probable qu'une sorte de conversion interne vecteur-raster ait lieu de telle sorte que la couche de zone vectorielle soit mappée sur la même structure raster que la couche de données. J'ai une certaine expérience de la programmation d'un outil similaire (voir ici) et c'est la seule façon logique de gérer ce problème particulier.

Comme jbchurchill le souligne dans la section des commentaires, il existe en fait plusieurs critères permettant de classer les cellules de la grille lors de la conversion vecteur-raster dans ArcGIS, notamment CELL_CENTER, MAXIMUM_AREA et MAXIMUM_COMBINED_AREA. Il est très probable que l'approche CELL_CENTER soit utilisée en interne car c'est la méthode la plus efficace, et si tel est le cas, la réponse à votre question serait oui, le centre de la cellule doit être dans la zone à compter.

La meilleure approche pour gérer ce problème serait d'effectuer vous-même la conversion vecteur-raster avant d'exécuter l'opération Statistiques zonales, de sorte que vous ayez plus de contrôle sur la façon dont les cellules limites sont gérées. (Remarque : j'ai supprimé mes commentaires ci-dessus pour supprimer une partie de l'élément de discussion sur la façon dont cette réponse a été dérivée et je voudrais également remercier pleinement DanC et jbchurchill pour leurs contributions. DanC, je dis toujours, si vous êtes prêt à postez quelque chose… je vais supprimer ma réponse pour que vous puissiez en avoir le crédit !)


Déterminer si les pixels raster sont dans ou hors de la zone - Systèmes d'information géographique

Le modèle de données raster est largement utilisé dans des applications allant bien au-delà des systèmes d'information géographique (SIG). Très probablement, vous connaissez déjà très bien ce modèle de données si vous avez de l'expérience avec les photographies numériques. Les formats de fichiers omniprésents JPEG, BMP et TIFF (entre autres) sont basés sur le modèle de données raster (voir Chapitre 5 "Gestion des données géospatiales", Section 5.3 "Formats de fichiers"). Prenez un moment pour visionner votre image numérique préférée. Si vous zoomez profondément sur l'image, vous remarquerez qu'elle est composée d'un ensemble de minuscules pixels carrés (ou éléments d'image). Chacun de ces pixels de couleur unique, lorsqu'il est vu dans son ensemble, se combine pour former une image cohérente (Figure 4.1 « Image numérique avec encart zoomé montrant la pixellisation de l'image raster »).

Figure 4.1 Image numérique avec encart zoomé montrant la pixellisation de l'image raster

De plus, tous les moniteurs d'ordinateur à affichage à cristaux liquides (LCD) sont basés sur la technologie matricielle car ils sont composés d'un nombre défini de lignes et de colonnes de pixels. Notamment, la fondation de cette technologie précède de près d'un siècle les ordinateurs et les appareils photo numériques. L'artiste néoimpressionniste Georges Seurat a développé une technique de peinture appelée « pointillisme » dans les années 1880, qui repose également sur l'accumulation de petits « points » d'encre monochromatiques qui se combinent pour former une image plus grande (Figure 4.2 « Art pointilliste » ). Si vous êtes aussi généreux que l'auteur, vous pouvez en effet considérer vos créations de jeux de données raster comme de sublimes œuvres d'art.

Figure 4.2 Oeuvre pointilliste

Le modèle de données raster se compose de lignes et de colonnes de pixels de taille égale interconnectés pour former une surface plane. Ces pixels sont utilisés comme blocs de construction pour créer des points, des lignes, des zones, des réseaux et des surfaces (le chapitre 2 « Anatomie de la carte », la figure 2.6 « Processus de superposition de carte » illustre comment une parcelle de terrain peut être convertie en une représentation raster). Bien que les pixels puissent être des triangles, des hexagones ou même des octogones, les pixels carrés représentent la forme géométrique la plus simple avec laquelle travailler. En conséquence, la grande majorité des données SIG raster disponibles sont construites sur le pixel carré (Figure 4.3 « Graphismes raster communs utilisés dans les applications SIG : photographie aérienne (à gauche) et USGS DEM (à droite) »). Ces carrés sont généralement reformés en rectangles de différentes dimensions si le modèle de données est transformé d'une projection à une autre (par exemple, des coordonnées State Plane aux coordonnées UTM [Universal Transverse Mercator]).

Figure 4.3 Graphiques raster courants utilisés dans les applications SIG : photographie aérienne (à gauche) et USGS DEM (à droite)

Source : Données disponibles auprès du U.S. Geological Survey, Earth Resources Observation and Science Center (EROS), Sioux Falls, SD.

En raison du recours à une série uniforme de pixels carrés, le modèle de données raster est appelé système basé sur une grille. En règle générale, une seule valeur de données sera attribuée à chaque paramètre régional de grille. Chaque cellule d'un raster porte une valeur unique, qui représente la caractéristique du phénomène spatial à un emplacement indiqué par sa ligne et sa colonne. Le type de données pour cette valeur de cellule peut être soit un nombre entier, soit une virgule flottante (Chapitre 5 « Gestion des données géospatiales », Section 5.1 « Acquisition de données géographiques »). En variante, le graphique raster peut référencer un système de gestion de base de données dans lequel des tables attributaires ouvertes peuvent être utilisées pour associer plusieurs valeurs de données à chaque pixel. Les progrès de la technologie informatique ont rendu cette deuxième méthodologie de plus en plus réalisable, car les grands ensembles de données ne sont plus limités par des problèmes de stockage informatique comme ils l'étaient auparavant.

Le modèle raster fera la moyenne de toutes les valeurs d'un pixel donné pour produire une valeur unique. Par conséquent, plus la zone couverte par pixel est grande, moins les valeurs de données associées sont précises. La zone couverte par chaque pixel détermine la résolution spatiale La plus petite distance entre deux entités adjacentes pouvant être détectées dans une image. du modèle raster dont il est dérivé. Plus précisément, la résolution est déterminée en mesurant un côté du pixel carré. Un modèle raster avec des pixels représentant 10 m sur 10 m (ou 100 mètres carrés) dans le monde réel aurait une résolution spatiale de 10 ma modèle raster avec des pixels mesurant 1 km sur 1 km (1 kilomètre carré) dans le réel monde aurait une résolution spatiale de 1 km et ainsi de suite.

Des précautions doivent être prises lors de la détermination de la résolution d'un raster car l'utilisation d'une résolution de pixels trop grossière entraînera une perte d'informations, tandis que l'utilisation d'une résolution de pixels trop fine entraînera une augmentation significative de la taille du fichier et des exigences de traitement informatique pendant l'affichage et/ou l'analyse. Une résolution efficace en pixels tiendra compte à la fois de l'échelle de la carte et de l'unité cartographique minimale des autres données SIG. Dans le cas de graphiques raster avec une résolution spatiale grossière, les valeurs de données associées à des emplacements spécifiques ne sont pas nécessairement explicites dans le modèle de données raster. Par exemple, si l'emplacement des poteaux téléphoniques était cartographié sur un graphique raster grossier, il serait clair que la cellule entière ne serait pas remplie par le poteau. Au contraire, le pôle serait supposé être situé quelque part dans cette cellule (généralement au centre).

Les images utilisant le modèle de données raster doivent présenter plusieurs propriétés. Premièrement, chaque pixel doit contenir au moins une valeur, même si cette valeur de données est zéro. De plus, si aucune donnée n'est présente pour un pixel donné, un espace réservé de valeur de données doit être affecté à cette cellule de grille. Souvent, une valeur arbitraire et facilement identifiable (par exemple, -9999) sera attribuée aux pixels pour lesquels il n'y a pas de valeur de données. Deuxièmement, une cellule peut contenir n'importe quel index alphanumérique qui représente un attribut. Dans le cas des ensembles de données quantitatifs, l'attribution des attributs est assez simple. Par exemple, si une image raster indique une élévation, les valeurs de données pour chaque pixel seraient une indication de l'élévation, généralement en pieds ou en mètres. Dans le cas des ensembles de données qualitatives, les valeurs des données sont des indices qui font nécessairement référence à une règle de traduction prédéterminée. Dans le cas d'un graphique raster d'occupation des sols/utilisation des terres, la règle suivante peut être appliquée : 1 = prairie, 2 = agricole, 3 = perturbé, etc. "). La troisième propriété du modèle de données raster est que les points et les lignes « se déplacent » vers le centre de la cellule. Comme on peut s'y attendre, si une image raster de résolution de 1 km contient une rivière ou un ruisseau, l'emplacement de la voie navigable réelle dans le pixel « rivière » ne sera pas clair. Par conséquent, il existe une hypothèse générale selon laquelle toutes les entités à zéro dimension (point) et à une dimension (ligne) seront situées vers le centre de la cellule. En corollaire, la largeur minimale de toute entité linéaire doit nécessairement être d'une cellule, quelle que soit la largeur réelle de l'entité. Si ce n'est pas le cas, la caractéristique ne sera pas représentée dans l'image et sera donc supposée absente.

Figure 4.4 Image raster d'utilisation des terres/couverture des terres

Source : Données disponibles auprès du U.S. Geological Survey, Earth Resources Observation and Science Center (EROS), Sioux Falls, SD.

Il existe plusieurs méthodes pour coder des données raster à partir de zéro. Trois de ces modèles sont les suivants :

  1. Encodage raster cellule par cellule Une méthode peu intensive pour coder une image raster en créant des enregistrements uniques pour chaque valeur de cellule par ligne et colonne. Cette méthode est également appelée « dénombrement exhaustif ». . Cette méthode peu intensive encode un raster en créant des enregistrements pour chaque valeur de cellule par ligne et colonne (Figure 4.5 « Encodage cellule par cellule des données raster »). Cette méthode pourrait être considérée comme une grande feuille de calcul dans laquelle chaque cellule de la feuille de calcul représente un pixel dans l'image raster. Cette méthode est également appelée « dénombrement exhaustif ».
  2. Codage raster sur toute la longueur Une méthode pour coder des images raster en utilisant des séries de pixels de valeur similaire. . Cette méthode encode les valeurs des cellules en séries de pixels de valeur similaire et peut produire un fichier image hautement compressé (Figure 4.6 « Encodage de la longueur de la séquence des données raster »). La méthode de codage par longueur de séquence est utile dans les situations où de grands groupes de pixels voisins ont des valeurs similaires (par exemple, des ensembles de données discrets tels que l'utilisation des terres/la couverture terrestre ou l'adéquation de l'habitat) et est moins utile lorsque les valeurs des pixels voisins varient considérablement (par exemple, les ensembles de données continus comme l'altitude ou les températures à la surface de la mer).
  3. Codage raster quad-tree Méthode utilisée pour coder des images raster en divisant le raster en une hiérarchie de quadrants qui sont subdivisés en fonction de pixels de valeur similaire. . Cette méthode divise un raster en une hiérarchie de quadrants qui sont subdivisés en fonction de pixels de valeur similaire (Figure 4.7 "Encodage Quad-Tree of Raster Data"). La division du raster s'arrête lorsqu'un quadrant est entièrement composé de cellules de même valeur. Un quadrant qui ne peut pas être subdivisé est appelé un « nœud feuille ».

Figure 4.5 Encodage cellule par cellule des données raster

Figure 4.6 Codage de longueur d'exécution des données raster

Figure 4.7 Encodage Quad-Tree des données raster


Remarques

Le raster de zone doit être une entrée raster entière. Si vous avez des zones d'entités, vous devez convertir l'entité en un raster avant de pouvoir l'utiliser dans cette fonction. Lors de la conversion, utilisez la taille de cellule et l'environnement raster d'accrochage du Raster de valeur .

Lors de la spécification des données de zone d'entrée, le champ de zone par défaut sera le premier champ entier ou texte disponible.

Le raster de valeurs peut être un entier ou une virgule flottante. Cependant, lorsqu'il est de type à virgule flottante, les calculs zonaux pour Majority , Minority et Variety ne seront pas calculés.

Le type de données de la sortie dépend du calcul de zone effectué et du type de raster de valeurs en entrée. Voir Fonctionnement des statistiques zonales pour plus d'informations.

Pour les calculs de majorité et de minorité, lorsqu'il y a égalité, la sortie de la zone est basée sur la plus faible des valeurs à égalité.


Caractéristiques générales des données raster

Dans les jeux de données raster, chaque cellule (également appelée pixel) a une valeur. Les valeurs de cellule représentent le phénomène représenté par le jeu de données raster tel qu'une catégorie, une magnitude, une hauteur ou une valeur spectrale. La catégorie peut être une classe d'utilisation des terres comme les prairies, les forêts ou les routes. Une magnitude peut représenter la gravité, la pollution sonore ou le pourcentage de précipitations. La hauteur (distance) pourrait représenter l'élévation de la surface au-dessus du niveau moyen de la mer, qui peut être utilisée pour dériver les propriétés de la pente, de l'aspect et du bassin versant. Les valeurs spectrales sont utilisées dans l'imagerie satellitaire et la photographie aérienne pour représenter la réflectance et la couleur de la lumière.

Les valeurs de cellule peuvent être positives ou négatives, entières ou à virgule flottante. Les valeurs entières sont mieux utilisées pour représenter des données catégorielles (discrètes) et des valeurs à virgule flottante pour représenter des surfaces continues. Pour plus d'informations sur les données discrètes et continues, voir Données discrètes et continues. Les cellules peuvent également avoir une valeur NoData pour représenter l'absence de données. Pour plus d'informations sur NoData, consultez NoData dans les jeux de données raster.

Les rasters sont stockés sous la forme d'une liste ordonnée de valeurs de cellule, par exemple, 80, 74, 62, 45, 45, 34, etc.

La zone (ou surface) représentée par chaque cellule se compose de la même largeur et de la même hauteur et représente une partie égale de la surface entière représentée par le raster. Par exemple, un raster représentant l'altitude (c'est-à-dire un modèle numérique d'altitude) peut couvrir une zone de 100 kilomètres carrés. S'il y avait 100 cellules dans ce raster, chaque cellule représenterait 1 kilomètre carré de largeur et de hauteur égales (c'est-à-dire 1 km x 1 km).

La dimension des cellules peut être aussi grande ou aussi petite que nécessaire pour représenter la surface véhiculée par le jeu de données raster et les entités au sein de la surface, comme un kilomètre carré, un pied carré ou même un centimètre carré. La taille de cellule détermine l'aspect grossier ou fin des motifs ou des entités dans le raster. Plus la taille de la cellule est petite, plus le raster sera lisse ou détaillé. Cependant, plus le nombre de cellules est élevé, plus le traitement prendra du temps et augmentera la demande d'espace de stockage. Si la taille d'une cellule est trop grande, des informations peuvent être perdues ou des motifs subtils peuvent être masqués. Par exemple, si la taille de la cellule est supérieure à la largeur d'une route, la route peut ne pas exister dans le jeu de données raster. Dans le diagramme ci-dessous, vous pouvez voir comment cette entité surfacique simple sera représentée par un jeu de données raster à différentes tailles de cellule.

L'emplacement de chaque cellule est défini par la ligne ou la colonne où elle se trouve dans la matrice raster. Essentiellement, la matrice est représentée par un système de coordonnées cartésiennes, dans lequel les lignes de la matrice sont parallèles à l'axe x et les colonnes à l'axe y du plan cartésien. Les valeurs de ligne et de colonne commencent par 0. Dans l'exemple ci-dessous, si le raster est dans un système de coordonnées projetées Universal Transverse Mercator (UTM) et a une taille de cellule de 100, l'emplacement de la cellule à 5,1 serait 300 500 Est, 5 900 600 Nord .

Vous devez souvent spécifier l'étendue d'un raster. L'étendue est définie par les coordonnées supérieure, inférieure, gauche et droite de la zone rectangulaire couverte par un raster, comme illustré ci-dessous.


TÉLÉDÉTECTION | SIG☆

Partage de données et Internet

L'alliance entre SIG et Internet est à la fois naturelle et extrêmement puissante. Les bases de données SIG sur Internet permettent d'accéder à de vastes ressources d'informations, non seulement géologiques mais aussi pour l'intérêt et l'attention du public. Les architectures de bases de données et les formats de données, spécialement conçus pour être diffusés via des intranets et Internet, permettent de diffuser efficacement d'énormes volumes d'informations vers des ordinateurs n'importe où.

Au cours des dernières années, les développements de nouveaux formats de données raster, y compris l'ondelette de compression améliorée de Earth Resources Mapping (ECW, maintenant détenue par Intergraph) et la base de données d'images transparentes multirésolution de LizardTech ( Monsieur Sid), ont permis la compression presque sans perte de vastes ensembles de données d'images, leur permettant d'être servis et partagés à une vitesse incroyable. Les exemples de services et de partage de données cartographiques sur Internet, grâce à l'utilisation de bases de données intelligentes et d'exemples de systèmes, sont nombreux et incluent le dépôt de données GIS basé aux États-Unis (data.geocomm.com), l'index de données géoscientifiques du British Geological Survey pour le Royaume-Uni (www .bgs.ac.uk/geoindex/index.htm ), l'initiative internationale parmi les commissions géologiques - OneGeology (www.ongéologie.organisation), dans le monde entier Google Earth et Maps (earth.google.co.uk/), USGS Earth Explorer (earthexplorer.usgs.gov), Aster GDEM (gdem.ersdac.jspacesystems.or.jp), GeoServer (geoserver.org), MapGuide (mapguide.osgeo.org) et Mapnik (mapnik.org). Ceux-ci permettent à l'utilisateur de rechercher, d'afficher et, dans certains cas, de télécharger des données gratuites, et de développer des applications de cartographie de service Web.


Durabilité des formats numériques : planification des collections de la Bibliothèque du Congrès

Portée
Les formats numériques décrits dans la catégorie géospatiale de ce site Web peuvent être utilisés par des systèmes d'information géographique (SIG) ou d'autres applications logicielles pour accéder, visualiser, manipuler et analyser des données géospatiales. Les ressources dans ces formats sont principalement géospatiales, c'est-à-dire qu'elles se concentrent sur la transmission d'informations sur la Terre, l'emplacement d'entités spécifiques et les attributs et propriétés de ces entités géolocalisées. En tant que tels, les formats inclus dans cette catégorie de contenu géospatial comprendront souvent des informations sous les trois formes suivantes : (i) des images matricielles ou bitmap (ii) des images vectorielles constituées de points, de lignes et de polygones et (iii) des valeurs de données qui exprimer les attributs associés aux emplacements géographiques ou aux caractéristiques. Une caractéristique déterminante des ressources géospatiales est qu'elles sont destinées à être utilisées par des systèmes informatiques permettant l'analyse spatiale.

Le public visé par ce site Web est le bibliothécaire, l'archiviste et/ou le gestionnaire de données responsable de la préservation des ressources numériques. Cet essai est une introduction aux formats géospatiaux et aux fonctionnalités SIG pour le gestionnaire de données géospatiales généraliste ou spécialiste plutôt que pour un expert du domaine SIG utilisant activement les données géospatiales. Voir aussi l'aperçu sommaire Contenu géospatial : facteurs de qualité et de fonctionnalité.

Les descriptions des formats géospatiaux sur ce site Web sont destinées à soutenir la préservation des données et de leur documentation et métadonnées, telles que reçues par une archive numérique. L'objectif de préservation est de faciliter la visualisation ou le rendu futur des données et, dans la mesure connue et acceptée par la communauté géospatiale, de permettre la réutilisation, la réanalyse et/ou la recompilation des données à l'avenir .

Caractéristiques des formats géospatiaux
Les ressources géospatiales sont composées de données sur des entités géolocalisées représentées principalement par des images (raster ou vectorielles) et des tableaux ou des grilles d'attributs observés ou calculés. (Pour un aperçu utile, voir Types de données SIG : vecteur vs raster [1].) De plus en plus, les formats géospatiaux incluent des ensembles de données ou des bases de données géospatiales qui contiennent des informations primaires sur un emplacement géographique. En outre, les données auxiliaires et supplémentaires qui sont incluses ou peuvent être dérivées à l'aide d'une analyse spatiale sont considérées comme nécessaires au fonctionnement, à l'interprétation et à la réutilisation complets et efficaces des données.

Les formats géospatiaux ont été et sont continuellement spécifiés et adoptés par les organisations gouvernementales, les fournisseurs de logiciels et les organismes de normalisation. Ces formats sont souvent basés sur des spécifications ou des normes plus générales, par exemple pour les images fixes (raster et vectorielles) et pour les jeux de données. Pour plus d'informations sur ces formats et les facteurs associés pour évaluer la qualité et la fonctionnalité, voir Images fixes : Facteurs de qualité et de fonctionnalité et ensembles de données : Facteurs de qualité et de fonctionnalité. Les formats communs aux formats géospatiaux sont les capacités de représentation précise de l'emplacement de la ressource décrite sur la Terre en utilisant des mécanismes conceptuels de base et inhérents tels que le géoréférencement, l'échelle, la précision et l'exactitude.

Géoréférencement. Le géoréférencement a été défini comme l'établissement d'une relation entre des informations (par exemple, des documents, des ensembles de données, des cartes, des images, des informations biographiques) et des emplacements géographiques par le biais de mécanismes tels que l'ajout d'étiquettes de lieux (par exemple, des codes de lieux ou des toponymes) ou l'attribution de coordonnées géographiques.* (Voir le glossaire dans Linda Hill's Géoréférencement : les associations géographiques d'informations [2], p. 228.)

Le géoréférencement doit être compris comme un processus en plusieurs parties impliquant les concepts de coordonnées géographiques et de projections cartographiques en deux ou trois dimensions. Tous les termes de la liste suivante portent sur le géoréférencement.

  • Coordonnées. Géographique coordonnées localiser des points dans l'espace. Deux des systèmes de coordonnées géographiques les plus couramment utilisés sont les systèmes de latitude/longitude et les systèmes Universal Transverse Mercator (UTM) qui placent des points sur des grilles qui divisent des sections de la Terre par divers moyens.
  • Projection.Projection cartographique est nécessaire pour cartographier correctement des points sur Terre, le terme fait référence au processus de cartographie d'une Terre en trois dimensions sur une surface plane en deux dimensions telle qu'une carte papier ou un SIG numérique. La surface de la Terre n'est pas seulement incurvée mais est incurvée de manière irrégulière, rendant ainsi la projection nécessaire. Une déclaration du système de projection qui a été utilisé au moment de la création est importante, bien que la conversion vers une autre projection qui sera utilisée dans un cadre de projection existant soit souvent effectuée quelle que soit la projection d'origine. Pour un aperçu utile, voir Projections : ce que vous devez savoir pour les SIG [3].
  • Données. Différentes approches sont utilisées pour représenter la surface de la Terre d'une manière régulière qui permet un calcul mathématique. L'ensemble de paramètres et de points de contrôle qui sont utilisés pour localiser avec précision la forme tridimensionnelle de la Terre est appelé un données. Chaque donnée est basée sur une vue particulière de la forme de la Terre sous forme de sphéroïde ou d'ellipsoïde (la science de la mesure de la forme de la Terre est appelée géodésie). Avec son unité de mesure (par exemple, les pieds ou les mètres), une donnée variera selon qu'elle regarde la Terre d'un point de vue principalement horizontal (pour une donnée horizontale) ou d'un point de vue vertical (pour une donnée verticale ), et où il commence la grille, c'est-à-dire son premier méridien. Pour un aperçu utile, voir Datum : ce que vous devez savoir pour les SIG [4].
    Le fait qu'une donnée particulière ait été utilisée est une caractéristique essentielle d'une ressource géospatiale. Une déclaration dont la donnée a été utilisée dans la création/collecte de données est une métadonnée SIG qui doit être représentée dans la structure de données d'un format géospatial. Les utilisateurs d'un jeu de données peuvent souhaiter transformer les données d'une donnée à une autre à des fins d'harmonisation vers une vision commune (partagée par des projets ou des sites, par exemple). Cela se fait à l'aide de méthodes de transformation de données souvent facilitées par un SIG ou exécutées par des systèmes externes et, espérons-le, documentées dans les métadonnées SIG qui existent pour un ensemble de données donné.
  • Échelle de la carte. La notion de échelle de la carte est également important de pouvoir juger comment visualiser les données dans un format géospatial. Définie comme le rapport entre la distance linéaire sur une ressource et la distance correspondante sur la surface cartographiée, elle peut impliquer à la fois grain (la taille d'un pixel et la plus petite unité résoluble) et Le degré (la taille de la zone d'étude et la plus grande unité résoluble). (Voir le glossaire dans Linda Hill's Géoréférencement : les associations géographiques d'informations [2], p. 231, et Échelle dans le SIG : ce que vous devez savoir pour le SIG [5].) Les informations sur l'échelle lorsqu'elle est présente et sur la lisibilité par des humains ou des machines doivent être enregistrées et conservées pour faciliter le fonctionnement normal.
    L'échelle de la carte est également liée aux concepts importants de précision et précision tels qu'ils sont reflétés dans les données et intégrés dans les structures de données d'un format géospatial donné. Chacun de ces facteurs est important à comprendre sur les données géospatiales afin de juger de leur pertinence pour une utilisation planifiée.
  • Précision.Précision dans le contexte géospatial, mesure généralement à quel point une valeur observée et enregistrée est proche de la valeur réelle. La précision spatiale est mesurée de quatre manières principales : précision de la position, précision des attributs, cohérence logique, et complétude. C'est par précision de la position que l'on sait à quel point l'emplacement enregistré est proche de l'emplacement réel. Précision des attributs permet de mesurer (au moyen de calculs d'erreurs et de pourcentages, généralement) à quel point les attributs enregistrés pour un emplacement décrit sont proches de la réalité. Cohérence logique reflète la présence, l'absence ou la fréquence de données incohérentes, généralement déterminées par la comparaison de thèmes ou la juxtaposition de faits. Pour terminer, complétude décrit dans quelle mesure les données décrivent l'emplacement et les caractéristiques de l'emplacement qu'elles ont l'intention de représenter. (Voir Paul Bolstad Fondamentaux du SIG : un premier texte sur les systèmes d'information géographique [6], p. 516)
  • Précision.Précision dans ce contexte, fait référence à la cohérence d'une méthode de mesure, mesurée par la fréquence à laquelle les mêmes résultats sont obtenus lors de la mesure. Il est généralement défini en fonction de la dispersion d'un ensemble de mesures répétées par rapport à la mesure moyenne. (Voir Paul Bolstad Fondamentaux du SIG : un premier texte sur les systèmes d'information géographique [6], p. 517).

Lors de l'analyse des formats géospatiaux, il est important de comprendre comment ou si un format donné fournit les moyens de documenter et de calculer l'exactitude et la précision de la mesure, de la description et du placement de l'entité. En particulier lorsque des données doivent être réutilisées, recalculées ou ajoutées à des séries chronologiques ou par une instrumentation similaire ou différente, il est primordial que de telles mesures de la qualité des données soit documenté. Il est important d'évaluer la qualité des données du point de vue d'un objectif de préservation consistant à pouvoir reproduire ou répliquer les données à des fins de réutilisation et de poursuivre l'expérimentation scientifique. Les concepts de provenance et lignée pour les données. Le terme provenance concerne l'établissement factuel de la paternité des données et est important pour évaluer l'authenticité et l'exactitude des données. Le terme lignée va au-delà de la provenance pour inclure une discussion sur la source, les méthodes et le calendrier des données. Les trois caractéristiques des ressources géospatiales - discutées plus en détail ci-dessous - doivent être enregistrées en tant que métadonnées pour permettre aux futurs utilisateurs d'évaluer l'adéquation d'une ressource géospatiale à un usage particulier.

Métadonnées SIG et documentation des données
Ce qui différencie les formats géospatiaux des autres formats, c'est la capacité fondamentale de placer des informations par rapport à la surface de la Terre à la fois horizontalement et verticalement, ou horizontalement avec une hauteur ou une profondeur implicite. Les caractéristiques importantes à enregistrer dans les métadonnées comprennent les coordonnées géographiques, la projection, l'échelle et les données, car les ressources numériques ne sont pas compréhensibles ou utilisables avec une fonctionnalité normale sans cela. Même une simple image raster qui est le produit d'un jeu de données ou d'un autre format, comme un simple PDF ou une image bitmap d'une carte, devrait également inclure des informations sur la carte qui permettraient à l'utilisateur de déterminer avec quelle précision la carte correspond à son « réalité » géographique ou déterminer son emplacement précis à partir des données derrière la carte.

Normes de contenu. Des normes de contenu basées sur la communauté existent pour les données géospatiales telles que le Comité fédéral américain des données géospatiales. Norme de contenu pour les métadonnées géospatiales numériques (FGDC) [7] et la norme ISO plus large pour l'information géographique, ISO 19115:2003 [8]. Aux États-Unis, les éléments standard de contenu du FGDC ont été adoptés plus largement en raison de leur intégration dans des produits logiciels couramment utilisés par des géants du domaine comme ESRI et GeoMedia. (ESRI utilise un "profil" de la norme FGDC plutôt qu'un schéma XML FGDC natif.) ISO 19115:2003 est lentement adoptée par un plus grand nombre d'agences fédérales américaines et d'agences internationales et commence à être incorporée dans des progiciels courants.

Les normes de contenu FGDC et ISO:19115 décrivent un certain nombre de caractéristiques des données, notamment les métadonnées descriptives, techniques, sources et de préservation. Les métadonnées descriptives sont nécessaires pour l'identification, la citation et l'évaluation de l'actualité des données. Les métadonnées techniques décrivent les références spatiales (projection, datum et coordonnées géographiques). Les métadonnées de préservation incluent les caractéristiques de l'environnement associées à la création des données, l'historique du traitement et la provenance/lignage des sources de données et de la sortie finale. Au sein de la communauté géospatiale, les ontologies dérivées de la communauté sont de plus en plus utilisées pour des valeurs contrôlées de concepts sémantiques tels que la provenance et la qualité des données, les descriptions d'instruments, les expressions d'algorithmes et les processus de flux de travail.

Les métadonnées et la documentation des données spécifiques au contenu peuvent être exprimées ou notées dans un format de données donné en termes de normes de contenu communautaires (telles que ISO 19115, FGDC, SensorML [9] et UncertML [10]) et d'ontologies communautaires. Ces informations sont utiles non seulement pour le partage et la comparaison par les utilisateurs de données ultérieurs, mais également à des fins de compilation et/ou de calcul réplicatifs pour prouver ou étendre la recherche scientifique, et pour l'extension des données dans le cas d'ajouts ouverts ou en série ou de séries chronologiques à un base de données. De plus, il est utile de connaître la forme d'expression des métadonnées et de la documentation, c'est-à-dire si elle est exprimée dans un schéma XML ou une ontologie RDF bien connu, sous forme de feuilles de calcul CSV, de tables de bases de données relationnelles et d'attributs et inclus avec les données. , ou sous forme de liens vers des rapports externes, des ontologies ou des services Web. Noter si des métadonnées basées sur des normes peuvent être incluses ou référencées dans un format est utile pour le partage et la comparaison entre les utilisateurs de données ultérieurs. Pour déterminer quels produits logiciels sont conformes aux normes de l'OGC, consultez le registre des produits de l'OGC [11].

Facteurs de qualité. Pour certaines ressources géospatiales telles que les données satellitaires, il est essentiel pour une bonne compréhension et une bonne utilisation des données d'inclure des informations sur la qualité des données ainsi que leur provenance et leur lignée. Par exemple, pour les images satellites, le pourcentage de couverture nuageuse est une caractéristique de qualité importante. De telles informations sont essentielles non seulement pour comprendre ce que disent les données, mais également pour comprendre les utilisations appropriées et inappropriées des données.

Niveaux de qualité des données. Il peut y avoir plusieurs niveaux auxquels la qualité des données est et doit être documentée. Par exemple, au niveau du produit, il est essentiel de savoir dans quelle mesure les données représentent l'état géophysique réel compte tenu de la sortie de différents instruments. Un autre niveau de qualité serait au niveau du pixel où les algorithmes utilisés pour créer les points de données sont notés ainsi qu'une évaluation de la facilité d'utilisation de ces points de données. Au niveau du granule, un cumul statistique des données au niveau du pixel est compilé. Ce type de calcul pourrait être important pour valider le modèle utilisé. For example, climate change data models can have grids of contiguous data tagged with uncertainty statistics for each grid cell, thus providing the means to assign quantitative risk factors or uncertainty levels to different mitigation scenarios. Examples of data quality reports for a data set can be found at NASA's NASA Surface Meteorology and Solar Energy: Accuracy [12]. The assessment of bias is a key data quality factor, i.e., bias that is generated from the instruments used (instrumental bias), or the type of sampling or observations made that provide the view of the data produced. In addition, an assessment of appropriate and/or inappropriate use is often considered to be an important data quality consideration.

Provenance and Lineage. Documentation about the provenance of data in terms of factual establishment of its authorship is usually considered to be quite important in order to determine the authenticity of the data, and to some extent its accuracy. For example, knowing the name of the organization and/or person(s) responsible for the creation and/or collection of data may help ascertain whether or why certain features are or are not present, such as roads or buildings on a map of a city. A data consumer would have more confidence in the accuracy of such a map if it had been created by the city s data center rather than by a student at a local college or university. Another example of describing the provenance of data is the tracking of what instrumentation was used to generate or record the data and the algorithms used to calculate the data output.

The term data lignée is often considered to encompass provenance in the sense of authorship, but can include discussion of source, methods, and timing of the data as it has been created, derived and/or subset over time and into different products. For example, MODIS data is characterized as being generated at various levels, starting with Level 1 which is closest to the raw data output by satellites and other remote sensing instruments, and is rarely used by itself. Level 2 data is derived from Level 1, and may involve a subset of data from certain instruments, or for certain time periods or locations. The crunching or compilation of Level 2 data often results in more specific products that can be used by themselves for various purposes (educational, policymaking, etc.), and are considered Level 3. Ideally, a Level 3 product would include documentation about its lineage going back to the Level 1 data.

GIS Functionality: Introduction
In addition to support for locating a digital resource in relation to the earth s surface, geospatial formats facilitate the methods used in geospatial information systems to view, access, manipulate, analyze and query the geospatial data represented. Whether focused upon an entire resource, e.g., a geo-referenced image, or attribute values within a resource, there are certain inherent activities that a geospatial format normally should allow a data consumer to perform. Some aspects of spatial analysis are basic, regardless of specific format (i.e., for vector, raster or attribute data). Some analysis techniques are particularly appropriate for raster formats, such as terrain analysis using raster digital elevation models (DEMs). Other techniques are more appropriate for vector formats or attribute data. To determine functionality for geospatial resources, one can ask what does a geospatial data consumer normally want to "do" with the data either immediately, or in the future?

One important feature of GIS systems is the display or printing of maps. Vector data such as geographic coordinates, points, lines, and polygons that describe areas are stored in mathematical form. This data can be used by GIS systems, or by vector graphics software, to print or to display on screen using scalable shapes, labels, and legends. When a user wishes to transform vector data into a raster format, the data structure of the original vector format should facilitate that basic need.

GIS Functionality: Types of Analysis and Uses for GIS Resources
The following sections describe the most important kinds of activities undertaken by users of geospatial resources. Various geospatial formats will have varying levels of fitness for each of these activities. In our descriptions of specific formats, we highlight the ways in which a given format will function in terms of these activities. The description that follows begins with basic spatial analysis and moves on to describe more specialized types of analysis: spatial interpolation and estimation, grid-based analysis, and the role of geospatial datasets. We also note the overlap with the functionality required of two non-GIS formats: still images (especially multispectral images) and datasets (containing data that is not specifically geospatial).

Basic Spatial Analysis. A fundamental activity associated with normal functionality for a geospatial resource involves the reconciling of multiple data sources to the same or compatible geo-referenced locations as represented by the spatial data (coordinate information that describes the resource s geography), and the attribute data (the non-spatial characteristics describing the resource), and documented by the GIS metadata. In determining the fitness of a format for basic spatial analysis, we must bear in mind that some of the basic analysis techniques described below are only appropriate for vector or attribute data.

Typically, the reconciliation will take the form of performing operations on both the spatial data and the attribute data, if necessary, that allow the resource to become associated or converted to a (different) datum, map projection, and measurement units. Once any necessary reconciliation is done, the data are ready for further spatial analysis including sorting/selection, classification and other operations. Brief descriptions of some types of spatial analysis considered to be part of normal functionality follow.

  • Selection. Operations that enable the identification of one or more conditions or criteria, and the subsequent return of features or sets of features meeting the criteria. Implicit in these operations are the visualization of the spatial data, viewing their metadata, querying their attributes, and the capability of creating one or more layers as output. Querying may be done either by on-screen viewing capabilities within the GIS software, or by set or Boolean algebra mechanisms (using Standard Query Language or SQL, for example). Other mechanisms enabling selection include the establishment of adjacency or containment conditions for either the spatial data or the attributes.
  • Classification Operations that enable features or sets of features to be categorized based on a set of conditions. Classification operations may be done to help group the data for better visualization in the form of a map or other display format, or as the basis for more complex calculations or analysis. Typically, the grouping of the data is done based on the attributes describing the data.
  • Dissolves. Operations that combine similar features in a layer rather than differentiate them, often based on classifications that have already been done on the data or their attributes. Dissolve functions are usually applied to data in order to remove information that is unnecessary to understand, simplify, or process the data.
  • Proximity/Buffering. Operations that help measure the distance between features of interest. Proximity functions may cause existing attribute information to be modified, or to be added. One very common method of establishing proximity among features is by buffering, i.e., establishing an area that is less than or equal to a designated distance from one or more features. Buffers may be specified for point, line or area features, and for either raster or vector data. (See Paul Bolstad's GIS Fundamentals: A First Text on Geographic Information Systems [6], p. 342-3). Specific mechanisms for establishing buffers will differ depending upon the format of the base data.
  • Overlays/Layering. Operations that combine spatial and attribute data from different data sources in a vertical merge of a single layer that enable more complex querying about a given problem. Particularly with overlays, it is critical to ensure that the georeferencing information among the data sources is compatible so that features being merged align correctly.
  • Network Analysis. Operations that define a set of connected features by means of one or more network links that provide the paths between features. The paths can be measured and analyzed for various purposes including cost and time to traverse, and other factors related to resource allocation, for example.

Spatial Interpolation and Estimation. Some geospatial formats support more specialized spatial analyses that use statistical techniques to provide additional data points, especially when the complete extent of data points within it are unknown due to sparse, lost, or unobserved data points. These techniques are also used when changing the size of a grid, especially to a smaller cell size. The analysis can provide an estimation of a more full extent of data points within a given sample. Some formats support the generation and writing of derived data from these statistical techniques back into a resource, usually with a calculated error or accuracy rate included. Some of the statistical methods include the following:

  • Spatial Interpolation. Allows the prediction of variable values at unknown locations based on sampling of the same kind of variables at known locations. This method is often used to estimate air and water temperatures, soil moisture, elevation, population density, etc.
  • Spatial Prediction. Uses spatial interpolation but often includes other variables as well as a total set of other measurements. For instance, a map of elevation values may be combined with a set of measured temperatures to estimate temperatures at elevated locations the temperature values of which are unknown. Typically, this technique is used to generate more data points, lines or areas, i.e., to fill in information when samples do not cover the range of information desired.
  • Establishment of Core Areas. Uses a set of known samples to predict the frequency or likelihood of the occurrence of a feature (such as an event or object). The method is used to identify high use, density or intensity of features as well as the probability of occurrence for a variable or event.

Grid-based Analysis. Grid-based analysis is a GIS functionality that begins by identifying an area of interest and dividing it into rectangular cells based on geo-location (using a known datum and projection). The cells contain data values from a variety of sources and are stored in a format designed to hold gridded data. The values are then available for various forms of spatial and statistical analysis. Grids contain information that can range from geographic coordinates to reflectance values from solar radiation hitting surface features. Since grid capability enhances the utility of geospatial data, format descriptions document when and how a format supports the use of gridded data.

Increasingly, geospatial data users transform their data to formats with more capability for grid-based analysis. For instance, a vector format containing point data may be transformed into a grid-capable format in order to perform area analysis over a broader geographic spectrum. To fully understand the implications of these kinds of data transformations, it is critical that the GIS metadata for the output of the grid-based analysis describe the factors that might impact the potential accuracy (error rate) of the data output such as the cell size and unit of measurement.

  • Use of Vector Grids. Vector data is usually accompanied by attribute tables that can be the object of grid analysis based on simple mathematical functions such as summing, averaging, and identifying mean and medians for values in a row. Some of the same functions described in the Basic Spatial Analysis section work for both vector and raster data such as the use of map algebra where values of cells are combined by addition, subtraction or multiplication, or the computation of statistics (such as majority, mean, and maximum). These kinds of operations can be done at a number of different levels including local functions (using data from one cell only to produce the output for another single cell), régional (data from a set of cells to produce the output for a single cell, i.e., within a neighborhood, aka "focal," or within a zone, aka "zonal"), or global (all data from a raster is operated upon as output for a single cell).
  • Use of Raster Grids. Powerful functions can be found in formats that deal with raster data. Terrain analysis is a very common use of the grids found in raster data sets. For example, a comparison of cell values using spatial functions would allow the calculation of a number of useful variables for a location including la taille (elevation above a base), pente (the rise of the land relative to a horizontal distance), aspect (the downhill direction of the steepest slope), profile curvature (the curvature of the land parallel to the slope direction), plan curvature (the curvature of the land perpendicular to the slope direction), and visibilité (site obstruction from given viewpoints). This kind of information is useful to determine or to predict broader characteristics of a location on the Earth such as temperature, vegetation, erosion, water flow acceleration and convergence, and viewshed to cite a few examples. Digital elevation models (DEMs), typically raster data sets, can be used to create contour lines (connected lines of uniform elevation that run at right angles to the slope) on a surface. Most people are familiar with topographic maps like those from the United States Geographical Survey (USGS) upon which contour lines are displayed.
  • Support for Specialized Software Interfaces. One of the most important sustainability factors for a format is Adoption. A key sign of adoption is support by a variety of software applications or the existence of a well-supported software toolkit or software library, especially those non-proprietary. For some geospatial datasets it may be advantageous to use a format that supports a community-specific API (application programming interface). Such software interfaces are particularly important for extracting data subsets, data manipulation and transformation, or domain-specific functionality. Software interfaces that support open standards and compatibility with mechanisms for accomplishing common functions promulgated by the OGC (Open Geospatial Consortium [19]) are of particular value. For example OGC has specified a number of web services, such as the OpenGIS Web Map Service, and the OpenGIS Web Coverage Service Interface Standard.

Functionality Shared with Other Categories. The functionality associated with different geospatial formats will vary depending upon whether the format is used for raster data, vector data, or attribute data. For example, using a raster still image, one could identify general locations within an image, but precise location is facilitated by using Boolean logic to query attribute data associated with the raster image. The following sections discuss some of the functionality shared with other formats:

  • Multispectral Images. This factor is shared with still images. Multispectral images such as those generated by satellite and aerial photography are used more and more frequently for geospatial functions. Using techniques associated with grid-based analysis (see further discussion below), relatively wide and uniform data is made available in the form of grids. The grids often take advantage of the inherent capability of photos and scanners to detect electromagnetic energy in ranges from below, through and past human eyesight including infrared and thermal (heat). This imagery collects the values associated with electromagnetic energy generated from solar radiation that bounces back or reflects from objects and features on the Earth. Measured in wavelengths (the distance between peaks in the electromagnetic stream), different objects and features will have different reflectance values, some seen as light visible to the human eye and some not. The known human visible range has been further divided into different color bands based on how humans perceive them, i.e., red, green, and blue. By isolating and combining the values from different color bands as well as the non-visible bands, it is possible to identify objects and features within the image at a certain point in time, both visually and by calculation.
    Following identification, objects and features can then be grouped using classification techniques, indices and models built, thus creating land cover and land use data layers that can be used for various purposes such as vegetation indexes and ocean depth. The still image quality and functionality factor Support for multispectral bands is particularly important for the image formats used for many geospatial raster images.
    Other operations associated with the use of multispectral images include image restoration and rectification which can correct degraded image data, remove systematic distortions in images, and change the image s projection system. Images may also be enhanced to improve the display, and subsequent capability for better visual interpretation and identification of objects and features.
  • Datasets. Dataset formats intended for use for geospatial datasets should satisfy the requirements for GIS functionality, as described above, but also the normal functionality for datasets in general. As stated in the general discussion titled Datasets: Quality and Functionality Factors, the basic functionality for a dataset format is to provide a structured representation of numeric or character-based values that permits automated manipulation of the structure and the representation. By storing the structured representation together with other information, a dataset format should facilitate the performance of calculations and transformations based on the values.

Résumé.
Geospatial formats range from fairly simple raster image formats to quite complex, database formats designed specifically to describe, and often visualize features placed in specific locations on the Earth. The functionality supported by the various geospatial formats represents the degree to which geographic information systems and other computer systems can create, use and modify the geospatial resources, and will be described within the geospatial format descriptions.

1. Geospatial Innovation Facility, University of California, Berkeley. GIS Data Types: Vector vs. Raster, accessed April 8, 2011. http://gif.berkeley.edu/documents/GIS_Data_Formats.pdf.

2. Hill, Linda L. Georeferencing: The Geographic Associations of Information. MIT Press: Cambridge, Massachusetts, 2006.

3. Geospatial Innovation Facility, University of California, Berkeley. Projections: What You Need to Know for GIS. Page 1 of document accessed April 8, 2011. http://gif.berkeley.edu/documents/Projections_Datums.pdf.

4. Geospatial Innovation Facility, University of California, Berkeley. Datum: What You Need to Know for GIS. Page 2 of document accessed April 8, 2011. http://gif.berkeley.edu/documents/Projections_Datums.pdf.

5. Geospatial Innovation Facility, University of California, Berkeley. Scale in GIS: What You Need to Know for GIS, accessed April 8, 2011. http://gif.berkeley.edu/documents/Scale_in_GIS.pdf.

6. Bolstad, Paul. GIS Fundamentals: a First Text on Geographic Information Systems. White Bear Lake, Minn: Eider Press, 2008.


Determining whether raster pixels in or out of zone - Geographic Information Systems

By JESSICA CHUN on Fri, 2021-01-22 13:21

Our center provides a series of GIS support to faculty, undergraduate and graduate students, as well as staff who need help. In most GIS related consultations, we use tools/software, such as QGIS and R studio, to do the mapping and data analysis. QGIS stands for Quantum Geographic Information Systems. It is a free and open-source desktop GIS application. R studio is an integrated development environment for R, a programming language. Both QGIS, R studio and R are free to the public. We take advantage of the open-source software to help our patrons solve their problems. The following are some examples of the service we provided.

Mapping contour lines

A contour line indicates equal elevation above a given level, such as mean sea level. A contour map reveals elevations and shows hills and valleys, representing a three-dimensional landscape within a two-dimensional space. One faculty member did research about historical ruins and needed to explore the geographic features of this area. For this project, we decided to make a contour map out of a Digital Elevation Model (DEM). Using the DEM data that was collected between 2006 to 2011, we created a contour map, shown below.

Raster data analysis

Zonal statistics

Zonal Statistics is a function that calculates statistical values for pixels of input raster inside certain zones, defined as a polygon layer (vector layer). Statistical values include minimum, maximum, sum, count, mean, standard deviation, number of unique values, range, and variance. This function is used to do descriptive statistics for each study, based on the input values of raster data.

An undergraduate student reached out to our center and seeked help to analyze the average and maximum concentration of PM2.5 within each census tract after fires in California. The data included the raster data of the concentration of PM2.5 and the boundaries of census tracts. Zonal Statistics analyzed the data and calculated a variety of descriptive statistics which consisted of the average and the maximum.

Pixelliser

When dealing with a large volume of data, especially raster data, people find that R packages are efficient and convenient, given the dynamic and fast updated R community. le Raster package in R is a powerful package that aims to do raster analysis. Among multiple functions within the Raster package, the rasterize function is used to convert vector data (points, lines, and polygons) to raster data, while keeping selected attributes from the vector data.

A graduate student from the Institute of the Environment and Sustainability seeked help from our center to rasterize shapefiles using R. The vector data she had contained the Los Angeles River catchment area, Los Angeles river and streams, and census tracts. She aimed to rasterize this data and overlay it with the urban heat island data (Raster data) to investigate whether the river and the trees along the river reduced the urban heat island. Given the large volume of data and the repeated procedures, we rasterized the vector data and analyzed the converted raster in a loop.

These cases are examples of how our center has helped our community solve research problems using geospatial techniques. In addition to consulting, our center offers geospatial workshops regularly. Want to know more about the workshop? Please check out the Événements page at the Data Science Center. Seeking help with geospatial problems? Feel free to make an appointment with our center.


GIS (Geographic Information System)

A geographic information system (GIS) is a computer system for capturing, storing, checking, and displaying data related to positions on Earth&rsquos surface.

Geography, Geographic Information Systems (GIS), Physical Geography

Celui-ci répertorie les logos des programmes ou partenaires de NG Education qui ont fourni ou contribué au contenu de cette page. Leveled by

The maps that we use online work because of GIS.

A geographic information system (GIS) is a kind of computer system. It captures, stores ,and displays data about locations on Earth.

It can use and compare any information about a location. The location can be expressed in many different ways. Some examples are addresses or ZIP codes. Others are latitude and longitude. These are imaginary lines that appear on every map of Earth.

Lines of latitude run east-to-west. Lines of longitude run north-to-south. These lines are used to find any place on Earth.

GIS helps us find out how different bits of information relate to each other. It tells us about the landscape and people around us.

GIS data comes in many forms.

One example is cartographic data. This includes objects you might find on maps. Examples are rivers, roads, hills, and valleys.

Interpreting photographs is a big part of GIS. This involves photos that are taken from above. These images are then carefully studied.

Digital data can also be entered into GIS. For example, satellites collect computer data from above. This can show how land is used, such as the location of farms, towns, and forests.

Finally, GIS data can also be collected to compare populations of people. For example, imagine you had a list of everyone's age in your state. With GIS data, you could compare the ages of people in your city to those in other cities. It would be laid out on a single map.

GIS technology can be used to show how two spaces are related. For example, GIS could show how close farms are to water. It can also show patterns of how land is used, like where parks and neighborhoods are located.

It can also show networks of lines on a map. A line on a map might stand for a road, river, or highway. With GIS layers, however, that road might show the boundary of a public park next to the river.

GIS must make information from many different maps and sources fit together on the same scale. A scale is the relationship between the distance on a map and the actual distance on Earth.

Earth is curved, like a globe. It is not flat, like a paper map or a screen.

Different maps have different projections. A projection is a way of moving information from Earth's curved surface to something flat. You cannot put a curved, three-dimensional shape onto a flat surface without stretching some parts.

A world map can show either the correct sizes of countries or their correct shapes. It cannot do both.

GIS takes data from maps that were made using different projections. It combines them so all the information can be displayed using one shared projection.

Very different data can be entered in a GIS system. When it is combined, it can produce many kinds of individual maps.

A common use of GIS involves comparing Earth's features with human activity. It allows us to deeply examine a certain area. For example, GIS maps can display if buildings in an area are in danger of being flooded. Maps of a single city can show voting patterns of people there. It can also show the average amount of money made by different people in the city.

Researchers can also look at change over time with GIS technology. They can use pictures taken by satellites to study how ice sheets have moved or disappeared in the North Pole.

GIS technology sometimes allows users to get more information about specific areas on a map. For example, a user might click on a school on a map to find how many students go there.

It is also easy to update maps because of GIS technology. Any new data can simply be added. A new map can then be displayed immediately. In the past, maps had to be redrawn. This takes more time and money.

GIS technology is used in many jobs.

Businesses can use GIS to help them determine where to open a new store. Scientists use GIS to track the movement of animals.

Government officials use GIS to help plan their response to earthquakes or hurricanes. GIS maps can show what neighborhoods are most in danger or the closest emergency shelters.

Engineers might use GIS to develop road networks or train routes.

There is no limit to the kind of information that can be analyzed using GIS technology.


Always include example data, please

I am not quite sure what you are after. The number of cells (pixels) would be the same for all rasters if you can stack them (which you say you can). I am assuming that you want the sum of the cells that are not NA . If you actually have rasters with a different origin/resolution, you can repeat these steps, but there no need to stack them into a RasterStack , but you would need to adjust the approach to also count the NA cells.

Simple approach for smaller objects:

If that runs out of memory, you can do:

If you want to count all the cells (whether NA or not), you can do something like


spatialEco::zonal.stats uses exactextractr (I have not checked the code, but it told me to install it to be able to use zonal.stats ) which should be more exact if you are considering polygons (the raster package turns them into rasters first, see zonal below). However, the below example (it is only one case) suggest that spatialEco is less precise.

Example (avoid random numbers, but if you do use them, use set.seed ). I start with very large grid cells.

With raster you can also get a more precise estimate like this

To see how many cells are used

One way to look at this is to create higher resolution raster data.

10x higher resolution, same values

100x higher resolution, same values

At the highest resolution the mean values are similar (and the relative difference in the number of cells is small) but raster was closer to the correct value (whatever that is, exactly) at a lower resolution (and also with the weighted mean). That is unexpected.


Voir la vidéo: GEOG-1026 Tut-C-4: Raster Intersect, Zonal Statistics Summary