Suite

Lier des données spatiales et non spatiales hébergées sur deux serveurs de base de données ?

Lier des données spatiales et non spatiales hébergées sur deux serveurs de base de données ?


Je travaille sur une preuve de concept.

Nous construisons une application de carte Web où les données sont réparties sur deux serveurs de base de données différents. La géométrie se trouve sur le serveur ArcGIS et les attributs ou les données métier se trouvent sur une instance SQL Server distante

Est-ce que quelqu'un sait comment interroger les données sur deux serveurs de base de données ?

Une idée consiste à utiliser les services Web REST pour communiquer avec les deux magasins de données distincts.


Je vois que vous avez la balise SQL Server, je vais donc répondre en partant du principe que vos deux serveurs de base de données sont SQL Server.

Vous pouvez utiliser les serveurs liés de SQL Server pour ce faire. Dans SSMS, connectez-vous à l'instance contenant ArcSDE et procédez comme suit pour configurer un serveur lié :

Exemple > Objets serveur > clic droit Serveurs liés > Nouveau serveur lié…

  1. Sous la page "Général", saisissez le nom de votre instance de serveur dans "Serveur lié".
  2. Sous « Sécurité », j'ai eu la meilleure chance d'utiliser le « Être créé en utilisant ce contexte de sécurité » en utilisant des informations d'identification de base de données identiques sur les deux serveurs. Je n'utiliserais pas l'authentification Windows car cela vous ouvre à des divergences des deux côtés et à toutes sortes d'autres problèmes avec l'authentification Kerberos.
  3. Sous "Options du serveur", vous pouvez laisser les valeurs par défaut.

Maintenant, dans SSMS, vous verrez le serveur lié sous le dossier "Serveurs liés". Vous devriez pouvoir parcourir les objets. Vous pouvez accéder aux données du serveur lié non spatial en exécutant l'exemple de requête suivant sur votre instance ArcSDE SQL Server :

SELECT * FROM [LINKED-SERVER-NAME].[INSTANCE-NAME].[SCHEMA-NAME].[TABLE-NAME]

Il ne vous reste plus qu'à créer une vue spatiale dans votre instance ArcSDE SQL Server qui relie vos données à l'aide du paradigme SQL ci-dessus. Vous pouvez ensuite publier cette vue résultante sur le Web. Je recommanderais la mise en cache si vous travaillez avec de grandes tables, car les serveurs liés peuvent être lents.


Vous pouvez joindre et afficher des jeux de données sur une carte à l'aide d'un point de terminaison ArcGIS si vous les joignez dans ArcMap. Le processus est décrit ICI. Une fois que vous avez établi la connexion dans votre MXD, publiez-le comme vous le feriez normalement et ce sera votre point de terminaison REST. Cela permettra une connexion à deux bases de données via un service Web ArcGIS REST sans que vous ayez à écrire une seule ligne de code ou à modifier la base de données. Les formats de données n'ont même pas besoin de correspondre.

Les solutions ci-dessous peuvent également être utilisées, mais sont déconseillées.

Évidemment, nous ne pouvons pas vous donner un projet et dire « voici ça marche », mais les ressources que vous pourriez trouver utiles sont :

Créer un service Web RESTful de base

Créer un service Web de base (pas RESTful)

Travailler avec ADO.NET et SQL Server

Chaînes de connexion à une base de données SQL

Les approches sont :

  1. Obtenez le service Web pour faire la jointure des données pour vous, puis renvoyez l'ensemble de données à l'application <-- celui-ci a un objectif spécifique et n'est pas réutilisable par d'autres applications

  2. Obtenez un service Web REST pour renvoyer les deux ensembles de données (avec n'importe quels filtres SQL), puis demandez à l'application d'effectuer la logique de jointure. <-- ceci est réutilisable par d'autres applications (ce qui est amusant, c'est que cela ressemble étrangement à un point de terminaison ArcGIS ;) Cela peut également faire une jointure dans ArcMap pour être publié Voir OPTION 3)

Si la solution que vous avez choisie s'avère gênante, je recommande fortement un lien de base de données comme le suggère @conor, car la base de données fait tout plus rapidement et devrait être l'endroit où les données sont jointes/modélisées.

Je l'ai déjà fait pour l'intégration de systèmes d'actifs non spatiaux et de systèmes spatiaux et j'ai parlé à d'autres professionnels du SIG qui ont fait de même. L'approche générale consiste à le faire au niveau de la base de données. La dernière fois que je l'ai fait, j'ai utilisé une vue sur un lien de base de données et les performances étaient aussi bonnes que celles sans liens de base de données.

Documentation pour info pour la configuration et l'utilisation d'un lien de base de données


Système d'aide à la décision spatiale

Le Systèmes d'aide à la décision spatiale (sDSS) développé en parallèle avec le concept de Systèmes d'Aide à la Décision (SAD). Un DSS fait partie du domaine du système d'information et c'est une application de programme informatique qui analyse les données commerciales et les présente afin que les utilisateurs puissent prendre des décisions commerciales plus facilement. [1] Par conséquent, un sDSS est un système informatique interactif conçu pour aider un utilisateur ou un groupe d'utilisateurs à atteindre une plus grande efficacité de prise de décision tout en résolvant un problème spatial semi-structuré. [2] Il est conçu pour aider le planificateur spatial en l'orientant dans la prise de décisions concernant l'utilisation des terres. Par exemple, au moment de décider où construire un nouvel aéroport, de nombreux critères contrastés, tels que la pollution sonore par rapport aux perspectives d'emploi ou l'effet d'entraînement sur les liaisons de transport, peuvent rendre la décision difficile. Pour aider à ces décisions, une solution possible consiste à incorporer un système dans lequel des modèles sont créés pour aider à identifier le chemin de décision le plus efficace.

Un sDSS est parfois appelé système de soutien aux politiques.

Un système d'aide à la décision spatiale se compose généralement des éléments suivants.

  1. Un système de gestion de base de données - Ce système contient et gère les données géographiques. Un système autonome pour cela s'appelle un système d'information géographique (SIG).
  2. Une bibliothèque de modèles potentiels qui peuvent être utilisés pour prévoir les résultats possibles des décisions.
  3. Une interface pour aider l'interaction des utilisateurs avec le système informatique et pour aider à l'analyse des résultats.

Ce concept correspond aux concepts de dialogue, de données et de modélisation décrits par Sprague et Watson en tant que paradigme DDM. [3]


Chapitre 6 | Collecte et développement de données SIG (sources, entrées et sorties)

Ce chapitre concerne les sources de données SIG, y compris les données provenant de sources existantes, ce qui inclut Internet, ainsi que ses propres données. Nous discutons également de l'intégration d'autres types de données, y compris celles qui ne sont pas explicitement formatées pour le SIG. Nous introduisons les concepts fondamentaux liés à la localisation et à l'organisation des données à utiliser dans les SIG. Une section sur les principes fondamentaux et l'organisation des bases de données est fournie pour aider les lecteurs qui ne sont pas familiers avec ces concepts en ce qui concerne les SIG. Étant donné que le SIG peut être utilisé à la fois pour le développement et le stockage de données ainsi qu'un outil d'analyse, il sera souvent utilisé conjointement avec d'autres outils, techniques et progiciels familiers. Une discussion sur le formatage et le transfert de données entre les sources est incluse. Enfin, une section discutant des diverses sorties offertes par le SIG est fournie dans le contexte des sorties de données visuelles, variables et statistiques qui sont pertinentes pour l'analyse.

  • Fournir des conseils sur la paramétrisation de la recherche avec des sources de données appropriées.
  • Tenez compte des facteurs pour établir une carte de base à laquelle lier vos données de recherche.
  • Présenter les principes fondamentaux de l'organisation des bases de données pour les SIG.
  • Proposez des suggestions pour la collecte de données qui peuvent être facilement intégrées dans un SIG, y compris l'utilisation de la technologie du système de positionnement global (GPS).
  • Discutez des options d'importation et d'exportation de données entre une base de données SIG et d'autres sources.
  • Développez la discussion sur les sorties de données SIG, la visualisation et les statistiques.

Après avoir lu ce chapitre, vous devriez être en mesure d'effectuer les tâches suivantes :


Cours:

Remarque : À l'occasion, GEOG 410 est également proposé en tant que cours qui compterait pour la concentration en sciences de l'information géographique. Vérifiez les offres de cours (la « feuille rose ») ou envoyez un courriel au conseiller de premier cycle à [email protected] clarifier.

481/581 GIScience I. 4 Crédits. Une introduction à la science de l'information géographique, aux systèmes d'information géographique (SIG), à l'enquête sur la population actuelle (CPS), à la télédétection et à la cartographie. Séquence avec GEOG 482/582, 491/591. Bone, Kohler, Lobben.

482/582 GIScience II. 4 crédits. Collecte de données spatiales, modèles de données spatiales, conception de bases de données, édition de données, gestion de projet de système d'information géographique (SIG) et sujets avancés en science de l'information géographique. Séquence avec GEOG 481/581, 491/591, 493/593. Prérequis : GEOG 481/581. Bone, Kohler, Lobben, Schmidtke.

485/585 Télédétection I. 4 Crédits. Introduction à la science de la télédétection, y compris sa base physique, ses instruments, ses plates-formes, ses données, ses méthodes de traitement et ses applications. Séquence avec GEOG 486/586. Prérequis : GEOG 481/581. Fonttad, Kohler.

486/586 Télédétection II. 4 crédits. L'utilisation de données électromagnétiques numériques pour la classification, la cartographie et la surveillance des processus biologiques, hydrologiques, atmosphériques, géologiques et humains et des changements environnementaux. Séquence avec GEOG 485/585. Prérequis : GEOG 485/585. Fonttad, Kohler.

490/590 GIScience : [Sujet] [R]. 4 crédits. Sujets avancés sur la science des systèmes d'information géographique, y compris l'analyse et la modélisation spatiales, la visualisation de données, la cartographie, l'information géographique volontaire, la programmation SIG. Prérequis : GEOG 481/581. Bone, Kohler, Lobben, Schmidtke.

491/591 Systèmes d'information géographique avancés. 4 crédits. Analyse socio-économique avec des systèmes d'information géographique (SIG) et le recensement américain, modélisation de réseau, modèles 3D de paysages naturels et urbains, SIG et programmation Web. Séquence avec GEOG 481/581, 482/582. Prérequis : GEOG 482/582. Bone, Kohler, Lobben.

493/593 Cartographie avancée. 4 crédits. Les méthodes de conception et de production de cartes utilisent la couleur, la visualisation cartographique, la représentation graphique, la théorie des graphiques de données et l'intégration de systèmes d'information géographique (SIG) et d'outils graphiques. Séquence avec GEOG 481/581, 482/582. Prérequis : GEOG 482/582. Meacham.

GEOG 494. Analyse spatiale. 4 crédits.
Introduction à une variété de techniques d'analyse spatiale qui peuvent être utilisées pour comprendre et modéliser des phénomènes géographiques. Prérequis : GEOG 481. Os

495/595 Analyse des données géographiques. 4 crédits. Analyse et affichage de données géographiques par des méthodes traditionnelles d'analyse de données et par des approches de visualisation scientifique. Prérequis : GEOG 481/581. Bartlein.

GEOG 496. Systèmes de localisation. 4 crédits.
Explore les fondamentaux techniques des systèmes de localisation, tels que les modèles de localisation et les services basés sur la localisation, ainsi que les défis tels que la confidentialité des utilisateurs. Prérequis : GEOG 481. Schmidtke.

497/597 Méthodes qualitatives en géographie. 4 crédits. Explore les dimensions conceptuelles et pratiques de la recherche qualitative. Comprend l'établissement de liens entre théorie et méthode, formulation de questions de recherche, conception de projet, collecte, analyse et présentation de données sur l'éthique. Prérequis : GEOG 341, 342 ou 343.

GEOG 498. Conception de projet géospatial. 4 crédits.
Introduction aux méthodes de conception et de mise en œuvre de projets professionnels impliquant des données géospatiales, des technologies et des méthodes analytiques. Prérequis : GEOG 481. Os.


Contrôle et Audit

Mary S. Doucet , Thomas A. Doucet , dans Encyclopédie des systèmes d' information , 2003

II.B.1.b Contrôles organisationnels des systèmes d'information

La gestion des systèmes d'information est responsable des opérations quotidiennes de l'installation de traitement de l'information, ce qui inclut de s'assurer que les systèmes d'application peuvent accomplir leur travail et que le personnel de développement peut développer, mettre en œuvre et maintenir des systèmes d'application. En plus de la responsabilité des opérations quotidiennes, la gestion des systèmes d'information est responsable de la planification des systèmes d'information, de la planification stratégique et de la gestion de projets de systèmes d'information. La gestion des systèmes d'information est responsable du contrôle (1) de la saisie des données lorsqu'elle n'est pas effectuée dans les services utilisateurs (2) des fonctions de la bibliothèque telles que l'enregistrement, la publication, la réception et la sauvegarde de tous les fichiers de programmes et de données conservés sur des disques et des bandes informatiques et (3) des données fonctions de groupe de contrôle telles que la collecte, la conversion et le contrôle des entrées et l'équilibrage et la distribution des sorties aux utilisateurs, les opérations informatiques, l'administration de la sécurité, l'assurance qualité, l'administration des bases de données, l'analyse des systèmes, la programmation des applications, la programmation des systèmes, l'administration du réseau et l'aide administration du bureau.

La direction des systèmes d'information est également responsable de la bonne séparation des tâches au sein de la fonction de traitement de l'information. La séparation appropriée des tâches aide à réduire la possibilité que les transactions soient incorrectement autorisées ou enregistrées. Au minimum, l'analyse et la programmation des systèmes devraient être séparées des opérations informatiques pour empêcher un analyste ou un programmeur d'apporter des modifications non autorisées à un programme et d'utiliser ensuite ce programme modifié dans les opérations. En fait, la seule fonction avec laquelle la programmation d'applications peut être combinée, même dans une petite opération, est la fonction d'analyse des systèmes. Le programmeur d'applications aurait trop de contrôle s'il était associé à d'autres fonctions au sein de l'organisation des systèmes d'information.


Qu'est-ce que le SIG ?

C'est probablement la question la plus posée aux personnes dans le domaine des systèmes d'information géographique (SIG) et c'est probablement la plus difficile à répondre de manière succincte et claire.

Le SIG est un domaine technologique qui incorpore des caractéristiques géographiques avec des données tabulaires afin de cartographier, d'analyser et d'évaluer les problèmes du monde réel. Le mot clé de cette technologie est Géographie - cela signifie que les données (ou au moins une partie des données) sont spatiales, en d'autres termes, des données qui sont en quelque sorte référencées à des emplacements sur la terre. Ces données sont généralement associées à des données tabulaires appelées données d'attributs. Les données d'attributs peuvent généralement être définies comme des informations supplémentaires sur chacune des caractéristiques spatiales. Un exemple de ceci serait les écoles. L'emplacement réel des écoles est les données spatiales. Des données supplémentaires telles que le nom de l'école, le niveau d'éducation enseigné, la capacité des élèves constitueraient les données d'attribut. C'est le partenariat de ces deux types de données qui permet au SIG d'être un outil de résolution de problèmes aussi efficace grâce à l'analyse spatiale.

Le SIG fonctionne à plusieurs niveaux. Au niveau le plus élémentaire, le SIG est utilisé comme cartographie informatique, c'est-à-dire cartographie. La véritable puissance du SIG réside dans l'utilisation de méthodes spatiales et statistiques pour analyser les attributs et les informations géographiques. Le résultat final de l'analyse peut être des informations dérivées, des informations interpolées ou des informations hiérarchisées.

Autres citations pour répondre « Qu'est-ce que le SIG ?

« Au sens strict, un SIG est un système informatique capable d'assembler, de stocker, de manipuler et d'afficher des informations référencées géographiquement, c'est-à-dire des données identifiées en fonction de leur localisation. Les praticiens considèrent également que le SIG total comprend le personnel d'exploitation et les données qui entrent dans le système. USGS

Un système d'information géographique (SIG) est un outil informatique permettant de cartographier et d'analyser les choses qui existent et les événements qui se produisent sur terre. La technologie SIG intègre des opérations de base de données courantes telles que les requêtes et l'analyse statistique avec les avantages uniques de visualisation et d'analyse géographique offerts par les cartes. ESRI

« Le SIG est un système intégré de matériel informatique, de logiciels et de personnel qualifié reliant les données topographiques, démographiques, utilitaires, d'installation, d'image et d'autres ressources qui sont référencées géographiquement. » NasaLe SIG a déjà affecté la plupart d'entre nous d'une manière ou d'une autre sans même que nous nous en rendions compte. Si vous avez déjà utilisé un programme de cartographie Internet pour trouver des directions, félicitations, vous avez personnellement utilisé le SIG. La nouvelle chaîne de supermarchés du coin a probablement été localisée à l'aide d'un SIG pour déterminer l'endroit le plus efficace pour répondre à la demande des clients.

Composants du SIG

La prochaine étape pour comprendre le SIG consiste à examiner chaque composant du SIG et comment ils fonctionnent ensemble. Ces composants sont :

Matériel

Le matériel comprend l'équipement nécessaire pour prendre en charge les nombreuses activités du SIG allant de la collecte de données à l'analyse des données. La pièce maîtresse de l'équipement est le poste de travail, qui exécute le logiciel SIG et est le point d'attache pour l'équipement auxiliaire. Les efforts de collecte de données peuvent également nécessiter l'utilisation d'un numériseur pour la conversion de données papier en données numériques et d'un enregistreur de données GPS pour collecter des données sur le terrain. L'utilisation de la technologie de terrain portable devient également un outil important de collecte de données dans les SIG. Avec l'avènement du SIG basé sur le Web, les serveurs Web sont également devenus un élément important de l'équipement du SIG.

Logiciel

Différents progiciels sont importants pour les SIG. Le package d'application SIG est au centre de tout cela. Un tel logiciel est essentiel pour créer, éditer et analyser des données spatiales et attributaires. Par conséquent, ces progiciels contiennent une myriade de fonctions SIG qui leur sont inhérentes. Les extensions ou modules complémentaires sont des logiciels qui étendent les capacités du progiciel SIG. Le logiciel SIG composant est l'opposé du logiciel d'application. Component GIS cherche à créer des applications logicielles qui répondent à un objectif spécifique et sont donc limitées dans leurs capacités d'analyse spatiale. Les utilitaires sont des programmes autonomes qui remplissent une fonction spécifique. Par exemple, un utilitaire de format de fichier qui convertit un type de fichier SIG en un autre. Il existe également un logiciel SIG Web qui permet de diffuser des données via des navigateurs Internet.

Les données sont au cœur de tout SIG. Il existe deux principaux types de données utilisées dans les SIG. Une géodatabase est une base de données qui est en quelque sorte référencée à des emplacements sur la terre. Les géodatabases sont regroupées en deux types différents : vecteur et raster. Les données vectorielles sont des données spatiales représentées sous forme de points, de lignes et de polygones. Les données raster sont des données cellulaires telles que des images aériennes et des modèles altimétriques numériques. Ces données sont généralement associées à des données appelées données d'attribut. Les données d'attributs sont généralement définies comme des informations supplémentaires sur chaque entité spatiale hébergée sous forme de tableau. La documentation des jeux de données SIG est connue sous le nom de métadonnées. Les métadonnées contiennent des informations telles que le système de coordonnées, quand les données ont été créées, quand elles ont été mises à jour pour la dernière fois, qui les a créées et comment les contacter et des définitions pour toutes les données d'attribut de code.

Gens

Des personnes bien formées connaissant l'analyse spatiale et qualifiées dans l'utilisation des logiciels SIG sont essentielles au processus SIG. Il y a trois facteurs dans le volet humain : l'éducation, le cheminement de carrière et le réseautage. La bonne éducation est la clé pour la bonne combinaison de cours. Il est important de sélectionner le bon type de travail SIG. Une personne hautement qualifiée en analyse SIG ne devrait pas chercher un emploi en tant que développeur SIG si elle n'a pas suivi les cours de programmation nécessaires. Enfin, un réseautage continu avec d'autres professionnels du SIG est essentiel pour l'échange d'idées ainsi qu'une communauté de soutien.


Comté d'Ogle, Illinois

C'est probablement la question la plus posée aux personnes dans le domaine des systèmes d'information géographique (SIG) et c'est probablement la plus difficile à répondre de manière succincte et claire.

Les systèmes d'information géographique (SIG) peuvent être considérés comme l'équivalent high-tech de la carte. Le SIG est un domaine technologique en croissance rapide qui incorpore des caractéristiques graphiques avec des données tabulaires afin d'évaluer les problèmes du monde réel.

Le mot clé de cette technologie est la géographie - cela signifie généralement que les données (ou au moins une partie des données) sont spatiales, en d'autres termes, des données qui sont en quelque sorte référencées à des emplacements sur la terre. Ces données sont généralement associées à des données appelées données d'attributs. Les données d'attributs sont généralement définies comme des informations supplémentaires, qui peuvent ensuite être liées à des données spatiales. Un exemple de ceci serait les écoles. L'emplacement réel des écoles est les données spatiales. Des données supplémentaires telles que le nom de l'école, le niveau d'éducation enseigné, la capacité de l'école constitueraient les données d'attribut. C'est le partenariat de ces deux types de données qui permet au SIG d'être un outil de résolution de problèmes aussi efficace.

Le SIG fonctionne à plusieurs niveaux. Au niveau le plus élémentaire, le SIG est utilisé comme cartographie informatique, c'est-à-dire cartographie. La véritable puissance du SIG réside dans l'utilisation de méthodes spatiales et statistiques pour analyser les attributs et les informations géographiques. Le résultat final de l'analyse peut être des informations dérivées, des informations interpolées ou des informations hiérarchisées.

Une carte individuelle contient de nombreuses informations, qui sont utilisées de différentes manières par différentes personnes et organisations. Il représente le moyen de se situer par rapport au monde qui nous entoure. Les cartes sont utilisées dans diverses applications, allant de la localisation des fils téléphoniques et des conduites de gaz sous nos rues à l'affichage de l'étendue de la déforestation en Amazonie brésilienne.

La carte existe sous la même forme depuis des milliers d'années. Dans sa forme traditionnelle, il souffre d'un certain nombre de problèmes. Premièrement, les cartes sont statiques et donc difficiles et coûteuses à tenir à jour. Ceci est lié à un deuxième problème, car parce qu'elles sont statiques, elles perdent de la flexibilité, par exemple les cartes existent sous forme de feuilles discrètes et inévitablement votre zone d'intérêt se situe au coin de quatre feuilles adjacentes. De plus, les cartes sont souvent très complexes et peuvent nécessiter un expert pour extraire les données particulières qui présentent un intérêt.

Le SIG permet d'extraire les différents ensembles d'informations d'une carte (routes, agglomérations, végétation, etc.) et de les utiliser selon les besoins. Cela offre une grande flexibilité, permettant de produire rapidement une carte papier, qui répond exactement aux besoins de l'utilisateur. Cependant, le SIG va plus loin, car les données sont stockées sur ordinateur, l'analyse et la modélisation deviennent possibles. Par exemple, on pourrait pointer deux bâtiments, demander à l'ordinateur de les décrire chacun à partir d'une base de données jointe (beaucoup plus d'informations que ce qui pourrait être affiché sur une carte papier), puis de calculer le meilleur itinéraire entre ceux-ci.

Autres citations définissant le SIG

« Au sens le plus strict, un SIG est un système informatique capable d'assembler, de stocker, de manipuler et d'afficher des informations référencées géographiquement, c'est-à-dire des données identifiées selon leur localisation. Les praticiens considèrent également le SIG total comme incluant le personnel d'exploitation et les données qui entrent dans le système." USGS

"Un système d'information géographique (SIG) est un outil informatique permettant de cartographier et d'analyser les choses qui existent et les événements qui se produisent sur terre. La technologie SIG intègre des opérations de base de données communes telles que les requêtes et l'analyse statistique avec les avantages uniques de visualisation et d'analyse géographique offerts par Plans." ESRI

« Le SIG est un système intégré de matériel informatique, de logiciels et de personnel qualifié reliant les données topographiques, démographiques, utilitaires, d'installation, d'image et d'autres ressources qui sont référencées géographiquement. » Nasa

Ce qui est maintenant le domaine des SIG a commencé vers 1960, avec la découverte que les cartes pouvaient être programmées à l'aide d'un code simple, puis stockées dans un ordinateur permettant une modification future si nécessaire. C'était un changement bienvenu par rapport à l'ère de la cartographie manuelle où les cartes devaient être minutieusement créées à la main, même de petits changements nécessitaient la création d'une nouvelle carte. La première version d'un SIG était connue sous le nom de cartographie informatique et impliquait un simple travail au trait pour représenter les caractéristiques du terrain. De là a évolué le concept de superposition de différentes caractéristiques cartographiées les unes sur les autres pour déterminer les modèles et les causes des phénomènes spatiaux.

Les capacités des SIG sont bien loin des simples débuts de la cartographie informatique. Au niveau le plus simple, le SIG peut être considéré comme l'équivalent high-tech d'une carte. Cependant, non seulement les cartes papier peuvent être produites beaucoup plus rapidement et plus efficacement, mais le stockage des données dans un format numérique facilement accessible permet une analyse et une modélisation complexes jusqu'alors impossibles. La portée du SIG s'étend à toutes les disciplines et a été utilisée pour des problèmes aussi variés que la priorisation de l'habitat des espèces sensibles pour déterminer les emplacements immobiliers optimaux pour les nouvelles entreprises.

De quoi avez-vous besoin pour utiliser le SIG ?

Le matériel comprend l'équipement nécessaire pour prendre en charge les nombreuses activités du SIG allant de la collecte de données à l'analyse des données. La pièce maîtresse de l'équipement est le poste de travail, qui exécute le logiciel SIG et est le point d'attache pour l'équipement auxiliaire. Les efforts de collecte de données peuvent également nécessiter l'utilisation d'un numériseur pour la conversion de données papier en données numériques et d'un enregistreur de données GPS pour collecter des données sur le terrain. L'utilisation de la technologie de terrain portable devient également un outil important de collecte de données dans les SIG. Avec l'avènement du SIG basé sur le Web, les serveurs Web sont également devenus un élément important de l'équipement du SIG.

Différents progiciels sont importants pour les SIG. Le package d'application SIG est au centre de tout cela. Un tel logiciel est essentiel pour créer, éditer et analyser des données spatiales et attributaires. Par conséquent, ces progiciels contiennent une myriade de fonctions SIG qui leur sont inhérentes. Les extensions ou modules complémentaires sont des logiciels qui étendent les capacités du progiciel SIG. Par exemple, Xtools est une extension ArcView qui ajoute plus de capacités d'édition à ArcView 3.x. Le logiciel SIG composant est l'opposé du logiciel d'application. Component GIS cherche à créer des applications logicielles qui répondent à un objectif spécifique et sont donc limitées dans leurs capacités d'analyse spatiale. Les utilitaires sont des programmes autonomes qui remplissent une fonction spécifique. Par exemple, un utilitaire de format de fichier qui convertit un type de fichier SIG en un autre. Il existe également un logiciel SIG Web qui permet de diffuser des données via des navigateurs Internet.

Les données sont au cœur de tout SIG. Il existe deux principaux types de données utilisées dans le SIG. Une géodatabase est une base de données qui est en quelque sorte référencée à des emplacements sur la terre. Les géodatabases sont regroupées en deux types différents : vecteur et raster. Ces données sont généralement associées à des données appelées données d'attributs. Les données d'attributs sont généralement définies comme des informations supplémentaires, qui peuvent ensuite être liées à des données spatiales. La documentation des jeux de données SIG est connue sous le nom de métadonnées.

Des personnes bien formées connaissant l'analyse spatiale et qualifiées dans l'utilisation des logiciels SIG sont essentielles au processus SIG. Il y a trois facteurs dans le volet humain : l'éducation, le cheminement de carrière et le réseautage. La bonne éducation est la clé pour la bonne combinaison de cours. Il est important de sélectionner le bon type de travail SIG. Une personne hautement qualifiée en analyse SIG ne devrait pas chercher un emploi en tant que développeur SIG si elle n'a pas suivi les cours de programmation nécessaires. Enfin, un réseautage continu avec d'autres professionnels du SIG est essentiel pour l'échange d'idées ainsi qu'une communauté de soutien.


Aperçu des techniques analytiques SIG

Bien que les SIG soient apparus dans la recherche en éducation vers le tournant du siècle, ils sont toujours considérés comme une méthodologie innovante. Les techniques géospatiales ne cessent de s'étendre, offrant de nouvelles perspectives sur l'étude des problèmes de l'éducation, et donc de nouvelles façons de savoir. Les bases de données, outils et services géospatiaux sont également de plus en plus répandus. Même la manière dont les données géographiques sont créées et stockées a considérablement changé au cours des dernières années. Par exemple, les logiciels SIG prennent désormais en charge les systèmes de gestion de bases de données relationnelles appelés géodatabases, un ensemble de fichiers qui peuvent stocker, interroger et gérer à la fois des données spatiales et non spatiales. Une autre innovation liée au SIG a également été la création de interactif bases de données spatio-temporelles, où les utilisateurs peuvent effectuer des analyses en temps réel sur une variété de variables.

Bien qu'il existe plusieurs programmes SIG parmi lesquels choisir, l'un des packages les plus utilisés est ArcGIS (Environmental Systems Research Institute, 2018). ArcGIS contient ArcMap, qui est la principale application utilisée pour assembler, modifier et interroger des données géospatiales, et pour générer des cartes. ArcMap et son prédécesseur, ArcView, étaient les logiciels les plus cités dans mon examen.

Une grande variété d'outils d'analyse spatiale est offerte par ArcMap ou d'autres programmes SIG comparables. La génération de cartes implique généralement le téléchargement d'un fichier cartographique existant (dans le cas d'ArcMap, un « shapefile »), le géocodage de points d'intérêt spécifiques et l'ajout d'autres couches géographiques d'informations pertinentes. L'analyse spatiale peut commencer une fois que les données géographiques, généralement sous la forme de points, de lignes ou de polygones, ont été jointes aux bases de données tabulaires relationnelles. Il n'entre pas dans le cadre de cette revue d'entrer dans les détails sur la création de cartes numériques et l'analyse spatiale, mais je propose un résumé des techniques spatiales les plus courantes appliquées par les chercheurs en politiques éducatives.

Les zones géographiques, ou « entités polygonales », sont souvent le sujet d'étude dans la recherche SIG. Les zones sont définies par des « entités linéaires » dans le SIG, telles que les zones de fréquentation, les pistes de recensement et les frontières politiques. Les domaines se prêtent à un examen interne ainsi qu'à une comparaison avec d'autres domaines. Un logiciel d'analyse spatiale "permet aux données des zones voisines d'être comparées et agrégées, et les outils d'interpolation aréale permettent d'estimer les statistiques d'un ensemble de zones de rapport à partir de valeurs connues pour un deuxième ensemble incompatible de zones de rapport" (Goodchild, 1993 , tel que cité dans Goodchild & Janelle, 2004, p. 12). Un outil SIG fréquemment utilisé est analyse moyenne du plus proche voisin (ANNA), qui mesure les distances par rapport aux points centraux et est utilisé pour déterminer si certaines caractéristiques d'une variable démontrent un niveau de regroupement statistiquement significatif (Allen, 2009, tel que cité dans Schultz, 2014). Par exemple, Gilblom et Sang (2019) ont utilisé ANNA pour évaluer dans quelle mesure les écoles à charte de Cleveland se sont regroupées et dans quelles conditions géographiques. L'ANNA a été utilisée par Schultz (2014) de la même manière pour évaluer le regroupement d'enseignants de haute qualité à St. Louis.

Les zones présentent également des formes (carrées, ovales, étroites) et des tailles variables avec des propriétés et des caractéristiques qui interagissent avec la géographie politique environnante. Les chercheurs du SIG ont examiné la forme des districts scolaires par rapport à la démographie des communautés internes et contiguës. Saporito (2017) et Saporito et Van Riper (2016) ont étudié dans quelle mesure les formes des zones de fréquentation scolaire étaient associées à la ségrégation raciale dans les écoles. Pour prendre leur décision, ils ont testé «l'irrégularité» des formes des districts scolaires à travers les États-Unis à l'aide du SIG mesures de compacité. 4

Estimations de la densité du noyau (KDE) sont utilisés pour calculer la densité des caractéristiques dans un espace géographique (par exemple, la densité des écoles, les rapports de criminalité, les autoroutes). Singleton et al. (2011) ont produit une représentation alternative des bassins versants scolaires « à l'aide d'estimations de densité par noyau (KDE) des zones où une population locale d'intérêt est spatialement concentrée » (p. 243). Ils suggèrent que les estimations de densité peuvent être utilisées « pour identifier les zones dans lesquelles vivent environ 50 %, 75 % ou 95 % des élèves et qui fréquentent une école donnée » (p. 243). Un avantage majeur de la technique KDE est qu'elle « ne divulgue l'emplacement des points d'aucun élève » (p. 243), ce qui peut aider à maintenir la confidentialité. 5 Singleton et al. (2011) ont exposé l'utilité de la carte améliorée par KDE, notant que dans « un certain sens, cela crée une approximation raisonnable du bassin scolaire et reflète en fait les visualisations de type hotspot qui sont couramment utilisées dans d'autres domaines tels que l'analyse de la criminalité (Chainey & Ratcliffe, 2005) » (p. 243).

Camara et al. (2004) ont utilisé plusieurs techniques spatiales avancées pour mesurer l'exclusion sociale à Sao Paulo, au Brésil. Ils ont cherché à répondre à la question de savoir si l'exclusion sociale était dépendante de l'espace, ou s'il y avait « des « poches » de variation locale où l'exclusion/l'inclusion sociale différaient de manière significative des tendances générales de la ville » (p. 229). To do so, they applied global and local spatial autocorrelation to identify clusters of social exclusion and inclusion in the city. Spatial autocorrelation is “the tendency for observations that are near each other in space to have similar values” (Goodchild & Janelle, 2004, p. 8). In order to determine the relative influence of various other political, demographic, and community factors, including level of education and crime, Câmara et al. (2004) used spatial regression techniques. Finally, they applied spatial tools “to produce trend surfaces for homicide rates in São Paulo” in 1996 and 1999 (p. 236). They generated maps containing district homicide rates and used these data to produce a variogram that “model[ed] the spatial correlation structure, and a surface was interpolated by ordinary kriging [emphasis added] (Bailey and Gatrell 1995)” (p. 235).

In many, if not most, studies that employ geospatial analysis, GIS is used as a means to generate space-based data for subsequent statistical analysis. As an example, Collingwood et al. (2018) used GIS to spatially join census data with precinct data in their political analysis of Washington’s 2012 charter school initiative—the first voter-approved charter initiative in the United States. They employed a spatial lag regression model to draw the conclusion that “the coalition of [charter] supporters cut across usual partisan and demographic cleavages, producing somewhat strange bedfellows” (p. 61). Other analytic tools combine geography and statistics, such as geographically weighted regression. Geographically weighted regression assigns observations weights that are inversely related to a distance from a selected location (Goodchild & Janelle, 2004).

Spatiotemporal analysis can be applied to investigate patterns or historical accounts of educational opportunity over time. For example, Reed (2006) studied the racial effects of a 1960 voucher program four years after it was introduced in Alexandria, Virginia. S. Williams and Wang (2014) spatially examined the accessibility of public schools in Baton Rouge, Louisiana, over three successive time periods—1990, 2000, and 2010. They used GIS tools to create a spatial accessibility index to gauge students’ accessibility to high schools and then compared the accessibilities over time. To learn of other GIS studies adopting a historical perspective, see a summary by Kelly (2019).

S. Williams and Wang’s (2014) measure of spatial accessibility expanded upon prior GIS techniques. They note that

[a]ccessibility measures need to account for both spatial and aspatial factors (Wang & Luo, 2005). Spatial accessibility emphasizes the importance of spatial separation between supply (i.e. high schools) and demand (i.e. student population) and how they are connected in space. Aspatial factors include many demographic and socioeconomic variables. In earlier literature, two simple methods are often used to measure spatial accessibility: the distance or travel time from the nearest supply facility termed the proximity method (Wang, 2006, p. 56) and the supply-demand ratio in an area. The former ignores the effect of the service’s scarcity, and the latter does not account for interaction between supply and demand across the borders of analysis areas. (p. 1069)

two-step floating catchment area (2SFCA) method (Luo & Wang, 2003), [which] measures spatial accessibility as a ratio of the amount of service supplied to the population in demand of the service, while accounting for the complex interaction between them within a certain distance range. (p. 1069)

In this case, supply was determined by the number of full-time equivalent teachers in each high school, and demand was defined by the number of high school-age students within a 5-mile radius.

A small but growing body of GIS education research is combining geospatial analysis with qualitative inquiry. Indeed, there have been increased calls for moving beyond post-post-positivistic geospatial research and toward more mixed and qualitative methods (Elwood & Cope, 2009 Lubienski & Lee, 2017 Yoon & Lubienski, 2018), as well as the application of critical perspectives in GIS research (Hogrebe & Tate, 2012 Jabbar et al., 2017 Yoon, Gulson, & Lubienski, 2018). Those calls are now being answered, and more qualitative GIS studies have emerged (Bell, 2007 Jabbar et al., 2017 Yoon, Lubienski, & Lee, 2018), including “participatory GIS” (Dunn, 2007 Elwood, 2006 Weiner & Harris, 2008 Yoon & Lubienski, 2018), those that engage marginalized communities and their members (Ghose & Welcenbach, 2018 Hogrebe & Tate, 2012 Kwan & Ding, 2008), or those that are emancipatory in nature (Sui, 2015). Mixed-method approaches invite both etic and emic perspectives, giving deeper accounts of “place” and pushing GIS research to consider not only multiple ways of knowing but also multiple ontologies.


Conclusions

This article considers the emergence of the interdisciplinary field of Data Science and critically examines the role that Geography and subdisciplinary approaches such as GISc can play in the development of new methodological and epistemological frameworks. The rapid expansion of instrumentation generating spatial “Big Data” generates clear research opportunities, but also significant challenges. We discuss how “Big Data” has spawned Data Science and how the field has evolved to consider ever more inherently geographic problems. However, this expansion has not been accompanied by an extension of the original methodological approaches and epistemological frameworks, potentially making its application to problems where location is key suboptimal. Given such disconnect, we make a case for closer and careful coupling and assimilation of the connected fields of Geography with Data Science, and provide some evidence that such practices are already taking place.

We argue strongly that there is substantial potential for the establishment of a Geographic Data Science within Geography, which provides a historical lineage of interdisciplinary working, and which we see as an important component of the next 50 years of the Geographical Analysis community. In this context, Data Science can benefit from the critically reflective perspective that Geography takes on new computational approaches to locational problems, as well as methodological contributions that better account for some of the key challenges in building models with spatial data. Such a relationship is and should be bidirectional in nature, since the discipline of Geography also has much to gain from Data Science, particularly in the methodological and technical aspects of working with “Big Data.” We recognize the lineage of a Geographic Data Science would be closely related to Geocomputation, Geographic Information Systems and, in a broadest sense, Quantitative Geography and Geographical Analysis. But we also stress the need for a distinct Geographic Data Science, given the interdisciplinarity of this endeavor and, furthermore, the step change that the technological innovation of new forms of “Big Data” implies and requires methodologically to take full advantage. We conclude with a research agenda toward a Geographic Data Science that will emerge through deeper integration of the discipline of Geography and Data Science around three areas that include aspects of systems engineering, new methodological development, and work toward addressing some acute challenges of epistemology.

It is clear to us that there are benefits for this integration, both in practical terms of being able to implement more effective, ethical, and epistemologically robust analytics but also, and importantly, in sustaining the relevance of Geography and subdisciplinary approaches within a rapidly changing socio-technological landscape. We concur with Graham and Shelton ( 2013 : 259) when they state that “the futures of geography and big data are still to be made,” and that there is still much exciting work to be done for a range of scholars with differing interests. To this end, we are firmly convinced there can only be positive outcomes from stronger interaction and cross-fertilization between the Geography and Data Science, and that this will strengthen our discipline and reaffirm its future relevance.