Suite

Est-il possible d'utiliser la fonction spatiale pour récupérer des données non spatiales ?

Est-il possible d'utiliser la fonction spatiale pour récupérer des données non spatiales ?


J'utilise PostGIS dans postgresql.Je souhaite calculer des points dans le rayon d'un géocode particulier.Pour cela, j'ai créé une table avec un géocode de colonne spatiale ayant un type de données comme géométrie et inséré des valeurs à l'aide de la requête suivante.

INSÉRER DANS aspatial_address( addressline, country, geocode) VALUES (",", ST_GeomFromText('POINT(14.083333 70.583333)', 4326));

En tant que géocode ayant un type de données de géométrie inséré, les valeurs de géocode sont stockées au format hexadécimal.Ex. pour "POINT(10,19.1)", il stocke "01010000000000000000000024409A99999999193340" en tant que géocode.

Je peux récupérer ces valeurs au format de géocodage normal en utilisant ST_AsText(géocode)géocode fonction utilisant :

sélectionnez addressid,ST_AsText(geocode)geocode de aspatial_address comme A où ST_Point_Inside_Circle(a.geocode,14.083333,19.583333,7)

Jusqu'à ce que tout aille bien.

Maintenant, je souhaite sélectionner des valeurs de géocodage à partir de tables postgres non spatiales. pour cela, j'ai essayé la même requête, mais leur incompatibilité entre le type de données du géocode.Comme spatial a un type de données géométrique et non spatial, un type de données variant avec des caractères, cela donne une erreur.Puis-je convertir le type de données via une requête en utilisant n'importe quelle fonction ou dois-je changer de requête ?


En supposant que votre structure est quelque chose comme ça

table A ( id int, emplacement varchar(MAX) )

et les données

insérer dans A VALUES(1, '0101000000000000000000024409A99999999193340')

alors vous pouvez (en gardant à l'esprit l'énorme pénalité de performance mentionnée par @Vince ) interroger votre base de données en utilisant quelque chose comme

sélectionnez * à partir de A où ST_Point_Inside_Circle(ST_PointFromWKB(A.location),14.083333,19.583333,7)

(tous les codes non testés)


Expert en solutions géospatiales

Fondamentalement, une base de données consiste en une collection organisée de données pour une ou plusieurs utilisations, généralement sous forme numérique.

Base de données spatiale : a la capacité de stocker et d'accéder à la fois aux informations de localisation/spatiales et aux attributs/informations non spatiales.

Base de données non spatiale : a la capacité de stocker et d'accéder uniquement aux attributs/informations non spatiales.

L'infographie ci-dessous montre la différence entre les concepts de bases de données spatiales et non spatiales.

Fondamentalement, les différences résident dans les capacités de stockage, de fonction et de requête entre les deux. Les différences notables sont énumérées ci-dessous-

a) Une base de données spatiale prend en charge des types de données spéciaux pour les objets géométriques et vous permet de stocker des données géométriques (généralement de nature géographique) dans des tableaux alors qu'une base de données non spatiale ne les prend pas en charge.

b) Une base de données spatiale fournit des fonctions et des index spéciaux pour interroger et manipuler des données géospatiales en utilisant quelque chose comme le langage de requête structuré (SQL), tandis que la base de données non spatiale ne fournit pas de telles fonctions et index.

c) Une base de données spatiale est souvent utilisée comme conteneur de stockage pour les données géospatiales, mais elle peut faire bien plus que cela. Alors que la base de données non spatiale est souvent utilisée comme conteneur de stockage pour les données non spatiales.

d) Une base de données spatiale utilise une requête spatiale dans des fonctions géométriques pour répondre à des questions sur l'espace et les objets dans l'espace. Alors que la base de données non spatiale ne prend pas en charge les requêtes spatiales.

e) En plus de pouvoir répondre aux questions sur l'utilisation de l'espace, les fonctions des bases de données spatiales permettent de créer et de modifier des objets dans l'espace. Cette partie de l'analyse spatiale est souvent appelée traitement géométrique ou spatial.

f) Une base de données spatialement activée peut intrinsèquement fonctionner avec des types de données tels que les rivières (modélisées sous forme de lignes), les parcelles de terrain (modélisées sous forme de polygones) et les arbres (modélisés sous forme de points). Alors que la base de données non spatiale ne peut pas fonctionner avec ces formes de modèles.

Exemples de bases de données spatiales et non spatiales

Il existe plusieurs exemples de serveurs de bases de données spatiaux et non spatiaux, mais les plus courants incluent :
a) SpatiaLite - SQLite
b) Oracle Spatial/Localisateur - Oracle
c) MySQL Spatial - MySQL
d) PostGIS - PostgreSQL
e) DB2 Spatial - IBM DB2/Informix
f) MsSQL Spatial - Serveur MsSQL
g) Hadoop spatial - Hadoop
h) MS Access - il s'agit d'une base de données non spatiale, elle ne prend pas en charge la base de données spatiale au moment de la rédaction.

Notez que les bases de données spatiales sont en fait des bases de données non spatiales avec une extension spatiale ajoutée (j'espère que cela a du sens). Quoi qu'il en soit, étudiez les images ci-dessous, la première contient des bases de données non spatiales. Après les avoir étendus avec des capacités de localisation/spatiales, ils deviennent alors des bases de données spatiales.


Avec les extensions géosémantiques, Sense permet une utilisation optimisée des fonctions topologiques et spatiales dans les requêtes SPARQL. Ces fonctions permettent de restreindre la requête à des entités sémantiques dans une certaine zone, juste en la traversant, ou à une certaine distance d'un objet géographique. En plus des points de coordonnées uniques, Sense gère également les lignes et les polygones. Tout cela peut être utilisé dans les requêtes SPARQL en combinaison avec des filtres sémantiques non spatiaux.

Les extensions géosémantiques permettent également de retourner des données géographiques dans des résultats de requête SPARQL alignés avec les autres données. Cela peut être utilisé par exemple pour visualiser des ensembles de résultats au-dessus d'une carte sans invoquer des requêtes supplémentaires dans les bases de données spatiales.


1 réponse 1

Tout d'abord : le regroupement par année dans votre exemple ne Ressentir droite. Les zones ressemblent à des unités administratives et vous vous retrouvez avec deux polygones résumés dessinés l'un sur l'autre.

Dans un monde idéal, je séparerais probablement l'objet géométrique des données annuelles.

Mais cela étant dit, je traiterai votre exemple comme un exemple-jouet, destiné à démontrer un problème plutôt qu'à donner un sens en soi.

Considérez ce code : comme les taches sont minuscules, il est possible de les supprimer (ou plutôt d'éviter de les créer en premier lieu) en tamponnant vos polygones d'origine de 10 unités, puis en débuffant le polygone final du même montant.

Vous vous retrouverez avec deux polygones dessinés l'un sur l'autre, sans taches.


Arrière-plan

On estime qu'aujourd'hui 4,74 millions de personnes sont séropositives en Afrique du Sud et le South African Medical Research Council (MRC) a prévu que sans traitement approprié pour prévenir le développement du SIDA, le nombre de décès dus au SIDA au cours de la prochaine décennie serait plus du double du nombre de décès dus à toutes les autres causes, résultant en 6 à 7 millions de décès cumulés du SIDA en Afrique du Sud en 2010 [1]. La pandémie implique à la fois un défi médical et un défi logistique. Laissant à la profession médicale le soin de relever le défi médical, les ingénieurs peuvent contribuer au défi logistique, qui repose sur la gestion des soins de santé à l'aide de la technologie. Les principaux défis pour la gestion efficace et efficiente du VIH/SIDA en Afrique du Sud sont l'insuffisance des infrastructures physiques et le manque de statistiques fiables sur la maladie. Les données disponibles sont soit des estimations, soit des projections et varient donc entre des suppositions éclairées et des spéculations sauvages. Le gouvernement sud-africain estime que la fourniture et la fourniture de médicaments antirétroviraux aux patients atteints du VIH/sida pourraient être inefficaces compte tenu de l'ampleur de la pandémie et de son intersection avec la pauvreté et d'autres épidémies telles que la tuberculose et le paludisme. Le manque de centres de santé, d'infrastructures et de commodités (par exemple, l'électricité et l'eau) ainsi que les faibles niveaux d'alphabétisation en matière de traitement sont des préoccupations supplémentaires pour le taux d'adhésion aux médicaments requis de 95 % (Orrell 2002 – Communication personnelle). En raison des ressources limitées du pays et en essayant d'aborder les « points chauds », il est nécessaire d'établir des zones où la prévalence du VIH/SIDA est la plus élevée. Certaines des données nécessaires pour lutter contre la pandémie concernent :

◆ Localisation de la prévalence élevée du VIH/SIDA

◆ Niveau d'infrastructure disponible pour les communautés

◆ Taux d'infection du VIH/SIDA

◆ Statu quo des soins médicaux au sein des communautés.

La plupart de ces données sont disponibles dans un certain nombre de systèmes. Les municipalités disposeront de données relatives aux niveaux d'infrastructure et au statu quo des soins médicaux. Les médecins des hôpitaux savent combien de patients atteints du VIH/SIDA entrent quotidiennement dans la clinique et quand et comment ces patients ont été infectés. La conception d'un système qui combine ces informations doit répondre aux deux problèmes suivants : premièrement, combiner les données gérées par diverses autorités dans un certain nombre de systèmes et deuxièmement combiner les données de nature spatiale et non spatiale. Le système devrait fonctionner comme un système d'information contenant des données précises sur le VIH/SIDA et les infrastructures et soutenir la prise de décision et la gestion. L'intégration facile du système dans les environnements SIG existants qui sont établis au sein des structures gouvernementales telles que le département de l'électricité, le bureau de l'arpenteur général, le bureau des actes et autres est essentielle. Les informations obtenues seront ensuite transformées en connaissances utilisables pour une planification, une évaluation et une élaboration de politiques efficaces. La conviction est que tout système basé sur la technologie du système d'information géographique ou spatiale offrira une formidable opportunité dans l'informatique de santé des patients atteints du VIH/SIDA en Afrique du Sud. Alors que le système d'information spatiale (SIS) ne peut pas résoudre la pandémie du VIH/SIDA, il doit être considéré comme un outil de collecte d'informations qui peut être utilisé dans la mobilisation et la réponse à la maladie. Le projet visait à établir des paramètres et des repères relatifs à l'utilisation du SIS pour administrer et gérer les données des patients.

La commune de Gugulethu

Gugulethu est situé à environ 20 km du Cap et est sans doute l'un des townships noirs les plus anciens et les plus dynamiques d'Afrique du Sud. Gugulethu abrite environ 325 000 personnes (Bekker 2003 – Personal Communication), généralement pauvres comme l'indique le revenu mensuel moyen de R1126 [2]. Le taux actuel de prévalence du VIH dans la communauté de Gugulethu est de 27 % (Bekker 2003 – Communication personnelle). Cela se traduit par ±88 000 personnes vivant avec le VIH/SIDA et coûte principalement la vie à des adultes âgés de 19 à 40 ans, laissant derrière eux des enfants et des parents vieillissants. L'ampleur de la pandémie dans le canton continue de s'étendre et, par conséquent, le nombre de patients visitant la clinique augmente (Matoti 2003 – Communication personnelle).

Défis actuellement rencontrés à la clinique communautaire de Gugulethu

L'un des principaux défis dans la plupart des cliniques basées dans les cantons est le système de gestion papier des patients atteints du VIH/SIDA. Chaque patient visitant la clinique a un dossier comprenant des informations personnelles, y compris le nom, l'adresse, le plus proche parent. Des informations cliniques telles que la taille, le poids, le groupe sanguin, le type de maladie sont également enregistrées. A chaque visite, les dossiers respectifs des patients sont récupérés et des inscriptions sont effectuées dans le dossier des patients soit par le commis administratif, soit par l'infirmière. Les processus d'enregistrement, de consultation et de distribution étant effectués manuellement, des erreurs humaines telles que l'égarement ou la perte des dossiers sont inévitables.

De plus, il est courant que les patients, qui estiment qu'ils ne bénéficient pas des soins et des services de santé fournis, choisissent de se rendre dans un autre centre de santé. Plusieurs cas de patients transférés vers d'autres centres de santé ou encore de patients d'ailleurs venus se faire soigner à la clinique communautaire de Gugulethu ont été enregistrés. Le principal inconvénient dans de tels cas est que l'histoire de santé des patients est inconnue et ceci est particulièrement dangereux dans le cas d'un traitement antirétroviral, car l'histoire des patients joue un rôle majeur dans la décision du traitement.

Une autre préoccupation exprimée par le personnel est que Gugulethu étant un canton, il est considéré comme une zone négligée et défavorisée. Les responsables et gestionnaires de la santé accèdent rarement à la commune et ne sont donc pas au courant de la situation sur le terrain. Matoti (2003 – Communication personnelle) a estimé que pour que la clinique communautaire de Gugulethu subisse une quelconque amélioration de l'infrastructure, elle doit d'abord et avant tout être visible sur la carte des centres de santé d'Afrique du Sud. Il a en outre déclaré que les responsables et les gestionnaires de la santé doivent être informés que plus de 27% des habitants de Gugulethu sont séropositifs, que les gens sont aux prises avec la pandémie dans un contexte d'extrême pauvreté et que les mauvaises infrastructures existantes à la clinique entravent la livraison de soins et de services de santé efficaces.


Analyse spatiale (données)

Lisez le chapitre 1 : « Introduction à l'analyse statistique en géographie », de Rogerson, P.A. (2001). Méthodes statistiques pour la géographie. Londres : SAGE Publications. Ce texte est disponible sous forme de livre électronique dans la bibliothèque PSU (assurez-vous que vous êtes connecté à votre compte PSU) et vous pouvez télécharger et enregistrer un pdf de ce chapitre (ou d'autres) sur votre ordinateur. Vous pouvez ignorer la section sur l'analyse dans SPSS.

Analyse spatiale:

Fait référence à la « capacité générale de manipuler des données spatiales sous différentes formes et d'en extraire une signification supplémentaire » (Bailey 1994, p. 15) en utilisant un ensemble de techniques « nécessitant l'accès à la fois aux emplacements et aux attributs des objets » (Goodchild 1992 , page 409). Cela signifie que l'analyse spatiale doit s'appuyer sur une gamme de méthodes quantitatives et nécessite l'intégration et l'utilisation de nombreux types de données et de méthodes (Cromley et McLafferty 2012).

Par où et comment commencer ?

Dans la figure 2.0, nous avons fourni un aperçu du processus impliqué, nous allons maintenant fournir quelques détails pour vous familiariser avec le processus de recherche et les types de méthodes que vous pouvez utiliser pour effectuer votre analyse.

Cadre de recherche

Où et comment commençons-nous à analyser nos données ? L'analyse des données, qu'elles soient spatiales ou non, est un processus itératif qui implique de nombreux composants différents (Figure 2.1). Selon les questions que nous avons en tête, nous aurons besoin de certaines données. Ensuite, nous devrons apprendre à connaître nos données afin de comprendre leurs limites, d'identifier les transformations nécessaires pour produire une analyse valide et de mieux comprendre les types de méthodes que nous pourrons utiliser. Ensuite, nous voudrons affiner notre hypothèse, puis effectuer notre analyse, interpréter nos résultats et partager nos découvertes.

Analyse statistique et spatiale

Maintenant que vous avez compris le processus de recherche, commençons par nous familiariser avec les différents types de méthodes d'analyse statistique et spatiale que nous pouvons avoir besoin d'utiliser à chaque étape du processus (Figure 2.2). Comme vous pouvez le voir sur la figure 2.2, les méthodes d'analyse statistique et spatiale sont étroitement liées et souvent intégrées. Je sais que cela semble complexe, et pour beaucoup d'entre vous, les méthodes sont nouvelles, mais à la fin de ce cours, vous aurez une meilleure compréhension de bon nombre de ces méthodes et de la façon de les intégrer lorsque vous avez besoin de méthodes spatiales et/ou statistiques.

  1. Données: Déterminez quelles données sont nécessaires. Cela peut nécessiter la collecte de données ou l'obtention de données de tiers. Une fois que vous avez les données, elles peuvent avoir besoin d'être nettoyées, traitées (transformées, agrégées, converties, etc.), organisées et stockées afin qu'elles soient faciles à gérer, à mettre à jour et à récupérer pour des analyses ultérieures.
  2. Données: Apprenez à connaître les données. C'est une étape importante que de nombreux étudiants contournent. Toutes les données ont des problèmes d'une forme ou d'une autre. Ces problèmes sont basés sur la façon dont l'ensemble de données a été collecté et stocké. Avant de pouvoir avancer dans votre analyse, il est essentiel de comprendre quelles sont ses limites, de déterminer si l'ensemble de données est utile et/ou d'identifier les valeurs aberrantes. Pour mieux comprendre et explorer les données, vous pouvez utiliser des méthodes statistiques descriptives spatiales et non spatiales ainsi que visualiser les données sous forme de graphiques ou de tracés ainsi que sous forme de carte.
  3. Analyse spatiale et méthodes statistiques. Au fur et à mesure de votre analyse, vous utiliserez diverses méthodes statistiques, spatiales ou les deux, comme le montre la figure 2.2. Au cours des semaines à venir, nous utiliserons bon nombre de ces méthodes en commençant par l'analyse des motifs de points (PPA) dans la leçon 3, l'analyse d'autocorrélation spatiale (leçon 4), l'analyse de régression (leçon 5) et l'utilisation de différentes fonctions spatiales pour effectuer des analyse (Leçons 6-Leçon 8). N'oubliez pas qu'il s'agit d'un processus itératif qui nécessitera probablement l'utilisation d'une ou plusieurs des méthodes résumées dans le diagramme qui sont soit des méthodes statistiques traditionnelles (à gauche) soit une variété de méthodes spatiales (à droite). Dans de nombreux cas, nous allons probablement faire des allers-retours entre les différents composants (haut et bas) ainsi qu'entre les côtés gauche et droit.
  4. La communication. Enfin, une partie importante de tout processus de recherche consiste à communiquer efficacement vos résultats. Nous pouvons le faire de différentes manières à l'aide d'outils Web et de l'intégration de différentes visualisations.

Maintenant que vous avez été initié au cadre de recherche et que vous avez une idée de certaines des méthodes que vous allez apprendre, couvrons les bases afin que nous soyons tous sur la même longueur d'onde. Nous commencerons par les données, puis l'analyse spatiale, et terminerons par un rappel sur les statistiques.


Arrière-plan

On estime qu'aujourd'hui 4,74 millions de personnes sont séropositives en Afrique du Sud et le South African Medical Research Council (MRC) a prévu que sans traitement approprié pour prévenir le développement du SIDA, le nombre de décès dus au SIDA au cours de la prochaine décennie serait plus du double du nombre de décès dus à toutes les autres causes, entraînant 6 à 7 millions de décès cumulés dus au sida en Afrique du Sud en 2010 [1]. La pandémie implique à la fois un défi médical et un défi logistique. Laissant à la profession médicale le soin de relever le défi médical, les ingénieurs peuvent contribuer au défi logistique, qui repose sur la gestion des soins de santé à l'aide de la technologie. Les principaux défis pour la gestion efficace et efficiente du VIH/SIDA en Afrique du Sud sont l'insuffisance des infrastructures physiques et le manque de statistiques fiables sur la maladie. Les données disponibles sont soit des estimations, soit des projections et varient donc entre des suppositions éclairées et des spéculations sauvages. Le gouvernement sud-africain estime que la fourniture et la fourniture de médicaments antirétroviraux aux patients atteints du VIH/sida pourraient être inefficaces compte tenu de l'ampleur de la pandémie et de son intersection avec la pauvreté et d'autres épidémies telles que la tuberculose et le paludisme. Le manque de centres de santé, d'infrastructures et de commodités (par exemple, l'électricité et l'eau) ainsi que les faibles niveaux d'alphabétisation en matière de traitement sont des préoccupations supplémentaires pour le taux d'adhésion aux médicaments requis de 95 % (Orrell 2002 – Communication personnelle). En raison des ressources limitées du pays et en essayant d'aborder les « points chauds », il est nécessaire d'établir des zones où la prévalence du VIH/SIDA est la plus élevée. Certaines des données nécessaires pour lutter contre la pandémie concernent :

◆ Localisation de la prévalence élevée du VIH/SIDA

◆ Niveau d'infrastructure disponible pour les communautés

◆ Taux d'infection du VIH/SIDA

◆ Statu quo des soins médicaux au sein des communautés.

La plupart de ces données sont disponibles dans un certain nombre de systèmes. Les municipalités disposeront de données relatives aux niveaux d'infrastructure et au statu quo des soins médicaux. Les médecins des hôpitaux savent combien de patients atteints du VIH/SIDA entrent quotidiennement dans la clinique et quand et comment ces patients ont été infectés. La conception d'un système qui combine ces informations doit répondre aux deux problèmes suivants : premièrement, combiner des données gérées par diverses autorités dans un certain nombre de systèmes et deuxièmement combiner des données de nature spatiale et non spatiale. Le système devrait fonctionner comme un système d'information contenant des données précises sur le VIH/SIDA et les infrastructures et soutenir la prise de décision et la gestion. L'intégration facile du système dans les environnements SIG existants qui sont établis au sein des structures gouvernementales telles que le département de l'électricité, le bureau de l'arpenteur général, le bureau des actes et autres est essentielle. Les informations obtenues seront ensuite transformées en connaissances utilisables pour une planification, une évaluation et une élaboration de politiques efficaces. La conviction est que tout système basé sur la technologie du système d'information géographique ou spatiale offrira une formidable opportunité dans l'informatique de santé des patients atteints du VIH/SIDA en Afrique du Sud. Alors que le système d'information spatiale (SIS) ne peut pas résoudre la pandémie du VIH/SIDA, il doit être considéré comme un outil de collecte d'informations qui peut être utilisé dans la mobilisation et la réponse à la maladie. Le projet visait à établir des paramètres et des repères relatifs à l'utilisation du SIS pour administrer et gérer les données des patients.

La commune de Gugulethu

Gugulethu est situé à environ 20 km du Cap et est sans doute l'un des townships noirs les plus anciens et les plus dynamiques d'Afrique du Sud. Gugulethu abrite environ 325 000 personnes (Bekker 2003 – Communication personnelle), généralement pauvres, comme l'indique le revenu mensuel moyen de R1126 [2]. Le taux actuel de prévalence du VIH dans la communauté de Gugulethu est de 27% (Bekker 2003 – Personal Communication). Cela se traduit par 놈 000 personnes atteintes du VIH/sida et coûte principalement la vie à des adultes âgés de 19 à 40 ans, laissant derrière eux des enfants et des parents vieillissants. L'ampleur de la pandémie dans le canton continue de s'étendre et, par conséquent, le nombre de patients visitant la clinique augmente (Matoti 2003 – Communication personnelle).

Défis actuellement rencontrés à la clinique communautaire de Gugulethu

L'un des principaux défis dans la plupart des cliniques basées dans les cantons est le système de gestion papier des patients atteints du VIH/SIDA. Chaque patient visitant la clinique a un dossier comprenant des informations personnelles, y compris le nom, l'adresse, le plus proche parent. Des informations cliniques telles que la taille, le poids, le groupe sanguin, le type de maladie sont également enregistrées. A chaque visite, les dossiers respectifs des patients sont récupérés et des inscriptions sont effectuées dans le dossier des patients soit par le commis administratif, soit par l'infirmière. Les processus d'enregistrement, de consultation et de distribution étant effectués manuellement, des erreurs humaines telles que l'égarement ou la perte des dossiers sont inévitables.

De plus, il est courant que les patients, qui estiment qu'ils ne bénéficient pas des soins et des services de santé fournis, choisissent de se rendre dans un autre centre de santé. Plusieurs cas de patients transférés vers d'autres centres de santé ou encore de patients d'ailleurs venus se faire soigner à la clinique communautaire de Gugulethu ont été enregistrés. Le principal inconvénient dans de tels cas est que l'histoire de santé des patients est inconnue et ceci est particulièrement dangereux dans le cas d'un traitement antirétroviral, car l'histoire des patients joue un rôle majeur dans la décision du traitement.

Une autre préoccupation exprimée par le personnel est que Gugulethu étant un canton, il est considéré comme une zone négligée et défavorisée. Les responsables et gestionnaires de la santé accèdent rarement à la commune et ne sont donc pas au courant de la situation sur le terrain. Matoti (2003 – Personal Communication) a estimé que pour que la clinique communautaire de Gugulethu subisse une quelconque amélioration de l'infrastructure, elle doit d'abord et avant tout être visible sur la carte des centres de santé d'Afrique du Sud. Il a en outre déclaré que les responsables et les gestionnaires de la santé doivent être informés que plus de 27% des habitants de Gugulethu sont séropositifs, que les gens sont aux prises avec la pandémie dans un contexte d'extrême pauvreté et que les mauvaises infrastructures existantes à la clinique entravent la livraison de soins et de services de santé efficaces.


Andrienko, G., & Andrienko, N. (1999). Cartes interactives pour l'exploration visuelle des données. Revue Internationale du Système d'Information Géographique, 13(4), 355–374.

Andrienko, N., Andrienko, G., & Gatalsky, P. (2003). Visualisation spatio-temporelle exploratoire : une revue analytique. Journal des langages visuels et de l'informatique, 14(6), 503–541.

Ankerst, M., Breunig, M.M., Kriegel, H.-P., & Sander, J. (1999). OPTIQUE : points de commande pour identifier la structure de clustering. Conférence internationale ACM SIGMOD sur la gestion des données (p. 49-60). Philadelphie, Pennsylvanie, États-Unis : ACM.

Baase, S., & amp Gelder, A.V. (2000). Algorithmes informatiques. Addison-Wesley.

Bar-Joseph, Z., Demaine, E.D., Gifford, D.K., Hamel, A.M., Jaakkola, T.S., & Srebro, N. (2003). Regroupement K-aire avec ordre optimal des feuilles pour les données d'expression génique. Bioinformatique, 19(9), 1070–1078.

Bar-Joseph, Z., Gifford, D.K., & Jaakkola, T.S. (2001). Ordre optimal rapide des feuilles pour le clustering hiérarchique. Bioinformatique, 17(Suppl. 1), S22–S29.

Breinholt, G., & amp Schierz, C. (1998). Algorithme 781 : Génération de la courbe de remplissage d'espace de Hilbert par récursivité. Transactions ACM sur un logiciel mathématique, 24(2), 184–189.

Duda, R.O., Hart, P.E., & Stork, D.G. (2000). Classification des motifs. New York : Wiley.

Ertoz, L., Steinbach, M., & Kumar, V. (2003). Trouver des clusters de différentes tailles, formes et densités dans des données bruyantes et de grande dimension. La troisième conférence internationale du SIAM sur l'exploration de données (SDM '03). San Francisco, Californie, États-Unis.

Ester, M., Kriegel, H.P., & Sander, J. (1997). L'exploration de données spatiales : une approche de base de données. Avancées dans les bases de données spatiales. Berlin 33, Springer Berlin Heidelberg New York. 1262, 47–66.

Ester, M., Kriegel, H.-P., Sander, J., & Xu, X. (1996). Un algorithme basé sur la densité pour découvrir des clusters dans de grandes bases de données spatiales avec du bruit. La deuxième conférence internationale sur la découverte des connaissances et l'exploration de données (pp. 226-231). Portland, Oregon, États-Unis : AAAI.

Fredrikson, A., North, C., Plaisant, C., & Shneiderman, B. (1999). Agrégations temporelles, géographiques et catégorielles vues à travers des affichages coordonnés : Une étude de cas avec des données d'incidents routiers. Workshop on New Paradigms in Information Visualization and Manipulation (en collaboration avec ACM CIKM'99), Kansas City, Missouri, 6 novembre, ACM New York, pp. 26-34.

Friendly, M., & Kwan, E. (2003). Ordre des effets pour les affichages de données. Statistiques computationnelles et analyse des données, 43(4), 509–539.

Gahegan, M. (2000). Le cas des techniques inductives et visuelles dans l'analyse des données spatiales. Journal des systèmes géographiques, 2(1), 77–83.

Goodchild, M.F., & Grandfield, A.W. (1983). Optimisation du stockage raster : examen de quatre alternatives. Actes, Auto-Carto, 6, 400–407.

Gordon, A.D. (1987). Une revue de la classification hiérarchique. Journal de la Royal Statistical Society. Série A (Général), 150(2), 119–137.

Gordon, A.D. (1996). Classement hiérarchique. Dans P. Arabie, L. J. Hubert, & G. D. Soete (Eds.), Regroupement et classification (pp. 65-122). River Edge, New Jersey, États-Unis : World Scientific.

Gotsman, C., et Lindenbaum, M. (1996). Sur les propriétés métriques des courbes discrètes de remplissage d'espace. Transactions IEEE sur le traitement d'images, 5(5), 794–797.

Guo, D., Gahegan, M., MacEachren, A.M., & Zhou, B. (2005). Analyse multivariée et géovisualisation avec une approche intégrée de découverte de connaissances géographiques. Cartographie et sciences de l'information géographique, 32(2), 113–132.

Guo, D., Peuquet, D., & Gahegan, M. (2003). ICEAGE : regroupement interactif et exploration de géodonnées volumineuses et de grande dimension. Géoinformatique, 7(3), 229–253.

Han, J., & Kamber, M. (2001). Exploration de données : Concepts et techniques. Morgan Kaufmann.

Han, J., Kamber, M., & Tung, A.K.H. (2001). Méthodes de clustering spatial dans l'exploration de données : une enquête. Dans H. J. Miller, & J. Han (Eds.), Exploration de données géographiques et découverte de connaissances (pp. 33-50). Londres : Taylor & Francis.

Han, J., Koperski, K., et Stefanovic, N. (1997). GeoMiner : Un prototype de système pour l'exploration de données spatiales. Conférence internationale ACM SIGMOD sur la gestion des données, Tucson, Arizona, États-Unis, pp. 553-556.

Hilbert, D. (1891). Uber die stetige Abbildung einer Linie auf Flachenstuck. Annales mathématiques, 38, 459–460.

Jain, A.K., & Dubes, R.C. (1988). Algorithmes de regroupement de données. Englewood Cliffs, NJ : Prentice Hall.

Jarvis, R.A., et Patrick, E.A. (1973). Regroupement utilisant une mesure de similarité basée sur des voisins proches partagés. Transactions IEEE sur les ordinateurs, 22(11), 1025–1034.

Keim, D.A., Panse, C., Sips, M., & North, S.C. (2004). Exploration de données visuelles dans de grands ensembles de points géospatiaux. Infographie IEEE et applications, 24(5), 36–44.

Koperski, K., & Han, J.W. (1995). Découverte des règles d'association spatiale dans les bases de données d'informations géographiques. Avancées dans les bases de données spatiales. Berlin 33, Springer Berlin Heidelberg New York. 951, 47–66.

Koperski, K., Han, J. et Stefanovic, N. (1998). Une méthode efficace en deux étapes pour la classification des données spatiales. 1998 International Symposium on Spatial Data Handling SDH'98, Vancouver, Colombie-Britannique, Canada, pp. 45-54.

Lamarque, C.H., & Robert, F. (1996). Analyse d'images à l'aide de courbes de remplissage d'espace et de bases d'ondelettes 1D. La reconnaissance de formes, 29(8), 1309–1322.

Lawder, J.K., & King, P.J.H. (2001). Interrogation de données multidimensionnelles indexées à l'aide de la courbe de remplissage d'espace de Hilbert. Enregistrement SIGMOD, 30(1), 19–24.

Mark, D.M. (1990). Propriétés basées sur les voisins d'un certain ordre de l'espace à deux dimensions. Analyse géographique, 22(2), 145–157.

Miller, H.J., & Han, J. (2001). Exploration de données géographiques et découverte de connaissances : un aperçu. Dans H. J. Miller, & J. Han (Eds.), Exploration de données géographiques et découverte de connaissances (p. 3-32). Londres : Taylor & Francis.

Mokbel, M.F., & Aref, W.G. (2003). Analyse de courbes de remplissage d'espace multidimensionnelles. Géoinformatique, 7(3), 179–209.

Moon, B., Jagadish, H. V., Faloutsos, C., & amp Saltz, J. H. (2001). Analyse des propriétés de clustering de la courbe de remplissage d'espace de Hilbert. Transaction IEEE sur la connaissance et l'ingénierie des données, 13(1), 1–18.

Morton, G. (1966). Une base de données géodésiques informatisée et une nouvelle technique de séquençage de fichiers. IBM Canada : rapport non publié.

Murray, A.T., & Shyy, T.K. (2000). Intégration des attributs et des caractéristiques spatiales dans l'affichage choroplèthe et l'exploration de données spatiales. Revue internationale des sciences de l'information géographique, 14(7), 649–667.

Ng, R., & Han, J. (1994). Méthodes de clustering efficaces et efficientes pour l'exploration de données spatiales. Proc. 20e conférence internationale sur les très grandes bases de données (pp. 144-155). Santiago, Chili.

Openshaw, S. (1994). Deux analyseurs de modèles exploratoires d'attributs spatio-temporels pertinents pour les SIG. Dans S. Fotheringham (éd.), Analyse spatiale et SIG. Problèmes techniques dans les systèmes d'information géographique (pp. 83-104). Taylor & amp Francis.

Reinelt, G. (1994). Le voyageur de commerce. Solutions informatiques pour les applications TSP. Berlin Heidelberg New York : Springer.

Sammon, J.W. (1969). Un mappage non linéaire pour l'analyse de la structure des données. Transactions IEEE sur les ordinateurs, C-18(5), 401–409.

Shekhar, S., Zhang, P., Huang, Y., & Vatsavai, R. (2004). Tendance dans l'exploration de données spatail. Dans H. Kargupta, A. Joshi, K. Sivakumar, & Y. Yesha (Eds.), Exploration de données : défis de la prochaine génération et orientations futures (pp. 357-381). AAAI/MIT Appuyez.

Skubalska-Rafajlowicz, E. (2001). Compression de données pour la reconnaissance de formes basée sur un mappage pseudo-inverse de courbe de remplissage d'espace. Analyse non linéaire—Méthodes théoriques et applications, 47(1), 315–326.

Steenberghen, T., Dufays, T., Thomas, I., & Flahaut, B. (2004). Localisation intra-urbaine et regroupement des accidents de la route à l'aide du SIG : un exemple belge. Revue internationale des sciences de l'information géographique, 18(2), 169–181.

Wang, W., Yang, J., & Muntz, R. (1997). STING : Une approche de grille d'information statistique pour l'exploration de données spatiales. 23e Int. conf sur de très grandes bases de données (pp. 186–195). Athènes, Grèce : Morgan Kaufmann.

Wirth, N. (1976). Algorithmes + Structures de données = Programmes. Prentice Hall.

Wong, P.C., Wong, K.K., Foote, H. et Thomas, J. (2003). Visualisation globale et alignements de génomes bactériens entiers. IEEE Transactions on Visualization and Computer Graphics, 9(3), 361–377.

Yamada, I., & Thill, J.-C. (2004). Comparison of planar and network k-functions in traffic accident analysis. Journal of Transport Geography, 12, 149–158.

Young, F. W. (1987). Multidimensional scaling: History, theory, and applications. Lawrence Erlbaum Associates.