ebook img

Modélisation et statistique spatiales (Mathématiques et Applications) PDF

321 Pages·2008·13.2 MB·French
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Modélisation et statistique spatiales (Mathématiques et Applications)

´ MATHEMATIQUES & APPLICATIONS Directeursdelacollection: G.AllaireetM.Bena¨ım 63 MATHE´MATIQUES&APPLICATIONS Comite´ deLecture2008–2011/EditorialBoard2008–2011 RE´MIABGRALL CLAUDELOBRY INRIAetMathe´matiques,Univ.Bordeaux1,FR INRA,INRIA,Sophia-Antipoliset [email protected] AnalyseSyste`mesetBiome´trie Montpellier,FR GRE´GOIREALLAIRE [email protected] CMAP,E´colePolytechnique,Palaiseau,FR [email protected] LAURENTMICLO Analyse,TopologieetProba.,Univ.Provence,FR MICHELBENA¨IM [email protected] Mathe´matiques,Univ.deNeuchaˆtel,CH VALE´RIEPERRIER [email protected] Mod..etCalcul,ENSIMAG,Grenoble,FR OLIVIERCATONI [email protected] Proba.etMod.Ale´atoires,Univ.Paris6,FR BERNARDPRUM [email protected] Statist.etGe´nome,CNRS,INRA,Univ.Evry,FR [email protected] THIERRYCOLIN Mathe´matiques,Univ.Bordeaux1,FR PHILIPPEROBERT [email protected] INRIA,DomainedeVoluceau,Rocquencourt,FR [email protected] MARIE-CHRISTINECOSTA CEDRIC,CNAMinformatique,Paris,FR PIERREROUCHON AutomatiqueetSyste`mes,E´coleMines,Paris,FR [email protected] [email protected] JEANDELLA-DORA ANNICKSARTENAER LMC,IMAG,Inst.TechnologyGrenoble,FR Mathe´matiques,Univ.Namur,BE [email protected] [email protected] JACQUESDEMONGEOT ERICSONNENDRU¨CKER TIMC,IMAG,Univ.GrenobleI,FR IRMA,Strasbourg,FR [email protected] [email protected] NICOLEELKAROUI SYLVAINSORIN CMAP,E´colePolytechnique,Palaiseau,FR Combinat.etOptimisation,Univ.Paris6,FR [email protected] [email protected] ALAINTROUVE´ JOSSELINGARNIER CMLA,ENSCachan,FR Proba.etMod.Ale´atoires,Univ.Paris6et7,FR [email protected] [email protected] JEANPHILIPPEVIAL STE´PHANEGAUBERT ManagementStudies,Univ.Geneva,CH INRIA,Saclay,ˆIles-de-France,Orsayet [email protected] CMAP,E´colePolytechnique,Palaiseau,FR CE´DRICVILLANI [email protected] UMPA,ENSLyon,FR CLAUDELEBRIS [email protected] CERMICS,ENPCetINRIA ENRIQUEZUAZUA MarnelaValle´e,FR Matema´ticas,Univ.Auto´nomaMadrid,ES [email protected] [email protected] Directeursdelacollection: G. ALLAIRE et M. BENA¨IM Instructionsauxauteurs: Lestextesouprojetspeuventeˆtresoumisdirectementa`l’undesmembresducomite´delectureavec copiea`G.ALLAIREOUM.BENA¨IM.Lesmanuscritsdevronteˆtreremisa`l’E´diteur sousformatLATEX2e(cf.ftp://ftp.springer.de/pub/tex/latex/svmonot1/). Carlo Gaetan Xavier Guyon Mode´lisation et statistique spatiales ABC CarloGaetan DipartimentodiStatistica Universita` Ca’FoscariVenezia SanGiobbe,Cannaregio873 30121Venice Italy [email protected] XavierGuyon CentrePierreMende`sFrance Universite´ Paris1etSAMOS 90ruedeTolbiac 75634ParisCedex13 France [email protected] LibraryCongressControlNumber:2008924866 MathematicsSubjectClassification(2000):13P10,68Q40,14Q20,65F15,08-0, 14-01,68-01 ISSN1154-483X ISBN-10 3-540-79225-2 SpringerBerlinHeidelbergNewYork ISBN-13 978-3-540-79225-3 SpringerBerlinHeidelbergNewYork Tousdroitsdetraduction,dereproductionetd’adaptationre´serve´spourtouspays. Laloidu11mars1957interditlescopiesoulesreproductionsdestine´esa`uneutilisationcollective. Touterepre´sentation,reproductioninte´graleoupartiellefaiteparquelqueproce´de´quecesoit,sansleconsentement del’auteuroudesesayantscause,estilliciteetconstitueunecontrefac¸onsanctionne´eparlesarticles425etsuivants duCodepe´nal. SpringerestmembreduSpringerScience+BusinessMedia (cid:176)cSpringer-VerlagBerlinHeidelberg2008 springer.com WMXDesignGmbH Imprime´surpapiernonacide3100/SPi-543210- Préface La statistique spatiale étudie des phénomènes dont l’observation est un pro- cessus aléatoire X={X , s ∈ S} indexé par un ensemble spatial S, X s s appartenant à un espace d’états E. La localisation d’un site d’observation s ∈ S est soit fixée et déterministe, soit aléatoire. Classiquement, S est un sous-ensemble bidimensionnel, S ⊆R2. Mais S peut aussi être unidimension- nel (chromatographie, essai agronomique en ligne) ou encore être un sous- ensemble de R3 (prospection minière, science du sol, imagerie 3-D). D’autres domaines, ainsi la statistique bayésienne ou la planification des expériences numériques, peuvent faire appel à des espaces S de dimension d≥3. Notons enfinquel’étude d’une dynamiquespatialeajouteladimensiontemporelleau spatial, indexant par exemple l’observation par (s,t) ∈ R2×R+ si la dyna- mique est bidimensionnelle. Les méthodes d’analysespatialeconnaissentun développementimportant du fait d’une forte demande de la part de nombreux domaines d’application tels que l’exploitation minière, les sciences de l’environnement et de la terre, l’écologie et la biologie, la géographie, l’économie spatiale, l’épidémiologie, l’agronomie et la foresterie, le traitement d’image, etc. Cette variété de la “demande” fait la richesse du sujet. A titre d’illustration, nous donnons ci- dessous quelques exemples des trois types de données spatiales qui seront étudiées dans ce livre. Les données géostatistiques S est un sous-espace continu de Rd, le champ {X , s ∈ S} étant observé en s n sites fixés {s1,...,sn} ⊂ S et l’espace d’état E étant réel. C’est le cas des donnéespluviométriquesdelaFig.1-a,ouencoredesdonnéesdeporositéd’un sol (cf. Fig. 1-b). Les sites d’observation peuvent être disposés régulièrement ounon.La géostatistique aborde,par exemple,les questionsde modélisation, d’identification et de séparation des variations à grande et à petite échelle, de prédiction (ou krigeage) en un site non-observé et de reconstruction de X partout sur S. VI Préface (a) (b) 0 5 2 0 0 2 d 50 Y Coor 1001 ligne 0 5 0 0 5 – 0 50 100 150 200 250 300 350 X Coord colonne Fig. 1. (a) Cumuls pluviométriques sur le réseau météorologique suisse le 8 mai 1986 (passage du nuage de Chernobyl, données sic du package geoR du logiciel R [178]); (b) Porosité d’un sol (données soil du package geoR). Pour (a) et (b), les dimensions des symboles sont proportionnelles à la valeur Xs. 0 1. plus petit que 9 9 − 12.2 0.8 12.2 − 19 plus grand que 19 6 0. 4 0. 2 0. 0 0. 0.0 0.2 0.4 0.6 0.8 1.0 (a) (b) Fig. 2. (a) Pourcentage d’individus du groupe sanguin A dans les 26 comtés de l’Irlande (données eire du package spdep); (b) Image de John Lennon (256×256 pixels sur193 niveaux degris, données lennon du package fields). Les données latticielles ou données sur un réseau S fixé S est un ensemble discret fixé non-aléatoire, généralement S ⊂ Rd, et X est observé sur S. Les sites s peuvent représenter des unités géographiques d’un réseau muni d’un graphe de voisinage G (cf. les 26 comtés de l’Irlande, Fig. 2-a),lavariableX intégrantunequantitéd’intérêtsurcetteunités.L’es- s paced’état E estréelounon.En analysed’image,S est unensemble régulier Préface VII de pixels (cf. Fig. 2-b). Parmi les objectifs étudiés, signalons la construction et l’analyse de modèles explicatifs, l’étude de la corrélation spatiale, la pré- diction, la restaurationd’image. Les données ponctuelles La Fig. 3-a donne la répartition des centres de cellules d’une coupe his- tologique observée au microscope, la Fig. 3-b celle d’aiguilles de pin dans une forêt ainsi que leurs longueurs respectives. Ici, c’est l’ensemble des sites x={x1,x2,···,xn},xi ∈S ⊂Rd oùontlieulesobservationsquiestaléatoire tout comme le nombre n=n(x) de sites observés : x est une réalisationd’un processus ponctuel (PP) spatial X observédans la fenêtre S. Le processus X est dit marqué si en outre on observe une marque en chaque x , par exemple i la longueur de l’aiguille observée en x . Une question centrale dans l’analyse i statistique des PP consiste à savoir si la répartition des points est plutôt ré- gulière (le cas pour la Fig. 3-a) ou bien si elle est due au hasard (processus ponctuel de Poisson) ou encore si elle présente des agrégats (le cas pour la Fig. 3-b). Comme pour les sériestemporelles, la statistique spatiale se différencie de la statistique classique par le fait que les observations sont dépendantes : on dit que X est un processus spatial ou encore que X est un champ aléatoire. Cettedépendancecréeuneredondancedel’informationdisponiblequipeut êtreutilementexploitéepourlaprévisionmaisquimodifielescomportements statistiques.L’absencedebiais,laconsistance,l’efficacitéoulaconvergenceen loi d’un estimateur devront être vérifiées dans ce contexte. Mais l’originalité de la statistique spatiale est de faire appel à des modélisations non-causales : encesens,lastatistiquespatialesedistingueradicalementdelastatistiquedes sériestemporellesquifaitappelàdesmodélisationscausalesutilisantdefaçon 0 0 2 8 0. 0 5 1 6 0. 0 y y 0 1 4 0. 0 2 5 0. 0 0 0. 0.2 0.4 0.6 0.8 1.0 0 50 100 150 200 x x (a) (b) Fig. 3. (a) Les 42 centres de cellules d’une coupe histologique observée au micro- scope(donnéescellsdupackagespatstat);(b)Positionsettaillesde584aiguilles depin dans un sous-bois (donnéeslongleaf du package spatstat). VIII Préface naturelleledéroulementdutempsetlanotiondepassé(modélisationdudébit d’une rivière, d’une action en bourse, de l’évolution d’un taux de chômage, etc.). Une modélisation spatiale markovienne s’exprimera, elle, en terme de voisinage spatial d’un site s “dans toutes les directions”. Ceci vaut aussi pour la dimension d = 1 : si par exemple, pour S ⊆ Z1, X est le rendement d’un s pied de maïs dans une culture en ligne, un modèle raisonnable comparera Xs à ses deux voisins, le pied de maïs “à gauche” Xs−1 et le pied de maïs “à droite” Xs+1, là où un modèle autorégressif causal de Xs en Xs−1 n’a pas d’interprétation naturelle; si la culture est en champ, on pourrait faire dépendre le rendement X au site (s,t) des rendements aux 4 plus proches s,t voisins, Xs−1,t, Xs+1,t, Xs,t−1 et Xs,t+1, voire des rendements aux 8 plus proches voisins. Les trois types de structures spatiales [cf. Cressie 48] structurent l’orga- nisation du livre. Les trois premiers chapitres sont consacrés à la modélisa- tion de chaque type de données (chapitre 1 : Modèles du second ordre et géostatistique, modèles intrinsèques, modèles AR; chapitre 2 : Champs de Gibbs-Markov sur un réseau; chapitre 3 : Processus ponctuels spatiaux). Vu l’importance des techniques de simulation en statistique spatiale, le chapitre 4 présenteles principales méthodes de simulationspatiale par chaînede Mar- kov(méthodesMCMC pourMonteCarlo Markov Chain).Enfin,lechapitre5 rassemblelesprincipalesméthodesstatistiquesutiliséespourlesdifférentsmo- dèles et types de données et en décrit les propriétés. Quatre appendices com- plètent le livre, présentant les principaux outils probabilistes et statistiques utiles à la statistique spatiale (simulation, théorèmes limites, estimation par minimum de contraste) ainsi que les logiciels utilisés dans les illustrations. De nombreux exemples, le plus souvent traités avec le logiciel R [178], illustrent les sujets abordés. Lorsqu’elles ne sont pas directement disponibles dans R ou dans un site spécifié, les données étudiées, leurs descriptions, les scripts des programmes utilisés ainsi que des liens utiles sont figurés dans le site www.dst.unive.it/∼gaetan/ModStatSpat attaché au livre. Chaque chapitre se termine par des exercices. Labibliographiepermettraaulecteurd’approfondircertainesnotionspré- sentéessuccintementainsiquecertainsrésultatstechniquesdontnousnedon- nons pas la démonstration. On y trouvera également des livres de référence complétant une présentation que nous avons voulu volontairement réduite et sans souci d’exhaustivité dans un domaine aux multiples facettes et en plein développement [69]. Nos remerciementsvontàtous les collèguesquinousontdonné le goûtde l’analysespatiale,pourleursidées,leursremarques,leurscontributionsetqui nous ont permis d’utiliser les données issues de leur travail. Notre reconnais- sancevaégalementauRDevelopment CoreTeam etauxauteursdespackages spatiaux du logiciel R [178] qui mettent librement à la disposition du public des outils logiciels performants et efficaces, compléments indispensables aux Préface IX méthodes et outils exposés ici.Nous remercionsles rapporteurspour leur lec- ture approfondie du premier projet; leurs remarques ont permis d’améliorer significativement la version actuelle. Merci à Bernard Ycart pour ses encou- ragementsà dépasser un projetinitial beaucoupplus modeste. Bien entendu, cela n’aurait pas pu se faire sans la patience et l’attention de nos familles et l’appui de nos équipes de recherche respectives, à savoir le Dipartimento di Statistica à l’Università Ca’ Foscari - Venezia et le SAMOS à Paris 1. Venise et Paris Carlo Gaetan mars 2008 Xavier Guyon Table des matières 1 Modèle spatial du second ordre et géostatistique........... 1 1.1 Rappels sur les processus stochastiques..................... 2 1.2 Processus stationnaire.................................... 3 1.2.1 Définitions, exemples .............................. 4 1.2.2 Représentation spectrale d’une covariance ............ 6 1.3 Processus intrinsèque et variogramme ...................... 8 1.3.1 Définition, exemples et propriétés.................... 8 1.3.2 Variogramme d’un processus stationnaire............. 10 1.3.3 Exemples de covariances et de variogrammes.......... 11 1.3.4 Anisotropies ...................................... 14 1.4 Propriétés géométriques : continuité, différentiabilité ......... 16 1.4.1 Continuité et différentiabilité : le cas stationnaire...... 17 1.5 Modélisation spatiale par convolution ...................... 19 1.5.1 Modèle continu ................................... 19 1.5.2 Convolution discrète ............................... 21 1.6 Modèles spatio-temporels................................. 22 1.7 Les modèles auto-régressifs spatiaux ....................... 25 1.7.1 Modèles MA, ARMA stationnaires.................. 26 1.7.2 Auto-régressionsimultanée stationnaire .............. 28 1.7.3 Auto-régressionconditionnelle stationnaire ........... 31 1.7.4 AR non-stationnaire sur un réseau fini S ............. 34 1.7.5 Modèles auto-régressifs avec covariables : SARX ...... 38 1.8 Le modèle de régressionspatiale........................... 39 1.9 Prédiction à covariance connue ............................ 43 1.9.1 Le krigeage simple................................. 43 1.9.2 Krigeage universel................................. 44 1.9.3 Expériences numériques ............................ 47 Exercices ................................................... 48

Description:
La statistique spatiale connaît un développement important du fait de son utilisation dans de nombreux domaines : sciences de la terre, environnement et climatologie, épidémiologie, économétrie, analyse d’image, etc… Ce livre présente les principaux modèles spatiaux utilisés ainsi que l
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.