Ali, Maqsood (2020): Regional adaptive smoothing in disease mapping models. Dissertation, LMU München: Fakultät für Mathematik, Informatik und Statistik |
Vorschau |
PDF
Ali_Maqsood.pdf 45MB |
Abstract
Disease mapping focuses on estimating spatial patterns and evolution of disease risk based on measures of disease effect, incidence ratio, for instance. These measures on maps provide a good visual representation of disease risk, featuring spatial heterogeneities and highlighting units or clusters of high risk. There are a number of factors due to which some units may have higher numbers of disease incidences compared to others, for example, differences in environmental exposures, deprived communities, different administrative structures, lack of awareness about the disease(s), to name a few. To clearly differentiate areas of low or high risk, we must apply some type of smoothing over regions which are presumably similar to each other. The process of such local smoothing increases our ability to clearly discern clusters in the spatial variation. In this thesis, we propose a novel approach to smooth local spatial units based on their larger regional location. The degree of smoothing is constant within each region, but differs between regions. For the purpose of illustration, we consider the spatial structure of German counties as local spatial units with Federal states of Germany as larger regions to apply state-wise adaptive smoothing. Chapters 4 and 5 propose univariate and multivariate spatial models of regional smoothing. We define that the incidences in each county follow a binomial density with probability of risk linked to spatial correlation matrix in a hierarchical way. The correlation matrix is partitioned into sub-matrices, corresponding to regions (Federal states), and smoothing parameters are introduced into the sub-matrices to locally smooth regions. Appropriate prior assumptions are stated for unknown parameters and samples from full conditional posterior densities are generated using MCMC. In Chapters 5, we adopt coregionalization framework of MacNab (2016) to build multivariate GMRFs as a linear combination of latent independent univariate GMRFs. The smoothing parameters are first applied to each sample separately, in a similar fashion to univariate regionalized spatial model, and then combined in the form of joint correlation matrix. We use the approach of Anderson et al. (2014) to identify spatial units exhibiting alike disease risks. The approach first elicits configuration of clusters based on past data of disease. In the second step, it fits a Poisson log-linear model using current data to select the best configuration based on deviance information criterion. The proposed method of smoothing is illustrated using real data sets of Oral cancer (univariate) and Colon, Lung and Pancreatic cancers (multivariate) on spatial structure of German counties. We are able to identify 13 clusters of Oral cancer, 9 of Colon, 6 of Lung and 8 of Pancreatic cancer. The identified clusters are further ranked based on incidence ratios. The analysis of real data and its comparison with simple GMRF (BYM model of Besag et al. (1991)) reveals that the novel method of incorporating smoothing parameters in spatial correlation matrix performs equally well, if not better.
Abstract
Krankheitskartierung (Disease Mapping) befasst sich mit der Schätzung räumlicher Muster und Entwicklungen des Krankheitsrisikos auf der Grundlage von Messungen des Krankheitsinzidenz. Die Kartierung von Messungen auf Landkarten bietet eine gute visuelle Darstellung des Krankheitsrisikos, wobei räumliche Heterogenitäten deutlich werden und Einheiten und Cluster mit hohem Risiko sichtbar gemacht werden können. Aufgrund einer Reihe von Faktoren können manche Einheiten im Vergleich zu anderen eine höhere Anzahl von Krankheitsfällen aufweisen, z.B. wegen unterschiedlicher Umweltbelastungen, sozial benachteiligter Bevölkerungsgruppen, unterschiedlicher Verwaltungsstrukturen, fehlendem Bewusstsein für die Krankheit(en), um nur einige Faktoren zu nennen. Um Bereiche mit niedrigem oder hohem Risiko klar zu unterscheiden, muss eine Art Glättung über Regionen vorgenommen werden, die einander ähnlich sein dürften. Der Prozess einer solchen lokalen Glättung verbessert den Prozess der klaren Unterscheidung von Clustern hinsichtlich der räumlichen Variation. In dieser Arbeit schlagen wir einen neuartigen Ansatz zur Glättung lokaler räumlicher Einheiten auf der Grundlage ihrer großräumigen regionalen Lage vor. Der Grad der Glättung ist innerhalb jeder Region konstant, unterscheidet sich jedoch von Region zu Region. Zur Veranschaulichung betrachten wir die räumliche Struktur von deutschen Landkreisen als lokale Raumeinheiten mit Bundesländern als größere Regionen, um die länderspezifische adaptive Glättung anzuwenden. In den Kapiteln 4 und 5 schlagen wir univariate und multivariate räumliche Modelle zur regionalen Glättung vor. Wir legen fest, dass die Inzidenzen in jedem Kreis einer binomialen Dichte mit Risikowahrscheinlichkeit folgen, die mit einer räumlichen Korrelationsmatrix in hierarchischer Weise verknüpft ist. Die Korrelationsmatrix wird in Untermatrizen unterteilt, die Regionen (Bundesländern) entsprechen, und Glättungsparameter werden in die Untermatrizen eingeführt, um die Regionen lokal zu glätten. Für unbekannte Parameter werden geeignete Vorannahmen aufgestellt und mit Hilfe von MCMC werden Stichproben aus den Posterioridichten generiert. In Kapitel 5 übernehmen wir den Koregionalisierungsrahmen von MacNab (2016), um multivariate GMRFs als Linearkombination von latenten unabhängigen univariaten GMRFs zu erstellen. Die Glättungsparameter werden zunächst auf jede Stichprobe einzeln angewendet, ähnlich wie bei einem univariaten regionalisierten Raummodell, und dann in Form einer gemeinsamen Korrelationsmatrix kombiniert. Wir verwenden den Ansatz von Anderson et al. (2014), um räumliche Einheiten zu identifizieren, die ähnliche Krankheitsrisiken aufweisen. Der Ansatz eruiert zunächst die Konfiguration von Clustern auf der Grundlage früherer Krankheitsdaten. Im zweiten Schritt passt er ein log-lineares Poisson-Modell unter Verwendung aktueller Daten an, um die beste Konfiguration auf der Grundlage des Abweichungsinformationskriteriums auszuwählen. Die vorgeschlagene Methode der Glättung wird anhand realer Datensätze von Mundkrebs (univariat) und Dickdarm-, Lungen- und Bauchspeicheldrüsenkrebs (multivariat) auf der räumlichen Struktur deutscher Landkreise veranschaulicht. Wir sind in der Lage, 13 Cluster für Mundkrebs, 9 für Dickdarmkrebs, 6 für Lungenkrebs und 8 für Bauchspeicheldrüsenkrebs zu identifizieren. Die identifizierten Cluster werden anhand von Inzidenzverhältnissen weiter gereiht. Die Analyse der realen Daten und ihr Vergleich mit dem einfachen GMRF (BYM-Modell von Besag et al. (1991)) zeigt, dass die neuartige Methode der Einbeziehung von Glättungsparametern in der räumlichen Korrelationsmatrix gleich gut, wenn nicht sogar besser abschneidet.
Dokumententyp: | Dissertationen (Dissertation, LMU München) |
---|---|
Fakultäten: | Fakultät für Mathematik, Informatik und Statistik |
Sprache der Hochschulschrift: | Englisch |
Datum der mündlichen Prüfung: | 4. September 2020 |
1. Berichterstatter:in: | Schmid, Volker |
MD5 Prüfsumme der PDF-Datei: | e31ef291ab072844d010ba096618e0bd |
Signatur der gedruckten Ausgabe: | 0001/UMC 28168 |
ID Code: | 26807 |
Eingestellt am: | 23. Sep. 2021 10:31 |
Letzte Änderungen: | 23. Sep. 2021 10:31 |