Logo Logo
Help
Contact
Switch language to German
Flexible Bayesian joint models for longitudinal biomarkers and time-to-event outcomes with applications to type 1 diabetes research
Flexible Bayesian joint models for longitudinal biomarkers and time-to-event outcomes with applications to type 1 diabetes research
The potentially complex association between a longitudinal biomarker and a time-to-event process, often called survival process, is of large interest in various biomedical domains. Joint models of longitudinal and survival data are a tool of growing popularity for this analysis and can potentially enable new insights into the disease progression of type 1 diabetes (T1D), the motivating application of the presented work. T1D, one of the most common chronic diseases in childhood, is marked by the lifelong need of insulin substitution. A preclinical period of the disease can be diagnosed by the emergence of the T1D-specific autoantibodies which can potentially also serve as longitudinal biomarkers to explain the high variability in the time to clinical T1D. The analysis of longitudinal biomarkers and survival processes is complicated by observing the longitudinal marker at discrete time points, subject to measurement error, and informatively censored at the occurrence of an event. Joint models allow an unbiased analysis of this data by estimating a longitudinal and a survival submodel within a joint likelihood function. Previously developed joint models, however, lack the flexibility to capture the highly nonlinear individual T1D-biomarker trajectories and a potentially time-varying association between the marker and the onset of clinical symptoms of T1D. In order to provide additional insights into the complex relationship between longitudinal biomarkers and survival processes a flexible Bayesian joint model framework is developed. By formulating the model using structured additive predictors, a variety of effects can be incorporated, such as smooth nonlinear, time-varying and random effects, thereby allowing flexibility beyond established joint model implementations. The adoption of a Bayesian framework enables a stable estimation of this complex model, especially regarding potentially high-dimensional random effect structures. The resulting flexibility is used to explore the association between highly heterogeneous autoantibody profiles and the progression to T1D in two different diabetes risk cohorts. This framework is further generalized by incorporating nonlinear association structures between the longitudinal and the survival process. The extension allows to assess the usually unchecked assumption of linearity between the marker and the log-hazard of a survival process as illustrated in the analysis of biomedical data on a rare fatal liver disease. To facilitate its application the flexible Bayesian joint model is implemented in the R package bamlss and an introduction to its usage is given. The newly developed additive joint model offers flexibility in modeling longitudinal biomarkers and complex associations structures beyond established joint model approaches, thereby allowing new insights into the time-varying association between T1D-specific autoantibodies and the onset of clinical symptoms., Die Analyse des komplexen Zusammenhangs zwischen längsschnittlich erfassten Biomarkern und der Zeit bis zum Eintreten eines (Krankheits-)Ereignisses ist für viele biomedizinische Anwendungen von Interesse. Joint Models zur Modellierung von Längsschnitt- und Überlebenszeitdaten finden in diesem Bereich zunehmend Verbreitung und können potentiell neue Erkenntnisse in der Erforschung des Typ 1 Diabetes (T1D) liefern, dem Ausgangspunkt der vorliegenden Methodenentwicklung. T1D, eine der häufigsten chronischen Erkrankungen im Kindesalter, geht mit einer lebenslangen Abhängigkeit von künstlichem Insulin einher. Schon vor dem Einsetzen klinischer Symptome ist eine Diagnose der Krankheit durch T1D-spezifische Autoantikörper möglich. Die hohe Variabilität in der Dauer dieser präklinischen Phase kann potentiell durch Autoantikörper als längsschnittliche Biomarker erklärt werden. Die Analyse längsschnittlicher Biomarker ist statistisch herausfordernd, da die Biomarker nur an diskreten Messzeitpunkten bis zum Eintreten des Ereignisses mit einem gewissen Messfehler beobachtet werden. Um diese fehlerbehafteten, informativ zensierten Daten ohne Verzerrung mit der Überlebenszeit in Verbindung zu setzen, schätzen Joint Models ein längsschnittliches Modell und ein Überlebenszeitmodell in einer gemeinsamen Likelihoodfunktion. In bestehenden Joint Models fehlt allerdings die für den Anwendungsfall T1D nötige Flexiblität in der Modellierung von personenspezifischen nichtlinearen Biomarkertrajektorien sowie in der zeitabhängigen Modellierung der Assoziation zwischen Marker und Überlebenszeit. Um komplexe Zusammenhänge zwischen longitudinalen Biomarkern und dem Eintreten eines Ereignisses abbilden zu können, wird ein flexibles Bayesianisches Joint Model entwickelt. Das Joint Model ist hierbei als struktiertes additives Regressionsmodell formuliert, wodurch eine Vielzahl von verschiedenen Effekten wie glatte nichtlineare, zeitvariierende oder zufällige Effekte integriert werden können. Durch einen Bayesianischen Ansatz wird eine stabile Schätzung dieses komplexen Modells, insbesondere hochdimensionaler zufälliger Effekte, erreicht. Diese Flexibilität geht über bisherige Entwicklungen hinaus und ermöglicht einen detaillierten Einblick in den Zusammenhang zwischen personenspezifischen nichtlinearen Antikörperverläufen und dem Einsetzen klinischer Symptome am Beispiel zweier T1D-Risikokohorten. Darüber hinaus wird dieses Rahmenmodell weiter generalisiert um auch nichtlineare Zusammenhänge zwischen Biomarkern und der Überlebenszeit abbilden zu können. Diese Erweiterung erlaubt die Überprüfung einer üblicherweise nicht getesteten Linearitätsannahme zwischen Biomarker und logarithmiertem Hazard, wie in der Analyse eines weiteren biomedizinischen Datensatzes über eine seltene Lebererkrankung veranschaulicht. Um Anwendern die Nutzung dieses flexiblen Modells zu ermöglichen wird die Implementation im R Paket bamlss in der vorliegenden Arbeit vorgestellt. Das neu entwickelte Bayesianische additive Joint Model erlaubt eine flexible Modellierung längsschnittlicher Biomarker und deren potentiell komplexen Zusammenhang mit der Überlebenszeit, weit über bisherige Joint Model Ansätze hinaus. Damit können neue Einblicke in den zeitabhängigen Zusammenhang zwischen T1D-spezifischen Biomarkern und dem Einsetzen klinischer Symptome gewonnen werden.
joint models, time-to-event data, longitudinal data, biomarkers, P-splines
Köhler, Meike
2017
English
Universitätsbibliothek der Ludwig-Maximilians-Universität München
Köhler, Meike (2017): Flexible Bayesian joint models for longitudinal biomarkers and time-to-event outcomes with applications to type 1 diabetes research. Dissertation, LMU München: Faculty of Mathematics, Computer Science and Statistics
[img]
Preview
PDF
Koehler_Meike.pdf

4MB

Abstract

The potentially complex association between a longitudinal biomarker and a time-to-event process, often called survival process, is of large interest in various biomedical domains. Joint models of longitudinal and survival data are a tool of growing popularity for this analysis and can potentially enable new insights into the disease progression of type 1 diabetes (T1D), the motivating application of the presented work. T1D, one of the most common chronic diseases in childhood, is marked by the lifelong need of insulin substitution. A preclinical period of the disease can be diagnosed by the emergence of the T1D-specific autoantibodies which can potentially also serve as longitudinal biomarkers to explain the high variability in the time to clinical T1D. The analysis of longitudinal biomarkers and survival processes is complicated by observing the longitudinal marker at discrete time points, subject to measurement error, and informatively censored at the occurrence of an event. Joint models allow an unbiased analysis of this data by estimating a longitudinal and a survival submodel within a joint likelihood function. Previously developed joint models, however, lack the flexibility to capture the highly nonlinear individual T1D-biomarker trajectories and a potentially time-varying association between the marker and the onset of clinical symptoms of T1D. In order to provide additional insights into the complex relationship between longitudinal biomarkers and survival processes a flexible Bayesian joint model framework is developed. By formulating the model using structured additive predictors, a variety of effects can be incorporated, such as smooth nonlinear, time-varying and random effects, thereby allowing flexibility beyond established joint model implementations. The adoption of a Bayesian framework enables a stable estimation of this complex model, especially regarding potentially high-dimensional random effect structures. The resulting flexibility is used to explore the association between highly heterogeneous autoantibody profiles and the progression to T1D in two different diabetes risk cohorts. This framework is further generalized by incorporating nonlinear association structures between the longitudinal and the survival process. The extension allows to assess the usually unchecked assumption of linearity between the marker and the log-hazard of a survival process as illustrated in the analysis of biomedical data on a rare fatal liver disease. To facilitate its application the flexible Bayesian joint model is implemented in the R package bamlss and an introduction to its usage is given. The newly developed additive joint model offers flexibility in modeling longitudinal biomarkers and complex associations structures beyond established joint model approaches, thereby allowing new insights into the time-varying association between T1D-specific autoantibodies and the onset of clinical symptoms.

Abstract

Die Analyse des komplexen Zusammenhangs zwischen längsschnittlich erfassten Biomarkern und der Zeit bis zum Eintreten eines (Krankheits-)Ereignisses ist für viele biomedizinische Anwendungen von Interesse. Joint Models zur Modellierung von Längsschnitt- und Überlebenszeitdaten finden in diesem Bereich zunehmend Verbreitung und können potentiell neue Erkenntnisse in der Erforschung des Typ 1 Diabetes (T1D) liefern, dem Ausgangspunkt der vorliegenden Methodenentwicklung. T1D, eine der häufigsten chronischen Erkrankungen im Kindesalter, geht mit einer lebenslangen Abhängigkeit von künstlichem Insulin einher. Schon vor dem Einsetzen klinischer Symptome ist eine Diagnose der Krankheit durch T1D-spezifische Autoantikörper möglich. Die hohe Variabilität in der Dauer dieser präklinischen Phase kann potentiell durch Autoantikörper als längsschnittliche Biomarker erklärt werden. Die Analyse längsschnittlicher Biomarker ist statistisch herausfordernd, da die Biomarker nur an diskreten Messzeitpunkten bis zum Eintreten des Ereignisses mit einem gewissen Messfehler beobachtet werden. Um diese fehlerbehafteten, informativ zensierten Daten ohne Verzerrung mit der Überlebenszeit in Verbindung zu setzen, schätzen Joint Models ein längsschnittliches Modell und ein Überlebenszeitmodell in einer gemeinsamen Likelihoodfunktion. In bestehenden Joint Models fehlt allerdings die für den Anwendungsfall T1D nötige Flexiblität in der Modellierung von personenspezifischen nichtlinearen Biomarkertrajektorien sowie in der zeitabhängigen Modellierung der Assoziation zwischen Marker und Überlebenszeit. Um komplexe Zusammenhänge zwischen longitudinalen Biomarkern und dem Eintreten eines Ereignisses abbilden zu können, wird ein flexibles Bayesianisches Joint Model entwickelt. Das Joint Model ist hierbei als struktiertes additives Regressionsmodell formuliert, wodurch eine Vielzahl von verschiedenen Effekten wie glatte nichtlineare, zeitvariierende oder zufällige Effekte integriert werden können. Durch einen Bayesianischen Ansatz wird eine stabile Schätzung dieses komplexen Modells, insbesondere hochdimensionaler zufälliger Effekte, erreicht. Diese Flexibilität geht über bisherige Entwicklungen hinaus und ermöglicht einen detaillierten Einblick in den Zusammenhang zwischen personenspezifischen nichtlinearen Antikörperverläufen und dem Einsetzen klinischer Symptome am Beispiel zweier T1D-Risikokohorten. Darüber hinaus wird dieses Rahmenmodell weiter generalisiert um auch nichtlineare Zusammenhänge zwischen Biomarkern und der Überlebenszeit abbilden zu können. Diese Erweiterung erlaubt die Überprüfung einer üblicherweise nicht getesteten Linearitätsannahme zwischen Biomarker und logarithmiertem Hazard, wie in der Analyse eines weiteren biomedizinischen Datensatzes über eine seltene Lebererkrankung veranschaulicht. Um Anwendern die Nutzung dieses flexiblen Modells zu ermöglichen wird die Implementation im R Paket bamlss in der vorliegenden Arbeit vorgestellt. Das neu entwickelte Bayesianische additive Joint Model erlaubt eine flexible Modellierung längsschnittlicher Biomarker und deren potentiell komplexen Zusammenhang mit der Überlebenszeit, weit über bisherige Joint Model Ansätze hinaus. Damit können neue Einblicke in den zeitabhängigen Zusammenhang zwischen T1D-spezifischen Biomarkern und dem Einsetzen klinischer Symptome gewonnen werden.