Logo Logo
Help
Contact
Switch language to German
Validation of biomarkers predictive of tumor location in coloadenocarcinoma, an analysis of the TCGA COAD dataset
Validation of biomarkers predictive of tumor location in coloadenocarcinoma, an analysis of the TCGA COAD dataset
Tumor localization correlates with prognosis in coloadenocarcinoma, with aboral tumors having a better overall survival. This can be attributed to their better response to biologicals such as the anti-EGFR (epidermal growth factor receptor) cetuximab. Since the localization of a tumor is trivially determined in a clinical setting, it remains a valuable surrogate parameter for predicting patient outcomes, though it is not a mechanistic explanation. Some possible explanations have been offered: it could be that aboral colonic epithelial cells respond differently to mutagenic stimuli, or that the variation in gut flora from adoral to aboral plays a role in tumor development or behavior. So far, there has been no consensus. By eliminating tumor localization as a confounder, since some aboral tumors behave and develop more like adoral tumors and vice versa, better treatment decisions would be possible. While being slightly more complicated than simply defining the tumor location, testing for a handful of mutations in a tumor specimen is a routine procedure and the increased predictive power of such a model would be of great value for making difficult treatment decisions. It would also represent a starting point for better understanding possible underlying molecular mechanisms. It was hypothesized that –regardless of the causal relationships– this “sidedness” of coloadenocarcinomas could be reconstructed on a genomic and transcriptomic level. In order to test this hypothesis, data from the TCGA (Tumor Cancer Genome Atlas) database was used in a case-control study design to create expression profiles by training two distinct machine-learning algorithms to predict tumor location. The algorithms identified PRAC1, HOXB13, HOXC9, HOXC6, HOTAIR, PRAC2, and HOXC8 (all members of the homeobox gene family) as well as BST2, PLTP, FN1, ITLN1, and AREG as predictors of localization. These finding corroborate previous research using various other methods and fit well into the established framework of previously published literature which solidifies the veracity of the machine-learning models as implemented. As an additional benefit, the work-flow for creating the genomic and transcrip- tomic profiles is very flexible and can be used for further analysis of the TCGA dataset., Tumorlokalisation korreliert mit der Prognose Koloadenokarzinome, wobei ab- orale Tumore ein besseres Gesamtüberleben zeigen. Dies kann man auf deren bessere Antwort auf Biologika, wie das anti-EGFR (epidermal growth factor receptor) Medikament Cetuximab, zurückführen. Da die Lokalisation eines Tumors im klinischen Alltag vergleichsweise unkom- pliziert festgestellt werden kann ist sie nach wie vor ein wichtiger Surrogatpa- rameter für die Vorhersage von Therapieerfolg, obwohl sie keine mechanistische Erklärung ist. Einige mögliche Erklärungen wurden schon vorgeschlagen: es könnte sein, dass die aborale Kolonepithelzellen anders auf mutagene Stimuli reagieren, oder dass die Variation der Flora im Kolon von adoral nach aboral eine Rolle in der Tumorentwicklung und des Verhaltens spielt. Leider gibt es noch keinen Konsens. Die Hypothese wurde aufgestellt, dass –unabhängig von den kausalen Zusammenhängen– diese “Seitigkeit” der Koloadenokarzinomen auf genomischer und transkriptomischer Ebene rekonstruiert werden kann. Indem man die Tumorlokalisation als Confounder eliminiert könnten Therapieentschei- dungen besser getroffen werden, da sich manche aborale Tumoren wie adorale Tumore entwickeln und verhalten, und umgekehrt. Obwohl etwas komplizierter als nur Tumorlokalisation zu bestimmen, ist die Suche nach einer Handvoll Muta- tionen in einer Tumorprobe ein klinisches Routineverfahren und die verbesserte Vorhersagekraft eines solchen Modells wäre wertvoll für schwierige Behand- lungsentscheidungen. Es wäre auch ein Startpunkt für weitere Untersuchungen, um die zugrundeliegenden molekularen Mechanismen besser zu verstehen. Die Hypothese wurde aufgestellt, dass die “Seitigkeit” der Koloadenokarzinome auf genomischer und transcriptomischer Ebene rekonstruiert werden könnte. Um die Hypothese zu überprüfen wurden Daten aus der TCGA (Tumor Cancer Genome Atlas) Datenbank in einer Fall-Kontroll-Studie verwendet, um Expres- sionsprofile mittels Machine-Learning-Algorithmen zu erarbeiten, welche die Tumorlokalisation vorhersagen können. Die Algorithmen identifizierten sowohl PRAC1, HOXB13, HOXC9, HOXC6, HOTAIR, PRAC2, und HOXC8 (alles Mitglieder der Homeobox Genfamilie) als auch BST2, PLTP, FN1, ITLN1, und AREG als Prediktoren der Tumorlokalisation. Diese Ergebnisse bestäti- gen bereits publizierte Erkenntnisse und bekräftigen somit die Genauigkeit der Machine-Learning-Algorithmen wie sie hier implementiert wurden. Als zusätzlicher Nutzen ist der Workflow für die Erarbeitung der genomischen und transcriptomischen Profile sehr flexibel und kann für weitere Analysen der TCGA Daten verwendet werden.
Not available
Seckendorff, Leopold
2021
English
Universitätsbibliothek der Ludwig-Maximilians-Universität München
Seckendorff, Leopold (2021): Validation of biomarkers predictive of tumor location in coloadenocarcinoma, an analysis of the TCGA COAD dataset. Dissertation, LMU München: Faculty of Medicine
[thumbnail of Seckendorff_Leopold.pdf]
Preview
PDF
Seckendorff_Leopold.pdf

2MB

Abstract

Tumor localization correlates with prognosis in coloadenocarcinoma, with aboral tumors having a better overall survival. This can be attributed to their better response to biologicals such as the anti-EGFR (epidermal growth factor receptor) cetuximab. Since the localization of a tumor is trivially determined in a clinical setting, it remains a valuable surrogate parameter for predicting patient outcomes, though it is not a mechanistic explanation. Some possible explanations have been offered: it could be that aboral colonic epithelial cells respond differently to mutagenic stimuli, or that the variation in gut flora from adoral to aboral plays a role in tumor development or behavior. So far, there has been no consensus. By eliminating tumor localization as a confounder, since some aboral tumors behave and develop more like adoral tumors and vice versa, better treatment decisions would be possible. While being slightly more complicated than simply defining the tumor location, testing for a handful of mutations in a tumor specimen is a routine procedure and the increased predictive power of such a model would be of great value for making difficult treatment decisions. It would also represent a starting point for better understanding possible underlying molecular mechanisms. It was hypothesized that –regardless of the causal relationships– this “sidedness” of coloadenocarcinomas could be reconstructed on a genomic and transcriptomic level. In order to test this hypothesis, data from the TCGA (Tumor Cancer Genome Atlas) database was used in a case-control study design to create expression profiles by training two distinct machine-learning algorithms to predict tumor location. The algorithms identified PRAC1, HOXB13, HOXC9, HOXC6, HOTAIR, PRAC2, and HOXC8 (all members of the homeobox gene family) as well as BST2, PLTP, FN1, ITLN1, and AREG as predictors of localization. These finding corroborate previous research using various other methods and fit well into the established framework of previously published literature which solidifies the veracity of the machine-learning models as implemented. As an additional benefit, the work-flow for creating the genomic and transcrip- tomic profiles is very flexible and can be used for further analysis of the TCGA dataset.

Abstract

Tumorlokalisation korreliert mit der Prognose Koloadenokarzinome, wobei ab- orale Tumore ein besseres Gesamtüberleben zeigen. Dies kann man auf deren bessere Antwort auf Biologika, wie das anti-EGFR (epidermal growth factor receptor) Medikament Cetuximab, zurückführen. Da die Lokalisation eines Tumors im klinischen Alltag vergleichsweise unkom- pliziert festgestellt werden kann ist sie nach wie vor ein wichtiger Surrogatpa- rameter für die Vorhersage von Therapieerfolg, obwohl sie keine mechanistische Erklärung ist. Einige mögliche Erklärungen wurden schon vorgeschlagen: es könnte sein, dass die aborale Kolonepithelzellen anders auf mutagene Stimuli reagieren, oder dass die Variation der Flora im Kolon von adoral nach aboral eine Rolle in der Tumorentwicklung und des Verhaltens spielt. Leider gibt es noch keinen Konsens. Die Hypothese wurde aufgestellt, dass –unabhängig von den kausalen Zusammenhängen– diese “Seitigkeit” der Koloadenokarzinomen auf genomischer und transkriptomischer Ebene rekonstruiert werden kann. Indem man die Tumorlokalisation als Confounder eliminiert könnten Therapieentschei- dungen besser getroffen werden, da sich manche aborale Tumoren wie adorale Tumore entwickeln und verhalten, und umgekehrt. Obwohl etwas komplizierter als nur Tumorlokalisation zu bestimmen, ist die Suche nach einer Handvoll Muta- tionen in einer Tumorprobe ein klinisches Routineverfahren und die verbesserte Vorhersagekraft eines solchen Modells wäre wertvoll für schwierige Behand- lungsentscheidungen. Es wäre auch ein Startpunkt für weitere Untersuchungen, um die zugrundeliegenden molekularen Mechanismen besser zu verstehen. Die Hypothese wurde aufgestellt, dass die “Seitigkeit” der Koloadenokarzinome auf genomischer und transcriptomischer Ebene rekonstruiert werden könnte. Um die Hypothese zu überprüfen wurden Daten aus der TCGA (Tumor Cancer Genome Atlas) Datenbank in einer Fall-Kontroll-Studie verwendet, um Expres- sionsprofile mittels Machine-Learning-Algorithmen zu erarbeiten, welche die Tumorlokalisation vorhersagen können. Die Algorithmen identifizierten sowohl PRAC1, HOXB13, HOXC9, HOXC6, HOTAIR, PRAC2, und HOXC8 (alles Mitglieder der Homeobox Genfamilie) als auch BST2, PLTP, FN1, ITLN1, und AREG als Prediktoren der Tumorlokalisation. Diese Ergebnisse bestäti- gen bereits publizierte Erkenntnisse und bekräftigen somit die Genauigkeit der Machine-Learning-Algorithmen wie sie hier implementiert wurden. Als zusätzlicher Nutzen ist der Workflow für die Erarbeitung der genomischen und transcriptomischen Profile sehr flexibel und kann für weitere Analysen der TCGA Daten verwendet werden.