Logo Logo
Help
Contact
Switch language to German
Anwendung KDD-basierter Methoden zur Interpretation multi-dimensionaler Isotopen-Fingerabdrücke
Anwendung KDD-basierter Methoden zur Interpretation multi-dimensionaler Isotopen-Fingerabdrücke
Eine Daten-getriebene Auswertung von Isotopendaten unter Verwendung von KDD-basierten Methoden (KDD = „Knowledge Discovery in Databases“) findet bislang keine oder nur sehr wenig Anwendung in der Archäobiologie. Jedoch ermöglichen diese Methoden neue Einblicke in die Isotopendaten von Tieren, wie auch Menschen, die mit den etablierten Methoden bisher so nicht möglich waren. Die multivariate Untersuchung der Daten resultiert im Vergleich zu uni- oder bivariaten Analysen in vielerlei Hinsicht in einem Informationsgewinn. Der ungewöhnlich große Isotopen-Datensatz aus Haithabu und Schleswig an der Ostseeküste, der aufgrund der Brackwasserumgebung ein komplexes Ökosystem abbildet, erlaubt eine umfassende Anwendung und Etablierung verschiedener Methoden. Clustermodelle werden Hauptkomponentenanalyse (PCA) und „Support Vector Machine“ (SVM) gegenüber gestellt und auf ihre Aussagekraft für die Auswertung von Isotopendaten hin untersucht. Es zeigt sich, dass insbesondere die Clusteranalyse mittels des sogenannten „Gaussian Mixture Model“ (GMM) für Isotopendaten geeignet ist. Die Clusteranalyse ermöglicht die Detektion verschiedener Gruppen von Individuen, wie z. B. nicht lokale Individuen, sowie Individuen, die vom sogenannten „sea spray“-Effekt beeinflusst wurden. Dieser durch Gischt verursachte Effekt kann nicht nur in Schwefelisotopen, für die der Effekt bekannt aber nicht quantifiziert war, sondern auch in Kohlenstoff- und Sauerstoffisotopen des Knochenkarbonats bzw. -phosphats detektiert werden. Weiter ist es möglich, das Ausmaß des Effektes auf die unterschiedlichen Isotopensysteme approximativ zu bestimmen. Der Effekt, der als prozentualer Eintrag betrachtet wird, beträgt je nach Isotopensystem zwischen ca. 14 % und 63 %. Außerdem lässt sich auch ein limnischer Einfluss auf Stickstoffisotope feststellen (ca. 21 %), der ebenfalls berücksichtigt werden muss. Damit ergeben sich z. T. deutliche Verschiebungen der Isotopenwerte in Tieren und Menschen, die entsprechend korrigiert wurden, um so die näherungsweisen, originalen Werte zu erhalten. Die nicht-korrigierten Isotopendaten können zu einer fehlerhaften Interpretation der Daten führen. Die Approximation und Korrektur des „sea spray“-Effektes, sowie des limnischen Einflusses kann mit Hilfe von Clusteranalysen bekräftigt werden. Da archäologisches Material häufig nur in begrenzten Mengen zur Verfügung steht oder die Bedeutsamkeit des Fundguts invasive Verfahren (wie Isotopenanalysen) nur in sehr eingeschränktem Maße erlaubt, ist es wichtig, den Informationsgehalt einzelner Isotopensysteme abzuwägen. Ein Isotopensystem mit höherem Informationsgehalt ist einem anderen System mit nur geringem Informationsgehalt vorzuziehen. Ein „Feature Ranking“-Verfahren ermöglicht es, die einzelnen Isotopensysteme innerhalb unterschiedlicher (Teil-)Datensätze zu vergleichen und so die Isotopensysteme oder auch Kombinationen von Isotopensystemen mit höherem Informationsgehalt zu identifizieren. Auffällig ist hierbei, dass sich je nach Teildatensatz unterschiedliche Einstufungen für die Isotopensysteme ergeben, da bspw. für die Untersuchung von Fischdaten andere Isotope von Bedeutung sind als bei der Untersuchung von terrestrischen, herbivoren Säugern oder auch Menschen. Weiter kann mit Hilfe des Datensatzes aus Haithabu und Schleswig gezeigt werden, dass es nicht möglich ist, die Sauerstoffisotopenwerte des Phosphats aus den entsprechenden Werten des Karbonats zu berechnen. Die Anwendung einer Differenz von 9 ‰ zwischen Karbonat und Phosphat, wie sie häufig verwendet wird, ist im höchsten Maße abhängig von den untersuchten Spezies, deren Ernährungsformen und (damit zusammenhängend) ihrer Physiologie, sowie dem Habitat und dem Klima am untersuchten Fundort. Da zudem δ18OKarbonat und δ18OPhosphat unterschiedlich stark von verschiedenen Faktoren (darunter auch dem „sea spray“-Effekt) beeinflusst werden, ist die Anwendung eines allgemein gültigen Wertes für die Differenz zwischen den beiden Isotopensystemen, zumindest für den vorliegenden Datensatz, nicht ratsam und kann zu fehlerhaften Werten führen. Die auf Basis des Datensatzes aus Haithabu und Schleswig untersuchten Methoden werden in Teilen auch auf andere Datensätze (Vergleichsdatensätze) angewendet, um die allgemeine Anwendbarkeit der Verfahren zu überprüfen. Die relativ begrenzte Zahl an hierfür geeigneten Datensätzen - in erster Linie hinsichtlich der Stichprobengröße - erlaubt dennoch die Demonstration, dass sowohl die Approximation des „sea spray“-Effektes, als auch die Clusteranalyse mittels „Gaussian Mixture Model“ (GMM) auch auf andere Datensätze anwendbar ist. Die GMM-Clusteranalyse stellt hierbei ein nützliches Mittel zur Unterstützung von morphologischen Kontrollgruppen dar, die dadurch ggf. auch ersetzt werden könnten, wenn die morphologischen Daten aufgrund eines schlechten Erhaltungszustandes unvollständig sind.
Not available
Göhring, Andrea
2019
German
Universitätsbibliothek der Ludwig-Maximilians-Universität München
Göhring, Andrea (2019): Anwendung KDD-basierter Methoden zur Interpretation multi-dimensionaler Isotopen-Fingerabdrücke. Dissertation, LMU München: Faculty of Biology
[img]
Preview
PDF
Goehring_Andrea.pdf

54MB
[img] ZIP
Goehring_container.zip

83MB

Abstract

Eine Daten-getriebene Auswertung von Isotopendaten unter Verwendung von KDD-basierten Methoden (KDD = „Knowledge Discovery in Databases“) findet bislang keine oder nur sehr wenig Anwendung in der Archäobiologie. Jedoch ermöglichen diese Methoden neue Einblicke in die Isotopendaten von Tieren, wie auch Menschen, die mit den etablierten Methoden bisher so nicht möglich waren. Die multivariate Untersuchung der Daten resultiert im Vergleich zu uni- oder bivariaten Analysen in vielerlei Hinsicht in einem Informationsgewinn. Der ungewöhnlich große Isotopen-Datensatz aus Haithabu und Schleswig an der Ostseeküste, der aufgrund der Brackwasserumgebung ein komplexes Ökosystem abbildet, erlaubt eine umfassende Anwendung und Etablierung verschiedener Methoden. Clustermodelle werden Hauptkomponentenanalyse (PCA) und „Support Vector Machine“ (SVM) gegenüber gestellt und auf ihre Aussagekraft für die Auswertung von Isotopendaten hin untersucht. Es zeigt sich, dass insbesondere die Clusteranalyse mittels des sogenannten „Gaussian Mixture Model“ (GMM) für Isotopendaten geeignet ist. Die Clusteranalyse ermöglicht die Detektion verschiedener Gruppen von Individuen, wie z. B. nicht lokale Individuen, sowie Individuen, die vom sogenannten „sea spray“-Effekt beeinflusst wurden. Dieser durch Gischt verursachte Effekt kann nicht nur in Schwefelisotopen, für die der Effekt bekannt aber nicht quantifiziert war, sondern auch in Kohlenstoff- und Sauerstoffisotopen des Knochenkarbonats bzw. -phosphats detektiert werden. Weiter ist es möglich, das Ausmaß des Effektes auf die unterschiedlichen Isotopensysteme approximativ zu bestimmen. Der Effekt, der als prozentualer Eintrag betrachtet wird, beträgt je nach Isotopensystem zwischen ca. 14 % und 63 %. Außerdem lässt sich auch ein limnischer Einfluss auf Stickstoffisotope feststellen (ca. 21 %), der ebenfalls berücksichtigt werden muss. Damit ergeben sich z. T. deutliche Verschiebungen der Isotopenwerte in Tieren und Menschen, die entsprechend korrigiert wurden, um so die näherungsweisen, originalen Werte zu erhalten. Die nicht-korrigierten Isotopendaten können zu einer fehlerhaften Interpretation der Daten führen. Die Approximation und Korrektur des „sea spray“-Effektes, sowie des limnischen Einflusses kann mit Hilfe von Clusteranalysen bekräftigt werden. Da archäologisches Material häufig nur in begrenzten Mengen zur Verfügung steht oder die Bedeutsamkeit des Fundguts invasive Verfahren (wie Isotopenanalysen) nur in sehr eingeschränktem Maße erlaubt, ist es wichtig, den Informationsgehalt einzelner Isotopensysteme abzuwägen. Ein Isotopensystem mit höherem Informationsgehalt ist einem anderen System mit nur geringem Informationsgehalt vorzuziehen. Ein „Feature Ranking“-Verfahren ermöglicht es, die einzelnen Isotopensysteme innerhalb unterschiedlicher (Teil-)Datensätze zu vergleichen und so die Isotopensysteme oder auch Kombinationen von Isotopensystemen mit höherem Informationsgehalt zu identifizieren. Auffällig ist hierbei, dass sich je nach Teildatensatz unterschiedliche Einstufungen für die Isotopensysteme ergeben, da bspw. für die Untersuchung von Fischdaten andere Isotope von Bedeutung sind als bei der Untersuchung von terrestrischen, herbivoren Säugern oder auch Menschen. Weiter kann mit Hilfe des Datensatzes aus Haithabu und Schleswig gezeigt werden, dass es nicht möglich ist, die Sauerstoffisotopenwerte des Phosphats aus den entsprechenden Werten des Karbonats zu berechnen. Die Anwendung einer Differenz von 9 ‰ zwischen Karbonat und Phosphat, wie sie häufig verwendet wird, ist im höchsten Maße abhängig von den untersuchten Spezies, deren Ernährungsformen und (damit zusammenhängend) ihrer Physiologie, sowie dem Habitat und dem Klima am untersuchten Fundort. Da zudem δ18OKarbonat und δ18OPhosphat unterschiedlich stark von verschiedenen Faktoren (darunter auch dem „sea spray“-Effekt) beeinflusst werden, ist die Anwendung eines allgemein gültigen Wertes für die Differenz zwischen den beiden Isotopensystemen, zumindest für den vorliegenden Datensatz, nicht ratsam und kann zu fehlerhaften Werten führen. Die auf Basis des Datensatzes aus Haithabu und Schleswig untersuchten Methoden werden in Teilen auch auf andere Datensätze (Vergleichsdatensätze) angewendet, um die allgemeine Anwendbarkeit der Verfahren zu überprüfen. Die relativ begrenzte Zahl an hierfür geeigneten Datensätzen - in erster Linie hinsichtlich der Stichprobengröße - erlaubt dennoch die Demonstration, dass sowohl die Approximation des „sea spray“-Effektes, als auch die Clusteranalyse mittels „Gaussian Mixture Model“ (GMM) auch auf andere Datensätze anwendbar ist. Die GMM-Clusteranalyse stellt hierbei ein nützliches Mittel zur Unterstützung von morphologischen Kontrollgruppen dar, die dadurch ggf. auch ersetzt werden könnten, wenn die morphologischen Daten aufgrund eines schlechten Erhaltungszustandes unvollständig sind.