Logo Logo
Help
Contact
Switch language to German
Unlocking the benefits of spaceborne imaging spectroscopy for sustainable agriculture
Unlocking the benefits of spaceborne imaging spectroscopy for sustainable agriculture
With the Environmental Mapping and Analysis Program (EnMAP) mission, launched on April 1st 2022, new opportunities unfold for precision farming and agricultural monitoring. The recurring acquisition of spectrometric imagery from space, contiguously resolving the electromagnetic spectrum in the optical domain (400—2500 nm) within close narrow bands, provides unprecedented data about the interaction of radiation with biophysical and biochemical crop constituents. These interactions manifest in spectral reflectance, carrying important information about crop status and health. This information may be incorporated in agricultural management systems to support necessary efforts to maximize yields against the backdrop of an increased food demand by a growing world population. At the same time, it enables the effective optimization of fertilization and pest control to minimize environmental impacts of agriculture. Deriving biophysical and biochemical crop traits from hyperspectral reflectance thereby always relies on a model. These models are categorized into (1) parametric, (2) nonparametric, (3) physically-based, and (4) hybrid retrieval schemes. Parametric methods define an explicit parameterized expression, relating a number of spectral bands or derivates thereof with a crop trait of interest. Nonparametric methods comprise linear techniques, such as principal component analysis (PCA) which addresses collinearity issues between adjacent bands and enables compression of full spectral information into dimensionality reduced, maximal informative principal components (PCs). Nonparametric nonlinear methods, i.e., machine learning (ML) algorithms apply nonlinear transformations to imaging spectroscopy data and are therefore capable of capturing nonlinear relationships within the contained spectral features. Physically-based methods represent an umbrella term for radiative transfer models (RTMs) and related retrieval schemes, such as look-up-table (LUT) inversion. A simple, easily invertible and specific RTM is the Beer-Lambert law which may be used to directly infer plant water content. The most widely used general and invertible RTM is the one-dimensional canopy RTM PROSAIL, which is coupling the Leaf Optical Properties Spectra model PROSPECT and the canopy reflectance model 4SAIL: Scattering by Arbitrarily Inclined Leaves. Hybrid methods make use of synthetic data sets created by RTMs to calibrate parametric methods or to train nonparametric ML algorithms. Due to the ill-posed nature of RTM inversion, potentially unrealistic and redundant samples in a LUT need to be removed by either implementing physiological constraints or by applying active learning (AL) heuristics. This cumulative thesis presents three different hybrid approaches, demonstrated within three scientific research papers, to derive agricultural relevant crop traits from spectrometric imagery. In paper I the Beer-Lambert law is applied to directly infer the thickness of the optically active water layer (i.e., EWT) from the liquid water absorption feature at 970 nm. The model is calibrated with 50,000 PROSPECT spectra and validated over in situ data. Due to separate water content measurements of leaves, stalks, and fruits during the Munich-North-Isar (MNI) campaigns, findings indicate that depending on the crop type and its structure, different parts of the canopy are observed with optical sensors. For winter wheat, correlation between measured and modelled water content was most promising for ears and leaves, reaching coefficients of determination (R2) up to 0.72 and relative RMSE (rRMSE) of 26%, and in the case of corn for the leaf fraction only (R2 = 0.86, rRMSE = 23%). These results led to the general recommendation to collect destructive area-based plant organ specific EWT measurements instead of the common practice to upscale leaf-based EWT measurements to canopy water content (CWC) by multiplication of the leaf area index (LAI). The developed and calibrated plant water retrieval (PWR) model proved to be transferable in space and time and is ready to be applied to upcoming EnMAP data and any other hyperspectral imagery. In paper II the parametric concept of spectral integral ratios (SIR) is introduced to retrieve leaf chlorophyll a and b content (Cab), leaf carotenoid content (Ccx) and leaf water content (Cw) simultaneously from imaging spectroscopy data in the wavelength range 460—1100 nm. The SIR concept is based on automatic separation of respective absorption features through local peak and intercept analysis between log-transformed reflectance and convex hulls. The approach was validated over a physiologically constrained PROSAIL simulated database, considering natural Ccx-Cab relations and green peak locations. Validation on airborne spectrometric HyMAP data achieved satisfactory results for Cab (R2 = 0.84; RMSE = 9.06 µg cm-2) and CWC (R2 = 0.70; RMSE = 0.05 cm). Retrieved Ccx values were reasonable according to Cab-Ccx-dependence plausibility analysis. Mapping of the SIR results as multiband images (3-segment SIR) allows for an intuitive visualization of dominant absorptions with respect to the three considered biochemical variables. Hence, the presented SIR algorithm allows for computationally efficient and RTM supported robust retrievals of the two most important vegetation pigments as well as of water content and is applicable on satellite imaging spectroscopy data. In paper III a hybrid workflow is presented, combining RTM with ML for inferring crop carbon content (Carea) and aboveground dry and fresh biomass (AGBdry, AGBfresh). The concept involves the establishment of a PROSAIL training database, dimensionality reduction using PCA, optimization in the sampling domain using AL against the 4-year MNI campaign dataset, and training of Gaussian process regression (GPR) ML algorithms. Internal validation of the GPR-Carea and GPR-AGB models achieved R2 of 0.80 for Carea, and R2 of 0.80 and 0.71 for AGBdry and AGBfresh, respectively. Validation with an independent dataset, comprising airborne AVIRIS NG imagery (spectrally resampled to EnMAP) and in situ measurements, successfully demonstrated mapping capabilities for both bare and green fields and generated reliable estimates over winter wheat fields at low associated model uncertainties (< 40%). Overall, the proposed carbon and biomass models demonstrate a promising path toward the inference of these crucial variables over cultivated areas from upcoming spaceborne hyperspectral acquisitions, such as from EnMAP. As conclusions, the following important findings arise regarding parametric and nonparametric hybrid methods as well as in view of the importance of in situ data collection. (1) Uncertainties within the RTM PROSAIL should always be considered. A possible reduction of these uncertainties is thereby opposed to the invertibility of the model and its intended simplicity. (2) Both physiological constraints and AL heuristics should be applied to reduce unrealistic parameter combinations in a PROSAIL calibration or training database. (3) State-of-the-art hybrid ML approaches with the ability to provide uncertainty intervals are anticipated as most promising approach for solving inference problems from hyperspectral Earth observation data due to their synergistic use of RTMs and the high flexibility, accuracy and consistency of nonlinear nonparametric methods. (4) Parametric hybrid approaches, due to their algorithmic transparency, enable deeper insights into fundamental physical limitations of optical remote sensing as compared to ML approaches. (5) Integration-based indices that make full use of available hyperspectral information may serve as physics-aware dimensionality reduced input for ML algorithms to either improve estimations or to serve as endmember for crop type discrimination when additional time series information is available. (6) The validation of quantitative model-based estimations is crucial to evaluate and improve their performance in terms of the underlying assumptions, model parameterizations, and input data. (7) In the face of soon-to-be-available EnMAP data, collection of in situ data for validation of retrieval methods should aim at high variability of measured crop types, high temporal variability over the whole growing season, as well as include area- and biomass-based destructive measurements instead of LAI-upscaled leaf measurements. Provided the perfect functionality of the payload instruments, the success of the EnMAP mission and the here presented methods depend critically on a low-noise, accurate atmospherically corrected reflectance product. High-level outputs of the retrieval methods presented in this thesis may be incorporated into agricultural decision support systems for fertilization and irrigation planning, yield estimation, or estimation of the soil carbon sequestration potential to enable a sustainable intensive agriculture in the future., Mit der am 1. April 2022 gestarteten Satellitenmission Environmental Mapping and Analysis Program (EnMAP) eröffnen sich neue Möglichkeiten für die Präzisionslandwirtschaft und das landwirtschaftliche Monitoring. Die wiederkehrende Erfassung spektrometrischer Bilder aus dem Weltraum, welche das elektromagnetische Spektrum im optischen Bereich (400—2500 nm) innerhalb von engen, schmalen Bändern zusammenhängend auflösen, liefert nie dagewesene Daten über die Interaktionen von Strahlung und biophysikalischen und biochemischen Pflanzenbestandteilen. Diese Wechselwirkungen manifestieren sich in der spektralen Reflektanz, die wichtige Informationen über den Zustand und die Gesundheit der Pflanzen enthält. Vor dem Hintergrund einer steigenden Nachfrage nach Nahrungsmitteln durch eine wachsende Weltbevölkerung können diese Informationen in landwirtschaftliche Managementsysteme einfließen, um eine notwendige Ertragsmaximierung zu unterstützen. Gleichzeitig können sie eine effiziente Optimierung der Düngung und Schädlingsbekämpfung ermöglichen, um die Umweltauswirkungen der Landwirtschaft zu minimieren. Die Ableitung biophysikalischer und biochemischer Pflanzeneigenschaften aus hyperspektralen Reflektanzdaten ist dabei immer von einem Modell abhängig. Diese Modelle werden in (1) parametrische, (2) nichtparametrische, (3) physikalisch basierte und (4) hybride Ableitungsmethoden kategorisiert. Parametrische Methoden definieren einen expliziten parametrisierten Ausdruck, der eine Reihe von Spektralkanälen oder deren Ableitungen mit einem Pflanzenmerkmal von Interesse in Beziehung setzt. Nichtparametrische Methoden umfassen lineare Techniken wie die Hauptkomponentenanalyse (PCA). Diese adressieren Kollinearitätsprobleme zwischen benachbarten Kanälen und komprimieren die gesamte Spektralinformation in dimensionsreduzierte, maximal informative Hauptkomponenten (PCs). Nichtparametrische nichtlineare Methoden, d. h. Algorithmen des maschinellen Lernens (ML), wenden nichtlineare Transformationen auf bildgebende Spektroskopiedaten an und sind daher in der Lage, nichtlineare Beziehungen innerhalb der enthaltenen spektralen Merkmale zu erfassen. Physikalisch basierte Methoden sind ein Oberbegriff für Strahlungstransfermodelle (RTM) und damit verbundene Ableitungsschemata, d. h. Invertierungsverfahren wie z. B. die Invertierung mittels Look-up-Table (LUT). Ein einfaches, leicht invertierbares und spezifisches RTM stellt das Lambert-Beer'sche Gesetz dar, das zur direkten Ableitung des Wassergehalts von Pflanzen verwendet werden kann. Das am weitesten verbreitete, allgemeine und invertierbare RTM ist das eindimensionale Bestandsmodell PROSAIL, eine Kopplung des Blattmodells Leaf Optical Properties Spectra (PROSPECT) mit dem Bestandsreflexionsmodell 4SAIL (Scattering by Arbitrarily Inclined Leaves). Bei hybriden Methoden werden von RTMs generierte, synthetische Datenbanken entweder zur Kalibrierung parametrischer Methoden oder zum Training nichtparametrischer ML-Algorithmen verwendet. Aufgrund der Äquifinalitätsproblematik bei der RTM-Invertierung, müssen potenziell unrealistische und redundante Simulationen in einer solchen Datenbank durch die Implementierung natürlicher physiologischer Beschränkungen oder durch die Anwendung von Active Learning (AL) Heuristiken entfernt werden. In dieser kumulativen Dissertation werden drei verschiedene hybride Ansätze zur Ableitung landwirtschaftlich relevanter Pflanzenmerkmale aus spektrometrischen Bilddaten vorgestellt, die anhand von drei wissenschaftlichen Publikationen demonstriert werden. In Paper I wird das Lambert-Beer'sche Gesetz angewandt, um die Dicke der optisch aktiven Wasserschicht (bzw. EWT) direkt aus dem Absorptionsmerkmal von flüssigem Wasser bei 970 nm abzuleiten. Das Modell wird mit 50.000 PROSPECT-Spektren kalibriert und anhand von In-situ-Daten validiert. Aufgrund separater Messungen des Wassergehalts von Blättern, Stängeln und Früchten während der München-Nord-Isar (MNI)-Kampagnen, zeigen die Ergebnisse, dass je nach Kulturart und -struktur, unterschiedliche Teile des Bestandes mit optischen Sensoren beobachtet werden können. Bei Winterweizen wurde die höchste Korrelation zwischen gemessenem und modelliertem Wassergehalt für Ähren und Blätter erzielt und sie erreichte Bestimmtheitsmaße (R2) von bis zu 0,72 bei einem relativen RMSE (rRMSE) von 26%, bei Mais entsprechend nur für die Blattfraktion (R2 = 0,86, rRMSE = 23%). Diese Ergebnisse führten zu der allgemeinen Empfehlung, Kompartiment-spezifische EWT-Bestandsmessungen zu erheben, anstatt der üblichen Praxis, blattbasierte EWT-Messungen durch Multiplikation mit dem Blattflächenindex (LAI) auf den Bestandswassergehalt (CWC) hochzurechnen. Das entwickelte und kalibrierte Modell zur Ableitung des Pflanzenwassergehalts (PWR) erwies sich als räumlich und zeitlich übertragbar und kann auf bald verfügbare EnMAP-Daten und andere hyperspektrale Bilddaten angewendet werden. In Paper II wird das parametrische Konzept der spektralen Integralratios (SIR) eingeführt, um den Chlorophyll a- und b-Gehalt (Cab), den Karotinoidgehalt (Ccx) und den Wassergehalt (Cw) simultan aus bildgebenden Spektroskopiedaten im Wellenlängenbereich 460-1100 nm zu ermitteln. Das SIR-Konzept basiert auf der automatischen Separierung der jeweiligen Absorptionsmerkmale durch lokale Maxima- und Schnittpunkt-Analyse zwischen log-transformierter Reflektanz und konvexen Hüllen. Der Ansatz wurde anhand einer physiologisch eingeschränkten PROSAIL-Datenbank unter Berücksichtigung natürlicher Ccx-Cab-Beziehungen und Positionen der Maxima im grünen Wellenlängenbereich validiert. Die Validierung mit flugzeuggestützten spektrometrischen HyMAP-Daten ergab zufriedenstellende Ergebnisse für Cab (R2 = 0,84; RMSE = 9,06 µg cm-2) und CWC (R2 = 0,70; RMSE = 0,05 cm). Die ermittelten Ccx-Werte wurden anhand einer Plausibilitätsanalyse entsprechend der Cab-Ccx-Abhängigkeit als sinnvoll bewertet. Die Darstellung der SIR-Ergebnisse als mehrkanalige Bilder (3 segment SIR) ermöglicht zudem eine auf die drei betrachteten biochemischen Variablen bezogene, intuitive Visualisierung der dominanten Absorptionen. Der vorgestellte SIR-Algorithmus ermöglicht somit wenig rechenintensive und RTM-gestützte robuste Ableitungen der beiden wichtigsten Pigmente sowie des Wassergehalts und kann in auf jegliche zukünftig verfügbare Hyperspektraldaten angewendet werden. In Paper III wird ein hybrider Ansatz vorgestellt, der RTM mit ML kombiniert, um den Kohlenstoffgehalt (Carea) sowie die oberirdische trockene und frische Biomasse (AGBdry, AGBfresh) abzuschätzen. Das Konzept umfasst die Erstellung einer PROSAIL-Trainingsdatenbank, die Dimensionsreduzierung mittels PCA, die Reduzierung der Stichprobenanzahl mittels AL anhand des vier Jahre umspannenden MNI-Kampagnendatensatzes und das Training von Gaussian Process Regression (GPR) ML-Algorithmen. Die interne Validierung der GPR-Carea und GPR-AGB-Modelle ergab einen R2 von 0,80 für Carea und einen R2 von 0,80 bzw. 0,71 für AGBdry und AGBfresh. Die Validierung auf einem unabhängigen Datensatz, der flugzeuggestützte AVIRIS-NG-Bilder (spektral auf EnMAP umgerechnet) und In-situ-Messungen umfasste, zeigte erfolgreich die Kartierungsfähigkeiten sowohl für offene Böden als auch für grüne Felder und führte zu zuverlässigen Schätzungen auf Winterweizenfeldern bei geringen Modellunsicherheiten (< 40%). Insgesamt zeigen die vorgeschlagenen Kohlenstoff- und Biomassemodelle einen vielversprechenden Ansatz auf, der zur Ableitung dieser wichtigen Variablen über Anbauflächen aus künftigen weltraumgestützten Hyperspektralaufnahmen wie jenen von EnMAP genutzt werden kann. Als Schlussfolgerungen ergeben sich die folgenden wichtigen Erkenntnisse in Bezug auf parametrische und nichtparametrische Hybridmethoden sowie bezogen auf die Bedeutung der In-situ-Datenerfassung. (1) Unsicherheiten innerhalb des RTM PROSAIL sollten immer berücksichtigt werden. Eine mögliche Verringerung dieser Unsicherheiten steht dabei der Invertierbarkeit des Modells und dessen beabsichtigter Einfachheit entgegen. (2) Sowohl physiologische Einschränkungen als auch AL-Heuristiken sollten angewendet werden, um unrealistische Parameterkombinationen in einer PROSAIL-Kalibrierungs- oder Trainingsdatenbank zu reduzieren. (3) Modernste ML-Ansätze mit der Fähigkeit, Unsicherheitsintervalle bereitzustellen, werden als vielversprechendster Ansatz für die Lösung von Inferenzproblemen aus hyperspektralen Erdbeobachtungsdaten aufgrund ihrer synergetischen Nutzung von RTMs und der hohen Flexibilität, Genauigkeit und Konsistenz nichtlinearer nichtparametrischer Methoden angesehen. (4) Parametrische hybride Ansätze ermöglichen aufgrund ihrer algorithmischen Transparenz im Vergleich zu ML-Ansätzen tiefere Einblicke in die grundlegenden physikalischen Grenzen der optischen Fernerkundung. (5) Integralbasierte Indizes, die die verfügbare hyperspektrale Information voll ausschöpfen, können als physikalisch-basierte dimensionsreduzierte Inputs für ML-Algorithmen dienen, um entweder Schätzungen zu verbessern oder um als Eingangsdaten die verbesserte Unterscheidung von Kulturpflanzen zu ermöglichen, sobald zusätzliche Zeitreiheninformationen verfügbar sind. (6) Die Validierung quantitativer modellbasierter Schätzungen ist von entscheidender Bedeutung für die Bewertung und Verbesserung ihrer Leistungsfähigkeit in Bezug auf die zugrunde liegenden Annahmen, Modellparametrisierungen und Eingabedaten. (7) Angesichts der bald verfügbaren EnMAP-Daten sollte die Erhebung von In-situ-Daten zur Validierung von Ableitungsmethoden auf eine hohe Variabilität der gemessenen Pflanzentypen und eine hohe zeitliche Variabilität über die gesamte Vegetationsperiode abzielen sowie flächen- und biomassebasierte destruktive Messungen anstelle von LAI-skalierten Blattmessungen umfassen. Unter der Voraussetzung, dass die Messinstrumente perfekt funktionieren, hängt der Erfolg der EnMAP-Mission und der hier vorgestellten Methoden entscheidend von einem rauscharmen, präzise atmosphärisch korrigierten Reflektanzprodukt ab. Die Ergebnisse der in dieser Arbeit vorgestellten Methoden können in landwirtschaftliche Entscheidungsunterstützungssysteme für die Dünge- oder Bewässerungsplanung, die Ertragsabschätzung oder die Schätzung des Potenzials der Kohlenstoffbindung im Boden integriert werden, um eine nachhaltige Intensivlandwirtschaft in der Zukunft zu ermöglichen.
Not available
Wocher, Matthias
2022
English
Universitätsbibliothek der Ludwig-Maximilians-Universität München
Wocher, Matthias (2022): Unlocking the benefits of spaceborne imaging spectroscopy for sustainable agriculture. Dissertation, LMU München: Faculty of Geosciences
[thumbnail of Wocher_Matthias.pdf] Licence: Creative Commons: Attribution-NonCommercial-NoDerivatives 4.0 (CC-BY-NC-ND)
PDF
Wocher_Matthias.pdf

18MB

Abstract

With the Environmental Mapping and Analysis Program (EnMAP) mission, launched on April 1st 2022, new opportunities unfold for precision farming and agricultural monitoring. The recurring acquisition of spectrometric imagery from space, contiguously resolving the electromagnetic spectrum in the optical domain (400—2500 nm) within close narrow bands, provides unprecedented data about the interaction of radiation with biophysical and biochemical crop constituents. These interactions manifest in spectral reflectance, carrying important information about crop status and health. This information may be incorporated in agricultural management systems to support necessary efforts to maximize yields against the backdrop of an increased food demand by a growing world population. At the same time, it enables the effective optimization of fertilization and pest control to minimize environmental impacts of agriculture. Deriving biophysical and biochemical crop traits from hyperspectral reflectance thereby always relies on a model. These models are categorized into (1) parametric, (2) nonparametric, (3) physically-based, and (4) hybrid retrieval schemes. Parametric methods define an explicit parameterized expression, relating a number of spectral bands or derivates thereof with a crop trait of interest. Nonparametric methods comprise linear techniques, such as principal component analysis (PCA) which addresses collinearity issues between adjacent bands and enables compression of full spectral information into dimensionality reduced, maximal informative principal components (PCs). Nonparametric nonlinear methods, i.e., machine learning (ML) algorithms apply nonlinear transformations to imaging spectroscopy data and are therefore capable of capturing nonlinear relationships within the contained spectral features. Physically-based methods represent an umbrella term for radiative transfer models (RTMs) and related retrieval schemes, such as look-up-table (LUT) inversion. A simple, easily invertible and specific RTM is the Beer-Lambert law which may be used to directly infer plant water content. The most widely used general and invertible RTM is the one-dimensional canopy RTM PROSAIL, which is coupling the Leaf Optical Properties Spectra model PROSPECT and the canopy reflectance model 4SAIL: Scattering by Arbitrarily Inclined Leaves. Hybrid methods make use of synthetic data sets created by RTMs to calibrate parametric methods or to train nonparametric ML algorithms. Due to the ill-posed nature of RTM inversion, potentially unrealistic and redundant samples in a LUT need to be removed by either implementing physiological constraints or by applying active learning (AL) heuristics. This cumulative thesis presents three different hybrid approaches, demonstrated within three scientific research papers, to derive agricultural relevant crop traits from spectrometric imagery. In paper I the Beer-Lambert law is applied to directly infer the thickness of the optically active water layer (i.e., EWT) from the liquid water absorption feature at 970 nm. The model is calibrated with 50,000 PROSPECT spectra and validated over in situ data. Due to separate water content measurements of leaves, stalks, and fruits during the Munich-North-Isar (MNI) campaigns, findings indicate that depending on the crop type and its structure, different parts of the canopy are observed with optical sensors. For winter wheat, correlation between measured and modelled water content was most promising for ears and leaves, reaching coefficients of determination (R2) up to 0.72 and relative RMSE (rRMSE) of 26%, and in the case of corn for the leaf fraction only (R2 = 0.86, rRMSE = 23%). These results led to the general recommendation to collect destructive area-based plant organ specific EWT measurements instead of the common practice to upscale leaf-based EWT measurements to canopy water content (CWC) by multiplication of the leaf area index (LAI). The developed and calibrated plant water retrieval (PWR) model proved to be transferable in space and time and is ready to be applied to upcoming EnMAP data and any other hyperspectral imagery. In paper II the parametric concept of spectral integral ratios (SIR) is introduced to retrieve leaf chlorophyll a and b content (Cab), leaf carotenoid content (Ccx) and leaf water content (Cw) simultaneously from imaging spectroscopy data in the wavelength range 460—1100 nm. The SIR concept is based on automatic separation of respective absorption features through local peak and intercept analysis between log-transformed reflectance and convex hulls. The approach was validated over a physiologically constrained PROSAIL simulated database, considering natural Ccx-Cab relations and green peak locations. Validation on airborne spectrometric HyMAP data achieved satisfactory results for Cab (R2 = 0.84; RMSE = 9.06 µg cm-2) and CWC (R2 = 0.70; RMSE = 0.05 cm). Retrieved Ccx values were reasonable according to Cab-Ccx-dependence plausibility analysis. Mapping of the SIR results as multiband images (3-segment SIR) allows for an intuitive visualization of dominant absorptions with respect to the three considered biochemical variables. Hence, the presented SIR algorithm allows for computationally efficient and RTM supported robust retrievals of the two most important vegetation pigments as well as of water content and is applicable on satellite imaging spectroscopy data. In paper III a hybrid workflow is presented, combining RTM with ML for inferring crop carbon content (Carea) and aboveground dry and fresh biomass (AGBdry, AGBfresh). The concept involves the establishment of a PROSAIL training database, dimensionality reduction using PCA, optimization in the sampling domain using AL against the 4-year MNI campaign dataset, and training of Gaussian process regression (GPR) ML algorithms. Internal validation of the GPR-Carea and GPR-AGB models achieved R2 of 0.80 for Carea, and R2 of 0.80 and 0.71 for AGBdry and AGBfresh, respectively. Validation with an independent dataset, comprising airborne AVIRIS NG imagery (spectrally resampled to EnMAP) and in situ measurements, successfully demonstrated mapping capabilities for both bare and green fields and generated reliable estimates over winter wheat fields at low associated model uncertainties (< 40%). Overall, the proposed carbon and biomass models demonstrate a promising path toward the inference of these crucial variables over cultivated areas from upcoming spaceborne hyperspectral acquisitions, such as from EnMAP. As conclusions, the following important findings arise regarding parametric and nonparametric hybrid methods as well as in view of the importance of in situ data collection. (1) Uncertainties within the RTM PROSAIL should always be considered. A possible reduction of these uncertainties is thereby opposed to the invertibility of the model and its intended simplicity. (2) Both physiological constraints and AL heuristics should be applied to reduce unrealistic parameter combinations in a PROSAIL calibration or training database. (3) State-of-the-art hybrid ML approaches with the ability to provide uncertainty intervals are anticipated as most promising approach for solving inference problems from hyperspectral Earth observation data due to their synergistic use of RTMs and the high flexibility, accuracy and consistency of nonlinear nonparametric methods. (4) Parametric hybrid approaches, due to their algorithmic transparency, enable deeper insights into fundamental physical limitations of optical remote sensing as compared to ML approaches. (5) Integration-based indices that make full use of available hyperspectral information may serve as physics-aware dimensionality reduced input for ML algorithms to either improve estimations or to serve as endmember for crop type discrimination when additional time series information is available. (6) The validation of quantitative model-based estimations is crucial to evaluate and improve their performance in terms of the underlying assumptions, model parameterizations, and input data. (7) In the face of soon-to-be-available EnMAP data, collection of in situ data for validation of retrieval methods should aim at high variability of measured crop types, high temporal variability over the whole growing season, as well as include area- and biomass-based destructive measurements instead of LAI-upscaled leaf measurements. Provided the perfect functionality of the payload instruments, the success of the EnMAP mission and the here presented methods depend critically on a low-noise, accurate atmospherically corrected reflectance product. High-level outputs of the retrieval methods presented in this thesis may be incorporated into agricultural decision support systems for fertilization and irrigation planning, yield estimation, or estimation of the soil carbon sequestration potential to enable a sustainable intensive agriculture in the future.

Abstract

Mit der am 1. April 2022 gestarteten Satellitenmission Environmental Mapping and Analysis Program (EnMAP) eröffnen sich neue Möglichkeiten für die Präzisionslandwirtschaft und das landwirtschaftliche Monitoring. Die wiederkehrende Erfassung spektrometrischer Bilder aus dem Weltraum, welche das elektromagnetische Spektrum im optischen Bereich (400—2500 nm) innerhalb von engen, schmalen Bändern zusammenhängend auflösen, liefert nie dagewesene Daten über die Interaktionen von Strahlung und biophysikalischen und biochemischen Pflanzenbestandteilen. Diese Wechselwirkungen manifestieren sich in der spektralen Reflektanz, die wichtige Informationen über den Zustand und die Gesundheit der Pflanzen enthält. Vor dem Hintergrund einer steigenden Nachfrage nach Nahrungsmitteln durch eine wachsende Weltbevölkerung können diese Informationen in landwirtschaftliche Managementsysteme einfließen, um eine notwendige Ertragsmaximierung zu unterstützen. Gleichzeitig können sie eine effiziente Optimierung der Düngung und Schädlingsbekämpfung ermöglichen, um die Umweltauswirkungen der Landwirtschaft zu minimieren. Die Ableitung biophysikalischer und biochemischer Pflanzeneigenschaften aus hyperspektralen Reflektanzdaten ist dabei immer von einem Modell abhängig. Diese Modelle werden in (1) parametrische, (2) nichtparametrische, (3) physikalisch basierte und (4) hybride Ableitungsmethoden kategorisiert. Parametrische Methoden definieren einen expliziten parametrisierten Ausdruck, der eine Reihe von Spektralkanälen oder deren Ableitungen mit einem Pflanzenmerkmal von Interesse in Beziehung setzt. Nichtparametrische Methoden umfassen lineare Techniken wie die Hauptkomponentenanalyse (PCA). Diese adressieren Kollinearitätsprobleme zwischen benachbarten Kanälen und komprimieren die gesamte Spektralinformation in dimensionsreduzierte, maximal informative Hauptkomponenten (PCs). Nichtparametrische nichtlineare Methoden, d. h. Algorithmen des maschinellen Lernens (ML), wenden nichtlineare Transformationen auf bildgebende Spektroskopiedaten an und sind daher in der Lage, nichtlineare Beziehungen innerhalb der enthaltenen spektralen Merkmale zu erfassen. Physikalisch basierte Methoden sind ein Oberbegriff für Strahlungstransfermodelle (RTM) und damit verbundene Ableitungsschemata, d. h. Invertierungsverfahren wie z. B. die Invertierung mittels Look-up-Table (LUT). Ein einfaches, leicht invertierbares und spezifisches RTM stellt das Lambert-Beer'sche Gesetz dar, das zur direkten Ableitung des Wassergehalts von Pflanzen verwendet werden kann. Das am weitesten verbreitete, allgemeine und invertierbare RTM ist das eindimensionale Bestandsmodell PROSAIL, eine Kopplung des Blattmodells Leaf Optical Properties Spectra (PROSPECT) mit dem Bestandsreflexionsmodell 4SAIL (Scattering by Arbitrarily Inclined Leaves). Bei hybriden Methoden werden von RTMs generierte, synthetische Datenbanken entweder zur Kalibrierung parametrischer Methoden oder zum Training nichtparametrischer ML-Algorithmen verwendet. Aufgrund der Äquifinalitätsproblematik bei der RTM-Invertierung, müssen potenziell unrealistische und redundante Simulationen in einer solchen Datenbank durch die Implementierung natürlicher physiologischer Beschränkungen oder durch die Anwendung von Active Learning (AL) Heuristiken entfernt werden. In dieser kumulativen Dissertation werden drei verschiedene hybride Ansätze zur Ableitung landwirtschaftlich relevanter Pflanzenmerkmale aus spektrometrischen Bilddaten vorgestellt, die anhand von drei wissenschaftlichen Publikationen demonstriert werden. In Paper I wird das Lambert-Beer'sche Gesetz angewandt, um die Dicke der optisch aktiven Wasserschicht (bzw. EWT) direkt aus dem Absorptionsmerkmal von flüssigem Wasser bei 970 nm abzuleiten. Das Modell wird mit 50.000 PROSPECT-Spektren kalibriert und anhand von In-situ-Daten validiert. Aufgrund separater Messungen des Wassergehalts von Blättern, Stängeln und Früchten während der München-Nord-Isar (MNI)-Kampagnen, zeigen die Ergebnisse, dass je nach Kulturart und -struktur, unterschiedliche Teile des Bestandes mit optischen Sensoren beobachtet werden können. Bei Winterweizen wurde die höchste Korrelation zwischen gemessenem und modelliertem Wassergehalt für Ähren und Blätter erzielt und sie erreichte Bestimmtheitsmaße (R2) von bis zu 0,72 bei einem relativen RMSE (rRMSE) von 26%, bei Mais entsprechend nur für die Blattfraktion (R2 = 0,86, rRMSE = 23%). Diese Ergebnisse führten zu der allgemeinen Empfehlung, Kompartiment-spezifische EWT-Bestandsmessungen zu erheben, anstatt der üblichen Praxis, blattbasierte EWT-Messungen durch Multiplikation mit dem Blattflächenindex (LAI) auf den Bestandswassergehalt (CWC) hochzurechnen. Das entwickelte und kalibrierte Modell zur Ableitung des Pflanzenwassergehalts (PWR) erwies sich als räumlich und zeitlich übertragbar und kann auf bald verfügbare EnMAP-Daten und andere hyperspektrale Bilddaten angewendet werden. In Paper II wird das parametrische Konzept der spektralen Integralratios (SIR) eingeführt, um den Chlorophyll a- und b-Gehalt (Cab), den Karotinoidgehalt (Ccx) und den Wassergehalt (Cw) simultan aus bildgebenden Spektroskopiedaten im Wellenlängenbereich 460-1100 nm zu ermitteln. Das SIR-Konzept basiert auf der automatischen Separierung der jeweiligen Absorptionsmerkmale durch lokale Maxima- und Schnittpunkt-Analyse zwischen log-transformierter Reflektanz und konvexen Hüllen. Der Ansatz wurde anhand einer physiologisch eingeschränkten PROSAIL-Datenbank unter Berücksichtigung natürlicher Ccx-Cab-Beziehungen und Positionen der Maxima im grünen Wellenlängenbereich validiert. Die Validierung mit flugzeuggestützten spektrometrischen HyMAP-Daten ergab zufriedenstellende Ergebnisse für Cab (R2 = 0,84; RMSE = 9,06 µg cm-2) und CWC (R2 = 0,70; RMSE = 0,05 cm). Die ermittelten Ccx-Werte wurden anhand einer Plausibilitätsanalyse entsprechend der Cab-Ccx-Abhängigkeit als sinnvoll bewertet. Die Darstellung der SIR-Ergebnisse als mehrkanalige Bilder (3 segment SIR) ermöglicht zudem eine auf die drei betrachteten biochemischen Variablen bezogene, intuitive Visualisierung der dominanten Absorptionen. Der vorgestellte SIR-Algorithmus ermöglicht somit wenig rechenintensive und RTM-gestützte robuste Ableitungen der beiden wichtigsten Pigmente sowie des Wassergehalts und kann in auf jegliche zukünftig verfügbare Hyperspektraldaten angewendet werden. In Paper III wird ein hybrider Ansatz vorgestellt, der RTM mit ML kombiniert, um den Kohlenstoffgehalt (Carea) sowie die oberirdische trockene und frische Biomasse (AGBdry, AGBfresh) abzuschätzen. Das Konzept umfasst die Erstellung einer PROSAIL-Trainingsdatenbank, die Dimensionsreduzierung mittels PCA, die Reduzierung der Stichprobenanzahl mittels AL anhand des vier Jahre umspannenden MNI-Kampagnendatensatzes und das Training von Gaussian Process Regression (GPR) ML-Algorithmen. Die interne Validierung der GPR-Carea und GPR-AGB-Modelle ergab einen R2 von 0,80 für Carea und einen R2 von 0,80 bzw. 0,71 für AGBdry und AGBfresh. Die Validierung auf einem unabhängigen Datensatz, der flugzeuggestützte AVIRIS-NG-Bilder (spektral auf EnMAP umgerechnet) und In-situ-Messungen umfasste, zeigte erfolgreich die Kartierungsfähigkeiten sowohl für offene Böden als auch für grüne Felder und führte zu zuverlässigen Schätzungen auf Winterweizenfeldern bei geringen Modellunsicherheiten (< 40%). Insgesamt zeigen die vorgeschlagenen Kohlenstoff- und Biomassemodelle einen vielversprechenden Ansatz auf, der zur Ableitung dieser wichtigen Variablen über Anbauflächen aus künftigen weltraumgestützten Hyperspektralaufnahmen wie jenen von EnMAP genutzt werden kann. Als Schlussfolgerungen ergeben sich die folgenden wichtigen Erkenntnisse in Bezug auf parametrische und nichtparametrische Hybridmethoden sowie bezogen auf die Bedeutung der In-situ-Datenerfassung. (1) Unsicherheiten innerhalb des RTM PROSAIL sollten immer berücksichtigt werden. Eine mögliche Verringerung dieser Unsicherheiten steht dabei der Invertierbarkeit des Modells und dessen beabsichtigter Einfachheit entgegen. (2) Sowohl physiologische Einschränkungen als auch AL-Heuristiken sollten angewendet werden, um unrealistische Parameterkombinationen in einer PROSAIL-Kalibrierungs- oder Trainingsdatenbank zu reduzieren. (3) Modernste ML-Ansätze mit der Fähigkeit, Unsicherheitsintervalle bereitzustellen, werden als vielversprechendster Ansatz für die Lösung von Inferenzproblemen aus hyperspektralen Erdbeobachtungsdaten aufgrund ihrer synergetischen Nutzung von RTMs und der hohen Flexibilität, Genauigkeit und Konsistenz nichtlinearer nichtparametrischer Methoden angesehen. (4) Parametrische hybride Ansätze ermöglichen aufgrund ihrer algorithmischen Transparenz im Vergleich zu ML-Ansätzen tiefere Einblicke in die grundlegenden physikalischen Grenzen der optischen Fernerkundung. (5) Integralbasierte Indizes, die die verfügbare hyperspektrale Information voll ausschöpfen, können als physikalisch-basierte dimensionsreduzierte Inputs für ML-Algorithmen dienen, um entweder Schätzungen zu verbessern oder um als Eingangsdaten die verbesserte Unterscheidung von Kulturpflanzen zu ermöglichen, sobald zusätzliche Zeitreiheninformationen verfügbar sind. (6) Die Validierung quantitativer modellbasierter Schätzungen ist von entscheidender Bedeutung für die Bewertung und Verbesserung ihrer Leistungsfähigkeit in Bezug auf die zugrunde liegenden Annahmen, Modellparametrisierungen und Eingabedaten. (7) Angesichts der bald verfügbaren EnMAP-Daten sollte die Erhebung von In-situ-Daten zur Validierung von Ableitungsmethoden auf eine hohe Variabilität der gemessenen Pflanzentypen und eine hohe zeitliche Variabilität über die gesamte Vegetationsperiode abzielen sowie flächen- und biomassebasierte destruktive Messungen anstelle von LAI-skalierten Blattmessungen umfassen. Unter der Voraussetzung, dass die Messinstrumente perfekt funktionieren, hängt der Erfolg der EnMAP-Mission und der hier vorgestellten Methoden entscheidend von einem rauscharmen, präzise atmosphärisch korrigierten Reflektanzprodukt ab. Die Ergebnisse der in dieser Arbeit vorgestellten Methoden können in landwirtschaftliche Entscheidungsunterstützungssysteme für die Dünge- oder Bewässerungsplanung, die Ertragsabschätzung oder die Schätzung des Potenzials der Kohlenstoffbindung im Boden integriert werden, um eine nachhaltige Intensivlandwirtschaft in der Zukunft zu ermöglichen.