Logo Logo
Help
Contact
Switch language to German
Predicting short-term solar irradiance variability combining numerical weather prediction and machine learning
Predicting short-term solar irradiance variability combining numerical weather prediction and machine learning
In einer digitalisierten Welt zählt eine sichere und stabile Energieversorgung zu den wichtigsten Anliegen von Gesellschaften und Regierungen. Photovoltaikanlagen (PV) sind eine Schlüsseltechnologie, um dieses Anliegen mit der durch den menschengemachten Klimawandel zwingend notwendig gewordenen Transformation hin zu erneuerbaren Energiequellenin Einklang zu bringen. Die Energieerzeugung mittels PV unterliegt jedoch großen wetterbedingten Schwankungen, welche insbesondere durch den Einfluss von Wolken auf die solare Einstrahlung hervorgerufen werden. Aufgrund ihrer groben räumlichen (ca. 2 km) und zeitlichen (ca. 1 h) Auflösung können moderne Wettermodelle diese Fluktuationen nur bis zu einem gewissen Grad prognostizieren. Auf räumlichen und zeitlichen Skalen unterhalb der Modellauflösung treten jedoch große Schwankungen in der solaren Einstrahlung und damit auch in der erzeugten PV Leistung auf, welche für einen sicheren Betrieb des Stromnetzes von großer Bedeutung sind. Daher wurden im Rahmen dieser Dissertation zwei Methoden entwickelt, um diese kleinskaligen Fluktuationen der solaren Einstrahlung basierend auf operationellen Wettervorhersagen des COSMO-D2 Modells des Deutschen Wetterdienstes, trotz deren geringer Auflösung vorhersagen zu können. Als Basis für die Modellentwicklung und Validierung wurden Messungen der horizontalen Globalstrahlung (GHI) mit einer zeitlichen Auflösung von einer Sekunde verwendet, welche im Rahmen zweier Messkampagnen des Forschungsprojekts MetPVNet im Raum Kempten gesammelt wurden. Die erste Methode basiert auf räumlich hochaufgelösten Feldern der GHI, welche mithilfe des 3D Strahlungstransportmodells MYSTIC und hochaufgelösten Wolkenfeldern aus Large Eddy Simulationen (LES) berechnet wurden. Basierend auf diesen GHI Feldern wurde zunächst der Variabilitätsindex V in Abhängigkeit des Sonnenzenitwinkels (SZA), der Wolkenzuggeschwindigkeit sowie des Wolkenbedeckungsgrades in einer Lookup-Tabelle (LUT) abgespeichert. Daraufhin wurden die Wolkenzuggeschwindigkeit sowie der Bedeckungsgrad aus den Vorhersagen des COSMO-D2 Modells extrahiert. Im letzten Schritt wurde das LUT Modell mithilfe eines Trainingsdatensatzes optimiert, wobei sowohl der RMSE (Root Mean Square Error) um 36% der Bias um 83% reduziert werden konnten. Als zweite Methode wurde ein Random-Forest (RF) Modell gewählt, welches zur Klasse der maschinellen Lernmethoden zählt. Ein entscheidender Vorteil von RF Modellen ist, dass eine beliebige Anzahl von Parametern verwendet werden kann, von denen die wichtigsten durch den RF selbst bestimmt werden. Der Datensatz mit einer Größe von anfänglich 121 Parametern konnte mithilfe des RF, unter Verwendung einer Recursive Feature Elimination in Kombination mit der Permutation Feature Importance Metrik, auf 13 Parameter reduziert werden. Weiterhin wurden die Hyperparameter des RF auf einem Trainingsdatensatz mittels eines Grid-Search Algorithmus optimiert. Um den Einfluss von Vorhersagefehlern des COSMO-D2 Modells auf die Vorhersage der Variabilität abzuschätzen, wurden beide Methoden sowohl auf dem originalen als auch auf einem qualitätsgeprüften (gefilterten) Datensatz optimiert und evaluiert. Die Evaluierung der Modelle ergab dabei RMSE Werte von 0,78 (gefiltert) und 0,96 (original) für das LUT Modell sowie 0,039 (gefiltert) und 0,0423 (original) für das RF Modell, welches somit deutlich bessere Ergebnisse erzielte. Ein zusätzlicher Validierungsschritt, bei dem das RF Modell, welches auf dem originalen Datensatz basiert, auf den gefilterten Datensatz angewendet wurde (und umgekehrt) zeigte, dass das RF Modell in der Lage ist, Fehler in der Wettervorhersage zu kompensieren. Daher ist es aus operationeller Sicht vorteilhaft, das RF Modell auf allen verfügbaren Daten zu trainieren, um die bestmögliche Variabilitätsvorhersage zu erzielen. Nach bestem Wissen des Autors, sind die hier entwickelten Modelle für die Vorhersage der kleinskaligen und kurzfristigen Variabilität der GHI die ersten, welche ausschließlich modernste operationelle Wettervorhersagen als Eingangsdaten nutzen und stellen daher einen wichtigen Fortschritt im Vergleich zur Literatur dar., Secure and stable power supply is one of the major concerns of societies and governments in a digitalized world. To reconcile this concern with the need of a transformation towards renewable energy sources in the light of climate change, photovoltaic (PV) systems are a key technology. However, photovoltaic energy production is highly dependent on weather conditions and exhibits large and rapid fluctuations in the presence of clouds which shield the PV systems from direct sunlight. State-of-the-art numerical weather prediction (NWP) models are able to predict these fluctuations only to a certain extent as they are operated on coarse resolution of about 2 km in space and typically 1 hour in time. On smaller temporal and spatial scales, which are not resolved by NWP models, the incoming solar radiation and the according PV power show very large fluctuations which are particularly relevant for a save operation of the power grid. To be able to predict these small scale fluctuations despite the low resolution of NWP models, two downscaling methods were developed based on operational forecasts of the German Weather Service COSMO-D2 model. Therefore, measurements of the global horizontal irradiance (GHI) with a temporal resolution of one second gathered in the area of Kempten (Allgäu) in the scope of the MetPVNet project were used as a ground truth for model development and validation. The first modelling approach is based high spatial resolution GHI fields calculated using the 3D radiative transfer model MYSTIC in combination with high resolved cloud fields from large eddy simulations (LES). From the GHI fields the variability index V was derived as a function of solar zenith angle (SZA), cloud advection speed and cloud fraction and stored within a lookup table (LUT). Cloud speed and cloud fraction were then extracted from the COSMO-D2 forecasts to predict the variability index. In a final step the LUT model was tuned on a training dataset which reduced the RMSE (Root Mean Square Error) by 36% and the bias by 83% . The second approach makes use of the random forest (RF) machine learning technique. A major advantage of the RF is that arbitrarily many input parameters can be used from which the most predictive ones can be determined by means of the RF. Therefore, a small set of 13 features was extracted from initially 121 COSMO-D2 forecast parameters by applying a recursive feature elimination in combination with the permutation feature importance metric. Additionally, the hyperparameters of the RF model were tuned on a training dataset by using a grid-search algorithm. To assess the impact of the COSMO-D2 forecast error on variability prediction, both models were built on the original dataset as well as on a quality filtered subset of the NWP forecasts and evaluated on a separated validation dataset. With an RMSE of 0.039 (filtered) and 0.0423 (unfiltered) the RF model outperforms the LUT approach with an RMSE of 0.078 for the filtered and 0.096 for the unfiltered dataset. An additional cross-over prediction – applying the unfiltered RF to the filtered validation dataset and vice versa – revealed that the RF model is able to compensate for errors in the NWP forecast. Consequently, from an operational perspective, it is beneficial to train the RF with all available data to obtain the best performance. To the knowledge of the author, the developed models for the prediction of small-scale and short-term GHI variability are the first to use exclusively operational state-of-the-art NWP forecasts as input and hence are a major advance compared to existing literature.
Machine Learning, Solar Irradiance Variability, Photovoltaics
Gödde, Felix Simon
2023
English
Universitätsbibliothek der Ludwig-Maximilians-Universität München
Gödde, Felix Simon (2023): Predicting short-term solar irradiance variability combining numerical weather prediction and machine learning. Dissertation, LMU München: Faculty of Physics
[thumbnail of Goedde_Felix_Simon.pdf]
Preview
PDF
Goedde_Felix_Simon.pdf

6MB

Abstract

In einer digitalisierten Welt zählt eine sichere und stabile Energieversorgung zu den wichtigsten Anliegen von Gesellschaften und Regierungen. Photovoltaikanlagen (PV) sind eine Schlüsseltechnologie, um dieses Anliegen mit der durch den menschengemachten Klimawandel zwingend notwendig gewordenen Transformation hin zu erneuerbaren Energiequellenin Einklang zu bringen. Die Energieerzeugung mittels PV unterliegt jedoch großen wetterbedingten Schwankungen, welche insbesondere durch den Einfluss von Wolken auf die solare Einstrahlung hervorgerufen werden. Aufgrund ihrer groben räumlichen (ca. 2 km) und zeitlichen (ca. 1 h) Auflösung können moderne Wettermodelle diese Fluktuationen nur bis zu einem gewissen Grad prognostizieren. Auf räumlichen und zeitlichen Skalen unterhalb der Modellauflösung treten jedoch große Schwankungen in der solaren Einstrahlung und damit auch in der erzeugten PV Leistung auf, welche für einen sicheren Betrieb des Stromnetzes von großer Bedeutung sind. Daher wurden im Rahmen dieser Dissertation zwei Methoden entwickelt, um diese kleinskaligen Fluktuationen der solaren Einstrahlung basierend auf operationellen Wettervorhersagen des COSMO-D2 Modells des Deutschen Wetterdienstes, trotz deren geringer Auflösung vorhersagen zu können. Als Basis für die Modellentwicklung und Validierung wurden Messungen der horizontalen Globalstrahlung (GHI) mit einer zeitlichen Auflösung von einer Sekunde verwendet, welche im Rahmen zweier Messkampagnen des Forschungsprojekts MetPVNet im Raum Kempten gesammelt wurden. Die erste Methode basiert auf räumlich hochaufgelösten Feldern der GHI, welche mithilfe des 3D Strahlungstransportmodells MYSTIC und hochaufgelösten Wolkenfeldern aus Large Eddy Simulationen (LES) berechnet wurden. Basierend auf diesen GHI Feldern wurde zunächst der Variabilitätsindex V in Abhängigkeit des Sonnenzenitwinkels (SZA), der Wolkenzuggeschwindigkeit sowie des Wolkenbedeckungsgrades in einer Lookup-Tabelle (LUT) abgespeichert. Daraufhin wurden die Wolkenzuggeschwindigkeit sowie der Bedeckungsgrad aus den Vorhersagen des COSMO-D2 Modells extrahiert. Im letzten Schritt wurde das LUT Modell mithilfe eines Trainingsdatensatzes optimiert, wobei sowohl der RMSE (Root Mean Square Error) um 36% der Bias um 83% reduziert werden konnten. Als zweite Methode wurde ein Random-Forest (RF) Modell gewählt, welches zur Klasse der maschinellen Lernmethoden zählt. Ein entscheidender Vorteil von RF Modellen ist, dass eine beliebige Anzahl von Parametern verwendet werden kann, von denen die wichtigsten durch den RF selbst bestimmt werden. Der Datensatz mit einer Größe von anfänglich 121 Parametern konnte mithilfe des RF, unter Verwendung einer Recursive Feature Elimination in Kombination mit der Permutation Feature Importance Metrik, auf 13 Parameter reduziert werden. Weiterhin wurden die Hyperparameter des RF auf einem Trainingsdatensatz mittels eines Grid-Search Algorithmus optimiert. Um den Einfluss von Vorhersagefehlern des COSMO-D2 Modells auf die Vorhersage der Variabilität abzuschätzen, wurden beide Methoden sowohl auf dem originalen als auch auf einem qualitätsgeprüften (gefilterten) Datensatz optimiert und evaluiert. Die Evaluierung der Modelle ergab dabei RMSE Werte von 0,78 (gefiltert) und 0,96 (original) für das LUT Modell sowie 0,039 (gefiltert) und 0,0423 (original) für das RF Modell, welches somit deutlich bessere Ergebnisse erzielte. Ein zusätzlicher Validierungsschritt, bei dem das RF Modell, welches auf dem originalen Datensatz basiert, auf den gefilterten Datensatz angewendet wurde (und umgekehrt) zeigte, dass das RF Modell in der Lage ist, Fehler in der Wettervorhersage zu kompensieren. Daher ist es aus operationeller Sicht vorteilhaft, das RF Modell auf allen verfügbaren Daten zu trainieren, um die bestmögliche Variabilitätsvorhersage zu erzielen. Nach bestem Wissen des Autors, sind die hier entwickelten Modelle für die Vorhersage der kleinskaligen und kurzfristigen Variabilität der GHI die ersten, welche ausschließlich modernste operationelle Wettervorhersagen als Eingangsdaten nutzen und stellen daher einen wichtigen Fortschritt im Vergleich zur Literatur dar.

Abstract

Secure and stable power supply is one of the major concerns of societies and governments in a digitalized world. To reconcile this concern with the need of a transformation towards renewable energy sources in the light of climate change, photovoltaic (PV) systems are a key technology. However, photovoltaic energy production is highly dependent on weather conditions and exhibits large and rapid fluctuations in the presence of clouds which shield the PV systems from direct sunlight. State-of-the-art numerical weather prediction (NWP) models are able to predict these fluctuations only to a certain extent as they are operated on coarse resolution of about 2 km in space and typically 1 hour in time. On smaller temporal and spatial scales, which are not resolved by NWP models, the incoming solar radiation and the according PV power show very large fluctuations which are particularly relevant for a save operation of the power grid. To be able to predict these small scale fluctuations despite the low resolution of NWP models, two downscaling methods were developed based on operational forecasts of the German Weather Service COSMO-D2 model. Therefore, measurements of the global horizontal irradiance (GHI) with a temporal resolution of one second gathered in the area of Kempten (Allgäu) in the scope of the MetPVNet project were used as a ground truth for model development and validation. The first modelling approach is based high spatial resolution GHI fields calculated using the 3D radiative transfer model MYSTIC in combination with high resolved cloud fields from large eddy simulations (LES). From the GHI fields the variability index V was derived as a function of solar zenith angle (SZA), cloud advection speed and cloud fraction and stored within a lookup table (LUT). Cloud speed and cloud fraction were then extracted from the COSMO-D2 forecasts to predict the variability index. In a final step the LUT model was tuned on a training dataset which reduced the RMSE (Root Mean Square Error) by 36% and the bias by 83% . The second approach makes use of the random forest (RF) machine learning technique. A major advantage of the RF is that arbitrarily many input parameters can be used from which the most predictive ones can be determined by means of the RF. Therefore, a small set of 13 features was extracted from initially 121 COSMO-D2 forecast parameters by applying a recursive feature elimination in combination with the permutation feature importance metric. Additionally, the hyperparameters of the RF model were tuned on a training dataset by using a grid-search algorithm. To assess the impact of the COSMO-D2 forecast error on variability prediction, both models were built on the original dataset as well as on a quality filtered subset of the NWP forecasts and evaluated on a separated validation dataset. With an RMSE of 0.039 (filtered) and 0.0423 (unfiltered) the RF model outperforms the LUT approach with an RMSE of 0.078 for the filtered and 0.096 for the unfiltered dataset. An additional cross-over prediction – applying the unfiltered RF to the filtered validation dataset and vice versa – revealed that the RF model is able to compensate for errors in the NWP forecast. Consequently, from an operational perspective, it is beneficial to train the RF with all available data to obtain the best performance. To the knowledge of the author, the developed models for the prediction of small-scale and short-term GHI variability are the first to use exclusively operational state-of-the-art NWP forecasts as input and hence are a major advance compared to existing literature.