Logo Logo
Help
Contact
Switch language to German
On unbiased and higher-order large-scale structure statistics: Covariance Matrices and Minkowski Functionals
On unbiased and higher-order large-scale structure statistics: Covariance Matrices and Minkowski Functionals
The study of the large-scale galaxy clustering has significantly contributed to our present-day understanding of the composition and the evolution of our Universe. The upcoming generation of galaxy redshift surveys will open the opportunity to further probe our standard cosmological model and its possible extensions by measuring the cosmic expansion and growth of structure histories to unprecedented precision. This thesis aims to provide new insights into the challenges of capturing the information encoded in the large-scale structure, which might be useful for future galaxy clustering analyses. The covariance matrix of the clustering measurements is an essential ingredient to derive unbiased constraints on cosmological parameters. Using large numbers of mock catalogues from simulations is considered the most reliable approach to estimate the covariance matrix. However, running large numbers of full cosmological simulations is computationally very expensive. The first part of the thesis presents a detailed comparison of the covariance matrices inferred from seven state-of-the-art approximate methods for gravitational structure formation. These include predictive methods that follow the evolution of the underlying matter density field deterministically (COLA, Peak Patch, PINOCCHIO), methods that require a prior calibration with full N-body simulations (PATCHY and HALOGEN), and two simpler recipes based on assuming log-normal or Gaussian shapes of the full density probability distribution function. The comparison focuses on measurements of the anisotropic two-point correlation function, one of the most successful and widespread tools for the statistical analysis of galaxy clustering. We compare the covariance estimates obtained from the approximate methods against reference covariances inferred from a set of cosmological N-body simulations. In particular, we examine the performance of the covariance matrices from the approximate methods at reproducing parameter constraints from the analysis based on the N-body simulations. Our results show that all approximate methods can recover the results from the N-body simulations with an accuracy of 5% for our lower halo mass threshold, and of 10% for our higher halo mass threshold, with no method clearly outperforming the others. With the goal of extracting information beyond two-point statistics, the second part of the thesis considers Minkowski functionals, which characterize the geometry and topology of the cosmic density field and contain compressed higher-order information. In this context, we implement a robust and accurate method for estimating the Minkowski functionals of three-dimensional point distributions, in particular of samples from simulations with periodic boundary conditions. The resulting code, dubbed MEDUSA, computes the Minkowski functionals of triangulated isodensity surfaces that are constructed from the Delaunay tessellation of the input point sample. After the thorough validation of the code on test samples, we apply it to synthetic catalogues from different N-body simulations. The resulting Minkowski functionals exhibit clear non-Gaussian signatures. These are expected due to the non-linear gravitational evolution of the density field, which leads to higher-order correlations in the galaxy distribution. The analysis of the Minkowski functionals measured in redshift space indicates that the redshift-space distortions significantly change the Minkowski functional estimates, but their impact is considerably reduced if the measurements are expressed as a function of the volume-filling fraction instead of the density threshold. The Minkowski functional measurements are also sensitive to Alcock-Paczynski (AP) distortions. Their effect can be modelled by scaling the measurements with suitable powers of the isotropic AP parameter q, which depends on the volume-averaged distance D_V(z). The covariance matrix of the Minkowski functional measurements has significant off-diagonal structure, which needs to be taken into account for future analyses. Finally, we test a novel approach to describe the cosmology dependence of the Minkowski functionals, dubbed evolution mapping, in which the impact of a large number of cosmological parameters that affect the redshift evolution of the linear growth factor is characterized by the value of σ_12, the linear-theory rms mass fluctuation in spheres of radius 12 Mpc. Our analysis shows that this approach is valid for the Minkowski functionals with high accuracy and can serve as a starting point to develop a simulation-based model for the Minkowski functionals of non-Gaussian density fields., Die Untersuchung der großräumigen Verteilung von Galaxien hat wesentlich zu unserem heutigen Verständnis von der Zusammensetzung und der Entwicklung unseres Universums beigetragen. Die kommende Generation von Galaxien-Durchmusterungen wird es uns ermöglichen, die kosmische Expansionsgeschichte und das Strukturwachstum mit bislang unerreichter Präzision zu messen, und dadurch das kosmologische Standardmodell und seine möglichen Erweiterungen noch genauer zu erforschen. Ziel dieser Arbeit ist es neue Einblicke in Verfahren für die Gewinnung kosmologischer Information aus der großräumigen Struktur zu gewähren, die für zukünftige Analysen der "Klumpungseigenschaften" von Galaxien (Galaxy Clustering) von Nutzen sein könnten. Die Kovarianzmatrix von Clustering-Messungen ist ein wesentlicher Bestandteil von Analysen, der Voraussetzung für die unverfälschte Bestimmung kosmologischer Parameter ist. Die Verwendung einer großen Anzahl von Mock-Katalogen, die aus Simulationen konstruiert werden, gilt als der zuverlässigste Ansatz für die Schätzung der Kovarianzmatrix. Die Durchführung einer großen Anzahl von vollständigen kosmologischen Simulationen ist jedoch mit einem hohen Rechenaufwand verbunden. Der erste Teil der Arbeit beschreibt einen gründlichen Vergleich von Kovarianzmatrizen, die mit sieben unterschiedlichen approximativen Methoden zur gravitativen Strukturbildung hergeleitet werden. Das umfasst prädiktive Methoden, die die Entwicklung des Dichtefelds der dunklen Materie deterministisch vorhersagen (COLA, Peak Patch, PINOCCHIO), Methoden, die eine vorherige Kalibrierung mit vollständigen N-Körpersimulationen (PATCHY und HALOGEN) erfordern, und zwei einfachere Verfahren, die auf der Annahme einer log-normalen oder normalen Wahrscheinlichkeitsdichtefunktion des Dichtefelds der Dunklen Materie basieren. Der Vergleich bezieht sich auf Messungen der anisotropen Zwei-Punkt-Korrelationsfunktion, eines der erfolgreichsten und am weitesten verbreiteten Mittel für die statistische Analyse des Galaxy Clustering. Die mit den approximativen Methoden erhaltenen Kovarianmatrizen werden mit Referenz-Kovarianzmatrizen verglichen, die aus einem Satz kosmologischer N-Körpersimulationen hergeleitet werden. Insbesondere wird untersucht, wie geeignet die Kovarianzmatrizen sind, die mithilfe der approximativen Methoden geschätzt worden sind, um die Parameterbestimmung basierend auf den Referenz-Kovarianzmatrizen aus N-Körpersimulationen zu reproduzieren. Die Ergebnisse zeigen, dass alle approximativen Methoden die Referenzergebnisse mit einer Genauigkeit von 5% für unsere untere Massenschwelle und von 10% für unsere obere Massenschwelle der Dunkle-Materie-Halos nachbilden können, ohne dass eine Methode signifikant besser ist als die anderen. Gegenstand des zweiten Teils der Arbeit ist ein mögliches Verfahren zur Gewinnung kosmologischer Information aus der Galaxienverteilung, das über Zwei-Punkt-Statistiken hinausgeht. Dazu werden Minkowski-Funktionale untersucht, die die Geometrie und Topologie des kosmischen Dichtefelds charakterisieren und komprimierte Informationen von Korrelationen höherer Ordnung enthalten. Der erste Schritt ist die Implementierung einer robusten und genauen Methode zur Schätzung der Minkowski-Funktionale von dreidimensionalen Punktverteilungen, insbesondere aus Simulationen mit periodischen Randbedingungen. Der daraus resultierende Code mit dem Namen MEDUSA berechnet die Minkowski-Funktionale von triangulierten Oberflächen gleicher Dichte, die aus der Delaunay-Tessellation der Eingabepunktmenge konstruiert werden. Nach der gründlichen Validierung des Codes mit Testpunktmengen folgt die Anwendung auf synthetische Kataloge aus verschiedenen N-Körpersimulationen. Die aus den Katalogen berechneten Minkowski-Funktionale weisen klare Abweichungen von den Vorhersagen für ein Gaußsches Dichtefeld auf. Dies ist aufgrund der nichtlinearen Gravitationsentwicklung des Dichtefelds zu erwarten, die zu Korrelationen höherer Ordnung in der Galaxienverteilung führt. Die Analyse der im Rotverschiebungsraum gemessenen Minkowski-Funktionale zeigt, dass die Rotverschiebungsraum-Verzerrungen die Schätzung der Minkowski-Funktionale signifikant beeinflusst. Der Effekt der Verzerrungen kann jedoch erheblich verringert werden, wenn die Messungen als Funktion des Anteils des ausgefüllten Volumens anstelle der Dichteschwelle ausgedrückt werden. Auch die Alcock-Paczynski(AP)-Verzerrungen beeinflussen die Messungen der Minkowski-Funktionale. Ihr Effekt kann modelliert werden, indem die Messungen mit geeigneten Potenzen des isotropen AP-Parameters q skaliert werden, der von der volumengemittelten Distanz D_V(z) abhängt. Die außerdiagonalen Elemente der Kovarianzmatrix der Minkowski-Funktionale sind zum Teil stark korreliert, und müssen daher für zukünftige Analysen berücksichtigt werden. Schließlich wird ein neuartiger Ansatz getestet, genannt Evolution Mapping, um die Abhängigkeit der Minkowski-Funktionale von den kosmologischen Parametern zu beschreiben, die die Entwicklung des linearen Wachstumsfaktors mit der Rotverschiebung beeinflussen. Die zugrundeliegende Idee besteht darin, den Einfluss dieser Parameter anhand von σ_12, der Dispersion des über Kugeln mit einem Radius von 12 Mpc gemittelten, linear nach heute extrapolierten Dichtekontrastes, zu charakterisieren. Die Analyse zeigt, dass dieser Ansatz für die Minkowski-Funktionale mit hoher Genauigkeit gültig ist und als Ausgangspunkt für die Entwicklung eines simulationsbasierten Modells für die Minkowski-Funktionale von Nicht-Gaußschen-Dichtefeldern dienen kann.
cosmology, large-scale structure
Lippich Golobart, Martha
2021
English
Universitätsbibliothek der Ludwig-Maximilians-Universität München
Lippich Golobart, Martha (2021): On unbiased and higher-order large-scale structure statistics: Covariance Matrices and Minkowski Functionals. Dissertation, LMU München: Faculty of Physics
[img]
Preview
PDF
Lippich_Martha.pdf

7MB

Abstract

The study of the large-scale galaxy clustering has significantly contributed to our present-day understanding of the composition and the evolution of our Universe. The upcoming generation of galaxy redshift surveys will open the opportunity to further probe our standard cosmological model and its possible extensions by measuring the cosmic expansion and growth of structure histories to unprecedented precision. This thesis aims to provide new insights into the challenges of capturing the information encoded in the large-scale structure, which might be useful for future galaxy clustering analyses. The covariance matrix of the clustering measurements is an essential ingredient to derive unbiased constraints on cosmological parameters. Using large numbers of mock catalogues from simulations is considered the most reliable approach to estimate the covariance matrix. However, running large numbers of full cosmological simulations is computationally very expensive. The first part of the thesis presents a detailed comparison of the covariance matrices inferred from seven state-of-the-art approximate methods for gravitational structure formation. These include predictive methods that follow the evolution of the underlying matter density field deterministically (COLA, Peak Patch, PINOCCHIO), methods that require a prior calibration with full N-body simulations (PATCHY and HALOGEN), and two simpler recipes based on assuming log-normal or Gaussian shapes of the full density probability distribution function. The comparison focuses on measurements of the anisotropic two-point correlation function, one of the most successful and widespread tools for the statistical analysis of galaxy clustering. We compare the covariance estimates obtained from the approximate methods against reference covariances inferred from a set of cosmological N-body simulations. In particular, we examine the performance of the covariance matrices from the approximate methods at reproducing parameter constraints from the analysis based on the N-body simulations. Our results show that all approximate methods can recover the results from the N-body simulations with an accuracy of 5% for our lower halo mass threshold, and of 10% for our higher halo mass threshold, with no method clearly outperforming the others. With the goal of extracting information beyond two-point statistics, the second part of the thesis considers Minkowski functionals, which characterize the geometry and topology of the cosmic density field and contain compressed higher-order information. In this context, we implement a robust and accurate method for estimating the Minkowski functionals of three-dimensional point distributions, in particular of samples from simulations with periodic boundary conditions. The resulting code, dubbed MEDUSA, computes the Minkowski functionals of triangulated isodensity surfaces that are constructed from the Delaunay tessellation of the input point sample. After the thorough validation of the code on test samples, we apply it to synthetic catalogues from different N-body simulations. The resulting Minkowski functionals exhibit clear non-Gaussian signatures. These are expected due to the non-linear gravitational evolution of the density field, which leads to higher-order correlations in the galaxy distribution. The analysis of the Minkowski functionals measured in redshift space indicates that the redshift-space distortions significantly change the Minkowski functional estimates, but their impact is considerably reduced if the measurements are expressed as a function of the volume-filling fraction instead of the density threshold. The Minkowski functional measurements are also sensitive to Alcock-Paczynski (AP) distortions. Their effect can be modelled by scaling the measurements with suitable powers of the isotropic AP parameter q, which depends on the volume-averaged distance D_V(z). The covariance matrix of the Minkowski functional measurements has significant off-diagonal structure, which needs to be taken into account for future analyses. Finally, we test a novel approach to describe the cosmology dependence of the Minkowski functionals, dubbed evolution mapping, in which the impact of a large number of cosmological parameters that affect the redshift evolution of the linear growth factor is characterized by the value of σ_12, the linear-theory rms mass fluctuation in spheres of radius 12 Mpc. Our analysis shows that this approach is valid for the Minkowski functionals with high accuracy and can serve as a starting point to develop a simulation-based model for the Minkowski functionals of non-Gaussian density fields.

Abstract

Die Untersuchung der großräumigen Verteilung von Galaxien hat wesentlich zu unserem heutigen Verständnis von der Zusammensetzung und der Entwicklung unseres Universums beigetragen. Die kommende Generation von Galaxien-Durchmusterungen wird es uns ermöglichen, die kosmische Expansionsgeschichte und das Strukturwachstum mit bislang unerreichter Präzision zu messen, und dadurch das kosmologische Standardmodell und seine möglichen Erweiterungen noch genauer zu erforschen. Ziel dieser Arbeit ist es neue Einblicke in Verfahren für die Gewinnung kosmologischer Information aus der großräumigen Struktur zu gewähren, die für zukünftige Analysen der "Klumpungseigenschaften" von Galaxien (Galaxy Clustering) von Nutzen sein könnten. Die Kovarianzmatrix von Clustering-Messungen ist ein wesentlicher Bestandteil von Analysen, der Voraussetzung für die unverfälschte Bestimmung kosmologischer Parameter ist. Die Verwendung einer großen Anzahl von Mock-Katalogen, die aus Simulationen konstruiert werden, gilt als der zuverlässigste Ansatz für die Schätzung der Kovarianzmatrix. Die Durchführung einer großen Anzahl von vollständigen kosmologischen Simulationen ist jedoch mit einem hohen Rechenaufwand verbunden. Der erste Teil der Arbeit beschreibt einen gründlichen Vergleich von Kovarianzmatrizen, die mit sieben unterschiedlichen approximativen Methoden zur gravitativen Strukturbildung hergeleitet werden. Das umfasst prädiktive Methoden, die die Entwicklung des Dichtefelds der dunklen Materie deterministisch vorhersagen (COLA, Peak Patch, PINOCCHIO), Methoden, die eine vorherige Kalibrierung mit vollständigen N-Körpersimulationen (PATCHY und HALOGEN) erfordern, und zwei einfachere Verfahren, die auf der Annahme einer log-normalen oder normalen Wahrscheinlichkeitsdichtefunktion des Dichtefelds der Dunklen Materie basieren. Der Vergleich bezieht sich auf Messungen der anisotropen Zwei-Punkt-Korrelationsfunktion, eines der erfolgreichsten und am weitesten verbreiteten Mittel für die statistische Analyse des Galaxy Clustering. Die mit den approximativen Methoden erhaltenen Kovarianmatrizen werden mit Referenz-Kovarianzmatrizen verglichen, die aus einem Satz kosmologischer N-Körpersimulationen hergeleitet werden. Insbesondere wird untersucht, wie geeignet die Kovarianzmatrizen sind, die mithilfe der approximativen Methoden geschätzt worden sind, um die Parameterbestimmung basierend auf den Referenz-Kovarianzmatrizen aus N-Körpersimulationen zu reproduzieren. Die Ergebnisse zeigen, dass alle approximativen Methoden die Referenzergebnisse mit einer Genauigkeit von 5% für unsere untere Massenschwelle und von 10% für unsere obere Massenschwelle der Dunkle-Materie-Halos nachbilden können, ohne dass eine Methode signifikant besser ist als die anderen. Gegenstand des zweiten Teils der Arbeit ist ein mögliches Verfahren zur Gewinnung kosmologischer Information aus der Galaxienverteilung, das über Zwei-Punkt-Statistiken hinausgeht. Dazu werden Minkowski-Funktionale untersucht, die die Geometrie und Topologie des kosmischen Dichtefelds charakterisieren und komprimierte Informationen von Korrelationen höherer Ordnung enthalten. Der erste Schritt ist die Implementierung einer robusten und genauen Methode zur Schätzung der Minkowski-Funktionale von dreidimensionalen Punktverteilungen, insbesondere aus Simulationen mit periodischen Randbedingungen. Der daraus resultierende Code mit dem Namen MEDUSA berechnet die Minkowski-Funktionale von triangulierten Oberflächen gleicher Dichte, die aus der Delaunay-Tessellation der Eingabepunktmenge konstruiert werden. Nach der gründlichen Validierung des Codes mit Testpunktmengen folgt die Anwendung auf synthetische Kataloge aus verschiedenen N-Körpersimulationen. Die aus den Katalogen berechneten Minkowski-Funktionale weisen klare Abweichungen von den Vorhersagen für ein Gaußsches Dichtefeld auf. Dies ist aufgrund der nichtlinearen Gravitationsentwicklung des Dichtefelds zu erwarten, die zu Korrelationen höherer Ordnung in der Galaxienverteilung führt. Die Analyse der im Rotverschiebungsraum gemessenen Minkowski-Funktionale zeigt, dass die Rotverschiebungsraum-Verzerrungen die Schätzung der Minkowski-Funktionale signifikant beeinflusst. Der Effekt der Verzerrungen kann jedoch erheblich verringert werden, wenn die Messungen als Funktion des Anteils des ausgefüllten Volumens anstelle der Dichteschwelle ausgedrückt werden. Auch die Alcock-Paczynski(AP)-Verzerrungen beeinflussen die Messungen der Minkowski-Funktionale. Ihr Effekt kann modelliert werden, indem die Messungen mit geeigneten Potenzen des isotropen AP-Parameters q skaliert werden, der von der volumengemittelten Distanz D_V(z) abhängt. Die außerdiagonalen Elemente der Kovarianzmatrix der Minkowski-Funktionale sind zum Teil stark korreliert, und müssen daher für zukünftige Analysen berücksichtigt werden. Schließlich wird ein neuartiger Ansatz getestet, genannt Evolution Mapping, um die Abhängigkeit der Minkowski-Funktionale von den kosmologischen Parametern zu beschreiben, die die Entwicklung des linearen Wachstumsfaktors mit der Rotverschiebung beeinflussen. Die zugrundeliegende Idee besteht darin, den Einfluss dieser Parameter anhand von σ_12, der Dispersion des über Kugeln mit einem Radius von 12 Mpc gemittelten, linear nach heute extrapolierten Dichtekontrastes, zu charakterisieren. Die Analyse zeigt, dass dieser Ansatz für die Minkowski-Funktionale mit hoher Genauigkeit gültig ist und als Ausgangspunkt für die Entwicklung eines simulationsbasierten Modells für die Minkowski-Funktionale von Nicht-Gaußschen-Dichtefeldern dienen kann.