Logo Logo
Help
Contact
Switch language to German
Local Smoothing Methods for the Analysis of Multivariate Complex Data Structures
Local Smoothing Methods for the Analysis of Multivariate Complex Data Structures
Local smoothing methods are a widely used tool in the context of nonparametric regression. The essential idea is to perform a linear or polynomial regression locally in a neighborhood of the target point. This method is generalized in two ways. Firstly, the polynomials are substituted by arbitrary smooth basis functions, and secondly, the estimating methodology, which is based on the least squares method, is modified in a suitable way. It appears that the first concept is useful for bias reduction, while the second one is interesting for robustifcation against outliers in the predictors. As by-products some interesting relations to other mathematical and statistical topics are unveiled, concerning in particular the theorems from Taylor and Horvitz-Thompson. In the further course of the thesis the interest turns to some particular problems which have not been a domain of local methods so far. It turns out that local smoothing methods, suitably combined, are useful for the online monitoring of time series in order to detect sudden breaks or jumps. Finally, the restriction of modelling only functional data is abandoned and a new approach to calculate principal curves, i.e. smooth curves which pass through the ``middle'' of a multidimensional, possibly multiply branched, data cloud, is developed., Ein weitverbreiteter Ansatz zur Lösung nichtparametrischer Regressionsprobleme besteht darin, eine Gerade oder ein Polynom lokal - d.h. nur in einer bestimmten Umgebung des jeweils interessierenden Punktes - an die Daten anzupassen. Diese Arbeit widmet sich zunächst der Frage, wie die bestehenden Konzepte verallgemeinert, und damit, wenn möglich, auch verbessert werden können. Der Schwerpunkt liegt hierbei auf Generalisierungen in zwei Richtungen: Einerseits werden die Polynome durch geeignete glatte allgemeine Basisfunktionen ersetzt, und andererseits wird der Schätzmechanismus, der auf der Kleinste-Quadrate-Methode beruht, geeignet modifiziert. Wie sich zeigt, ist ersteres Konzept vornehmlich zur Bias- Reduktion interessant, wohingegen letzteres vor allem unter dem Gesichtspunkt der Ausreißer-Robustheit sinnvoll einsetzbar ist. Es ergeben sich hierbei interessante Parallelverbindungen zu anderen Gebieten der Mathematik und Statistik, insbesondere zu den bekannten Sätzen von Taylor und Horvitz-Thompson. Im weiteren Verlauf der Arbeit werden lokale Ansätze für bestimmte Problemstellungen herangezogen, für die sie bisher wenig beachtet wurden. Es stellt sich heraus, dass lokale Glättungsmethoden, geeignet kombiniert, sinnvoll für das Online-Monitoring anwendbar sind, d.h. zur Echtzeitüberwachung von Zeitreihen hinsichtlich plötzlicher Strukturbrüche. Zum Ende wird der bisherige Rahmen des funktionalen Zusammenhangs zwischen abhängigen und unabhängigen Variablen verlassen und ein lokaler Ansatz zur Berechnung glatter Kurven durch die ``Mitte'' einer mehrdimensionalen, möglicherweise verzweigten, Datenwolke entwickelt.
Local smoothing, data-adaptive basis functions, outlying predictors, online monitoring, local principal curves
Einbeck, Jochen
2003
English
Universitätsbibliothek der Ludwig-Maximilians-Universität München
Einbeck, Jochen (2003): Local Smoothing Methods for the Analysis of Multivariate Complex Data Structures. Dissertation, LMU München: Faculty of Mathematics, Computer Science and Statistics
[thumbnail of Einbeck_Jochen.pdf]
Preview
PDF
Einbeck_Jochen.pdf

2MB

Abstract

Local smoothing methods are a widely used tool in the context of nonparametric regression. The essential idea is to perform a linear or polynomial regression locally in a neighborhood of the target point. This method is generalized in two ways. Firstly, the polynomials are substituted by arbitrary smooth basis functions, and secondly, the estimating methodology, which is based on the least squares method, is modified in a suitable way. It appears that the first concept is useful for bias reduction, while the second one is interesting for robustifcation against outliers in the predictors. As by-products some interesting relations to other mathematical and statistical topics are unveiled, concerning in particular the theorems from Taylor and Horvitz-Thompson. In the further course of the thesis the interest turns to some particular problems which have not been a domain of local methods so far. It turns out that local smoothing methods, suitably combined, are useful for the online monitoring of time series in order to detect sudden breaks or jumps. Finally, the restriction of modelling only functional data is abandoned and a new approach to calculate principal curves, i.e. smooth curves which pass through the ``middle'' of a multidimensional, possibly multiply branched, data cloud, is developed.

Abstract

Ein weitverbreiteter Ansatz zur Lösung nichtparametrischer Regressionsprobleme besteht darin, eine Gerade oder ein Polynom lokal - d.h. nur in einer bestimmten Umgebung des jeweils interessierenden Punktes - an die Daten anzupassen. Diese Arbeit widmet sich zunächst der Frage, wie die bestehenden Konzepte verallgemeinert, und damit, wenn möglich, auch verbessert werden können. Der Schwerpunkt liegt hierbei auf Generalisierungen in zwei Richtungen: Einerseits werden die Polynome durch geeignete glatte allgemeine Basisfunktionen ersetzt, und andererseits wird der Schätzmechanismus, der auf der Kleinste-Quadrate-Methode beruht, geeignet modifiziert. Wie sich zeigt, ist ersteres Konzept vornehmlich zur Bias- Reduktion interessant, wohingegen letzteres vor allem unter dem Gesichtspunkt der Ausreißer-Robustheit sinnvoll einsetzbar ist. Es ergeben sich hierbei interessante Parallelverbindungen zu anderen Gebieten der Mathematik und Statistik, insbesondere zu den bekannten Sätzen von Taylor und Horvitz-Thompson. Im weiteren Verlauf der Arbeit werden lokale Ansätze für bestimmte Problemstellungen herangezogen, für die sie bisher wenig beachtet wurden. Es stellt sich heraus, dass lokale Glättungsmethoden, geeignet kombiniert, sinnvoll für das Online-Monitoring anwendbar sind, d.h. zur Echtzeitüberwachung von Zeitreihen hinsichtlich plötzlicher Strukturbrüche. Zum Ende wird der bisherige Rahmen des funktionalen Zusammenhangs zwischen abhängigen und unabhängigen Variablen verlassen und ein lokaler Ansatz zur Berechnung glatter Kurven durch die ``Mitte'' einer mehrdimensionalen, möglicherweise verzweigten, Datenwolke entwickelt.