Logo Logo
Help
Contact
Switch language to German
Flexible Modellierung kategorialer Responsevariablen
Flexible Modellierung kategorialer Responsevariablen
Multicategorical regression models are an established tool in statistical data analysis. The present thesis extends common parametric regression models for nominal and ordinal responses to more flexible nonparametric approaches. In order to obtain a flexible form of the functional effects of metrically scaled covariates, expansions in basis functions are used. The resulting predictor allows parameter estimation within the framework of multivariate generalized linear models. Estimates are obtained by maximizing a penalized likelihood with discrete penalty terms restricting the variation of estimated smooth effects. As a result of theoretical considerations, P-Splines seem to be the ideal alternative for applying penalized basis function approaches. Based on this result, nonparametric extensions of the multinomial logit model for nominal and the cumulative logit model for ordinal responses are derived. An important feature of the proposed multinomial logit model is the distinction between global and category-specific variables. Variables of both types may enter the model in a linear form or as unspecified smooth functions. For cumulative logit models the penalization concept adopted from P-Splines is used to restrict category-specific parameters in adjacent categories. Penalization across response categories ensures availability of estimates when common estimation procedures fail to converge, so that tests for proportional odds may be performed even for critical settings. Additionally, penalties across response categories are taken into account as fixed methodical parts when fitting semiparametric partial proportional odds models., Mehrkategoriale Regressionsmodelle stellen ein etabliertes Instrumentarium in der statistischen Datenanalyse dar. Die vorliegende Arbeit behandelt die Erweiterung klassischer parametrischer Regressionsmodelle für nominal- und ordinal-kategoriale abhängige Variablen um flexible nonparametrische Strukturen. Unspezifiziert funktionale Effekte stetiger Kovariablen werden dabei mit Polynom-Splines approximiert, deren Repräsentation in entsprechenden Spline-Basen auf rein parametrische Prädiktorstrukturen führt. Die damit im Rahmen multivariater generalisierter linearer Modelle mögliche Parameterschätzung wird über die Maximierung einer penalisierten Likelihood realisiert, in der diskrete Strafterme die Variation der geschätzten funktionalen Effekte regulieren. Einleitende theoretische Betrachtungen zu penalisierten Basisfunktionsansätzen liefern Aussagen zur Äquivalenz der untersuchten Alternativen und qualifizieren P-Splines als die in diesem Kontext zu präferierende Kombination. Darauf basierend werden nonparametrische Erweiterungen des multinomialen Logit-Modells für nominalen und des kumulativen Logit-Modells für ordinalen Response analysiert. Im multinomialen Logit-Modell wird dabei explizit zwischen globalen Variablen und kategorienspezifischen Charakteristiken unterschieden, wobei Einflußgrößen beider Typen sowohl linear als auch unspezifiziert funktional berücksichtigt werden. Für kumulative Logit-Modelle mit nicht-globalen Effekten wird das den P-Splines entlehnte Penalisierungskonzept auf die kategorienspezifischen Parameter in benachbarten Responsekategorien übertragen. Kategorienübergreifende Penalties gewährleisten einerseits die Verfügbarkeit von Schätzungen in numerisch kritischen Fällen und ermöglichen damit die Durchführung von Tests auf das Vorliegen proportionaler Chancen. Darüber hinaus lassen sie sich als konzeptionelle Bestandteile in die Parameterschätzung in semiparametrischen Partial Proportional Odds Modellen integrieren.
Kategoriale Regression, semiparametrische Modellierung, P-Splines
Scholz, Torsten
2004
German
Universitätsbibliothek der Ludwig-Maximilians-Universität München
Scholz, Torsten (2004): Flexible Modellierung kategorialer Responsevariablen. Dissertation, LMU München: Faculty of Mathematics, Computer Science and Statistics
[thumbnail of Scholz_Torsten.pdf]
Preview
PDF
Scholz_Torsten.pdf

2MB

Abstract

Multicategorical regression models are an established tool in statistical data analysis. The present thesis extends common parametric regression models for nominal and ordinal responses to more flexible nonparametric approaches. In order to obtain a flexible form of the functional effects of metrically scaled covariates, expansions in basis functions are used. The resulting predictor allows parameter estimation within the framework of multivariate generalized linear models. Estimates are obtained by maximizing a penalized likelihood with discrete penalty terms restricting the variation of estimated smooth effects. As a result of theoretical considerations, P-Splines seem to be the ideal alternative for applying penalized basis function approaches. Based on this result, nonparametric extensions of the multinomial logit model for nominal and the cumulative logit model for ordinal responses are derived. An important feature of the proposed multinomial logit model is the distinction between global and category-specific variables. Variables of both types may enter the model in a linear form or as unspecified smooth functions. For cumulative logit models the penalization concept adopted from P-Splines is used to restrict category-specific parameters in adjacent categories. Penalization across response categories ensures availability of estimates when common estimation procedures fail to converge, so that tests for proportional odds may be performed even for critical settings. Additionally, penalties across response categories are taken into account as fixed methodical parts when fitting semiparametric partial proportional odds models.

Abstract

Mehrkategoriale Regressionsmodelle stellen ein etabliertes Instrumentarium in der statistischen Datenanalyse dar. Die vorliegende Arbeit behandelt die Erweiterung klassischer parametrischer Regressionsmodelle für nominal- und ordinal-kategoriale abhängige Variablen um flexible nonparametrische Strukturen. Unspezifiziert funktionale Effekte stetiger Kovariablen werden dabei mit Polynom-Splines approximiert, deren Repräsentation in entsprechenden Spline-Basen auf rein parametrische Prädiktorstrukturen führt. Die damit im Rahmen multivariater generalisierter linearer Modelle mögliche Parameterschätzung wird über die Maximierung einer penalisierten Likelihood realisiert, in der diskrete Strafterme die Variation der geschätzten funktionalen Effekte regulieren. Einleitende theoretische Betrachtungen zu penalisierten Basisfunktionsansätzen liefern Aussagen zur Äquivalenz der untersuchten Alternativen und qualifizieren P-Splines als die in diesem Kontext zu präferierende Kombination. Darauf basierend werden nonparametrische Erweiterungen des multinomialen Logit-Modells für nominalen und des kumulativen Logit-Modells für ordinalen Response analysiert. Im multinomialen Logit-Modell wird dabei explizit zwischen globalen Variablen und kategorienspezifischen Charakteristiken unterschieden, wobei Einflußgrößen beider Typen sowohl linear als auch unspezifiziert funktional berücksichtigt werden. Für kumulative Logit-Modelle mit nicht-globalen Effekten wird das den P-Splines entlehnte Penalisierungskonzept auf die kategorienspezifischen Parameter in benachbarten Responsekategorien übertragen. Kategorienübergreifende Penalties gewährleisten einerseits die Verfügbarkeit von Schätzungen in numerisch kritischen Fällen und ermöglichen damit die Durchführung von Tests auf das Vorliegen proportionaler Chancen. Darüber hinaus lassen sie sich als konzeptionelle Bestandteile in die Parameterschätzung in semiparametrischen Partial Proportional Odds Modellen integrieren.