Resumen: En esta tesis, introducimos una nueva clase de estimadores robustos para las componentes paramétricas y noparamétricas bajo dos modelos parcialmente lineales generalizados. En el primero, las observaciones independientes (yi, xi, ti), 1 = i = n satisfacen yi| (xi, ti) ~ F (·, µi) con µi = H (n(ti) + xti ß), para una función de distribución F y una función de vínculo H conocidas, donde ti e IR, xi e IR^p. La función n : IR --IR y el parámetro ß son las cantidades a estimar. Los estimadores robustos se basan en un procedimiento en dos pasos en el que valores grandes de la deviance o de los residuos de Pearson se controlan a través de una función de escores acotada. Los estimadores robustos de ß resultan ser n^1/2-consistentes y asintóticamente normales. El comportamiento de estos estimadores se compara con el de los estimadores clásicamente usados, a través de un estudio de Monte Carlo. Por otra parte, la función de influencia empírica permite estudiar la sensibilidad de los estimadores. El modelo generalizado parcialmente lineal de índice simple, generaliza el anterior pues las observaciones independientes son tales que yi| (xi, ti) ~ F (·, µi) con µi = H (n(a tti) + xtiß), donde ahora ti e IR^q, xi e IR^p y la función ß : IR -- IR y los parámetros ß y a (|| a|| =1) son desconocidos y se desean estimar. Introducimos dos familias de estimadores robustos que resultan ser consistentes y asintóticamente normales. Calculamos también su función de influencia empírica. Todas las propuestas dadas mejoran el comportamiento de los estimadores clásicos en presencia de observaciones atípicas.
Abstract: In this thesis, we introduce a new class of robust estimates for the parametric and nonparametric components under two generalized partially linear model. In the first one, the data (yi, xi, ti), (yi, xi, ti), 1 = i = n, are modeled by yi| (xi, ti) ~ F (·, µi) con µi = H (n(ti) + xti ß), for some known distribution function F and link function H, where ti e IR, xi e IR^p. The function n : IR--IR and the parameter ß are unknown and to be estimated. The robust estimators are based on a two step procedure, where large values of the deviance or Pearson residuals are bounded through a score function. It is shown that the estimates of ß are root-n consistent and asymptotically normal. Through a Monte Carlo study, we compare the performance of these estimators with that of the classical ones. Besides, through their empirical influence function we study the sensitivity of the estimators. The generalized partially linear single index model generalizes the previous one since the independent observations are such that yi| (xi, ti) ~ F (·, µi) con µi = H (n(a tti) + xtiß), where now ti e IR^q, xi e IR^p and ß : IR -- IR, ß y a (|| a|| =1) are the unknown parameters to be estimated. Two families of robust estimators are introduced which turn out to be consistent and asymptotically normally distributed. Their empirical influence function is also computed. The robust proposals improve the behavior of the classical ones when outliers are present.
Título :
Estimación robusta en modelos parcialmente lineales generalizados = Robust estimation in generalized partially linear models
Cita tipo Chicago: Rodríguez, Daniela A.. "Estimación robusta en modelos parcialmente lineales generalizados". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 2007. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_4240_Rodriguez.pdf
Resumen: En los últimos años, los métodos de estimación doble protegidos dieron lugar al desarrollo de propuestas múltiple protegidas. Diversos autores han presentado estimadores consistentes en más escenarios que los contemplados por los estimadores doble protegidos. Estas propuestas de estimación, lejos de construirse bajo una teoría general, son el resultado de procedimientos ad-hoc creados para cada modelo considerado. En este trabajo, desarrollamos un marco teórico que explica la existencia de estimadores múltiple protegidos en varias de las propuestas de estimación múltiple protegidas ya existentes, en modelos donde la verosimilitud se factoriza. Dicha teoría provee condiciones suficientes bajo las cuales es posible la construcción de ecuaciones de estimación que, bajo condiciones de regularidad, tienen soluciones que constituyen estimadores múltiple protegidos. Presentamos también condiciones suficientes bajo las cuales estimar de manera múltiple protegida ciertos parámetros de ruido, cuya estimación es necesaria para poder estimar de manera múltiple protegida al parámetro de interés. Además, aplicamos los métodos desarrollados para estimar en forma cuádruple protegida la componente lineal bajo un modelo de regresión parcialmente lineal con datos faltantes, ya que dicho modelo se inscribe en el marco de la teoría desarrollada. Incluimos también, los resultados de un estudio de Monte Carlo realizado bajo el modelo mencionado.
Abstract: In recent years, double robust procedures have led to the development of multiple robust approaches. Different authors have shown consistent estimators that confer even more protection than double robust estimators. These estimation proposals, far from being constructed under a general theory, are the result of ad-hoc procedures created for each model considered. In this work, we develop a theoretical framework that explains the existence of multiple robust estimators in many of the multiple robust procedures existing in factorized likelihood models. This theory provides sufficient conditions for the construction of multiple robust estimating equations for the parameter of interest. We also provide sufficient conditions under which it is possible to construct multiple robust estimators for certain parameters needed for the estimation of the parameter of interest. We apply this procedure to obtain a multiple robust estimator for the linear component under a partial lineal regression model with missing outcomes, since this model fits in the framework of the developed theory. Also, we present the results of a Monte Carlo simulation study performed under the same model.
Título :
Construcción de funciones de estimación múltiple protegidas en modelos con verosimilitud factorizada = Constructing multiple robust estimating functions in factorized likelihood models
Autor :
Molina, Fernanda Julieta
Director :
Rotnitzky, Andrea Sued, Mariela
Consejero de estudios :
Sued, Mariela
Jurados :
Bianco, Ana ; Forzani, Liliana ; Salibian-Barrera, Matías
Año :
2013
Editor :
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación :
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales Departamento de Matemática. Instituto de Cálculo (IC)
Grado obtenido :
Doctor de la Universidad de Buenos Aires en el área de Ciencias Matemáticas
Cita tipo APA: Molina, Fernanda Julieta . (2013). Construcción de funciones de estimación múltiple protegidas en modelos con verosimilitud factorizada. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_5546_Molina.pdf
Cita tipo Chicago: Molina, Fernanda Julieta. "Construcción de funciones de estimación múltiple protegidas en modelos con verosimilitud factorizada". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 2013. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_5546_Molina.pdf
Martínez, Alejandra Mercedes."Inferencia en modelos aditivos" (2014-03-11) Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Resumen: La inferencia estadística comúnmente utiliza modelos paramétricos y el supuesto es que las observaciones de la muestra pertenecen a una familia paramétrica conocida. En este caso, el problema consiste en estimar o hacer inferencia sobre los parámetros desconocidos, permitiendo llegar a conclusiones precisas cuando el modelo supuesto es cierto pero llevando posiblemente a conclusiones equivocadas cuando se aplica a un modelo ligeramente perturbado. Por esta razón, se han desarrollado modelos noparamétricos y semiparamétricos para analizar los datos. Recientemente, los modelos noparamétricos han ganado una importante atención en el estudio de fenómenos naturales con comportamiento de complejidad no lineal. Si bien estos modelos tienen menor precisión, están asociados con una alta estabilidad. En esta tesis nos enfocaremos en los modelos de regresión noparamétricos. Para los modelos de regresión noparamétricos multivariados, los estimadores de la función de regresión multivariada, tales como el estimador de Nadaraya–Watson, sufren de la bien conocida maldición de la dimensión, debido a que en entornos de radio fijo la cantidad de observaciones disminuye exponencialmente. Para evitar este problema, se introdujeron los modelos aditivos, que generalizan los modelos lineales, son de fácil interpretación y además resuelven la maldición de la dimensión. La mayoría de los procedimientos para estimar las componentes de un modelo aditivo se basan en promedios o polinomios locales usando ajustes por mínimos cuadrados. Por esta raz´on, tienen la desventaja de ser muy sensibles a la presencia de datos atípicos. Por otro lado, en muchas situaciones, sobre todo en estudios biomédicos, puede haber un conjunto de puntos del dise˜no con respuestas faltantes. En esta tesis, introducimos estimadores robustos basados en polinomios locales para resolver tanto la maldición de la dimensión, como la presencia de datos atípicos y así como también la existencia de respuestas faltantes. Estos estimadores están basados en un procedimiento de integración marginal adaptado a la situación de datos faltantes. Dichas propuestas resultaron ser consistentes y asintóticamente normalmente distribuidas bajo condiciones de regularidad. Además, se consideró una familia de estimadores robustos basados en el procedimiento de backfitting cuando no hay observaciones faltantes. Finalmente, se realizó un estudio de simulación para comparar el procedimiento de las propuestas bajo diferentes escenarios.
Abstract: Most commonly used models in statistical inference are parametric and the assumption is that the observations in the sample belong to a known parametric family. In this case, the problem consists in estimating or making inference on the unkown parameters, leading to accurate conclusions when the model is correct, but they can lead to wrong conclusions when they are applied to a slightly disturbed models. For this reason, nonparametric and semiparametric models have been developed for data analysis. Recently, nonparametric regression models have gain importance when studying natural phenomenons with non lineal complexity behaviour. Even though these models are less accurate, they are associated with high stability. In this thesis, we will focus on nonparametric regression models. For the nonparamatric multivariate regression models, estimators of the multivariate regression function, such as the Nadaraya–Watson estimator, suffer from the well–known curse of dimensionality, due to in fixed-radius neiborhoods the amount of observations decreases exponentially. To overcome this drawback, additive regression models have been introduced. They generalize linear models, are easily interpretable, and they also solve the problem of the curse of the dimensionality. Most methods to estimate the components under an additive model are based on local averages or local polynomials, being sensitive to outliers. On the other hand, in many applied statistical analysis, for example in many biological experiments, it can be part of the design points on which the responses are missing. In this thesis, we introduce robust estimators based on local polynomials to solve either the curse of dimensionality, the sensitivity to atypical observations and also the existence of missing responses. The estimators are based on marginal integration adapted to the missing situation. The proposed estimators turn out to be consistent and asymptotically normally distributed under mild assumptions. Besides, a family of robust estimators based on backfitting is also considered for the situation where no missing responses arise. A simulation study allows to compare the behaviour of our procedures, under different scenarios.
Título :
Inferencia en modelos aditivos = Inference in additive models
Resumen: Esta tesis consta de 2 partes que corresponden a los Capítulos 1 y 2. En el Capítulo 1 proponemos una familia de estimadores robustos para modelos lineales generalizados. En el Capítulo 2 se introduce una familia de estimadores robustos para distribuciones dependientes de un parámetro. Los estimadores definidos en el Capítulo 1 son M-estimadores redescendientes basados en transformaciones (MT-estimadores) y, más generalmente, M-estimadores pesados basados en transformaciones (WMT-estimadores). La idea principal es usar un M-estimador después de aplicar una función estabilizadora de la varianza a las respuestas. Mostramos la consistencia y la normalidad asintótica de estos estimadores. También calculamos una cota inferior para su punto de ruptura asintótico. Un estudio de Monte Carlo muestra que estos estimadores se comparan favorablemente con otros estimadores robustos para modelos lineales generalizados con respuesta Poisson y log link. Por último, consideramos un ejemplo de datos reales y comparamos el ajuste dado por el MT-estimador con los ajustes correspondientes a otros estimadores existentes. Los estimadores definidos en el Capítulo 2 son estimadores para datos univariados basados en la transformación integral de probabilidad (MI-estimadores). Estos estimadores tienen una definición simple y son muy simples de calcular. Mostramos la consistencia y normalidad asintótica de los mismos y hallamos cotas para su punto de ruptura asintótico. Estudiamos en especial el caso de la distribución de Poisson, en el que probamos que el punto de ruptura es óptimo. Para el caso de la distribución de Poisson realizamos un estudio de Monte Carlo para comparar el desempeño de estos estimadores con el de otros estimadores robustos para datos univariados.
Abstract: This thesis consists of two parts corresponding to Chapters 1 and 2. In Chapter 1 we propose a family of robust estimators for generalized linear models. In Chapter 2 we introduce a family of robust estimators for distributions that depend on a single parameter. The estimators defined in Chapter 1 are redescending M-estimators based on transformations (MT-estimators) and, more generally, weighted M-estimators based on transformations (WMT-estimators). The main idea is to use an Mestimator after applying a variance stabilizing function to the responses.We show the consistency and asymptotic normality of these estimators. We also compute a lower bound for their asymptotic breakdown point. A Monte Carlo study shows that these estimators compare favourably to other robust estimators for generalized linear models with Poisson response and log link. Finally, we consider an example of real data and compare the fit obtained using the MT-estimator to the fits corresponding to other existing estimators. The estimators defined in Chapter 2 are estimators for univariate data based on the probability integral transformation (MI-estimators). These estimators have a simple definition and are very easy to compute. We show their consistency and asymptotic normality and find bounds for their asymptotic breakdown point. We study in particular the case of the Poisson distribution, in which we prove that the breakdown point is optimum. For the case of the Poisson distribution we perform a Monte Carlo study to compare the performance of MI-estimators to that of other robust estimators for univariate data.
Título :
Métodos robustos basados en transformaciones con aplicaciones al modelo lineal generalizado = Robust methods based on transformations with applications to general linear models
Autor :
Valdora, Marina Silvia
Director :
Yohai, Víctor
Consejero de estudios :
Yohai, Víctor
Jurados :
Boente Boente, Graciela ; Forzani, Liliana ; Mayo Iscar, Agustín
Año :
2014-09-02
Editor :
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación :
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales Departamento de Matemática. Instituto de cálculo
Grado obtenido :
Doctor de la Universidad de Buenos Aires en el área de Ciencias Matemáticas
Cita tipo APA: Valdora, Marina Silvia . (2014-09-02). Métodos robustos basados en transformaciones con aplicaciones al modelo lineal generalizado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_5575_Valdora.pdf
Cita tipo Chicago: Valdora, Marina Silvia. "Métodos robustos basados en transformaciones con aplicaciones al modelo lineal generalizado". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 2014-09-02. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_5575_Valdora.pdf
Resumen: En diversas aplicaciones, resulta de interés poder medir la asociación entre dos características que se observan sobre los individuos de una población. Por otra parte, muchas veces estas características se registran sobre un período de tiempo o corresponden a imágenes. Por esta razón, conviene considerarlos como realizaciones de un proceso estocástico en lugar de discretizarlos y estudiarlos como realizaciones de datos multivariados. Un método ampliamente utilizado para lograr este objetivo es el análisis de correlación canónica funcional. Leurgans et al. (1993) prueban que la extensión natural de los estimadores utilizados en el caso multivariado al funcional no resulta consistente para la primera correlación canónica. Por esta razón, dichos autores proponen estimadores que penalizan la rugosidad de las direcciones y prueban que resultan consistentes. Por otro lado, He et al. (2003) dan condiciones que garantizan la buena definición de las correlaciones y direcciones canónicas para elementos aleatorios (X; Y )^t a valores en el espacio de Hilbert L²(0, 1) x L² (0, 1). Los trabajos mencionados consideran como medida de asociación la correlación de Pearson. Sin embargo, es bien sabido, que esta medida es muy sensible a la presencia de datos atípicos. Con el fin de lidiar con este problema, en el caso multivariado, Branco et al. (2005) y Alfons et al. (2016) proponen estimadores utilizando un enfoque de projection-pursuit, es decir, maximizando funcionales de asociación robustos de proyecciones de los datos. En esta tesis, consideramos espacios de Hilbert separables H1 y H2 y elementos aleatorios (X, Y )^t Є H = H1 x H2 y medidas de asociación bivariadas robustas. Para mostrar que la extensión natural del caso multivariado al caso funcional falla cuando se utiliza la extensión de los estimadores de projection-pursuit de Branco et al. (2005) al caso funcional, extendemos el resultado de Leurgans et al. (1993) al caso de medidas de asociación generales. Por otra parte, para proponer estimadores robustos y consistentes consideramos un enfoque que combina projection-pursuit con el método de Sieves que aproxima el espacio infinito-dimensional H por subespacios de dimensión finita que crecen con el tamaño de muestra. Bajo condiciones de regularidad, obtenemos que los estimadores de las primeras direcciones y de la primera correlación canónica son consistentes al funcional asociado. Para identificar que representa dicho funcional, se muestra la consistencia Fisher de éstos cuando se utilizan medidas de asociación que cumplan ciertas condiciones. En particular, las medidas de correlación robustas de uso habitual permiten obtener estimadores consistentes a la cantidad de interés en el caso de procesos Gaussianos o de procesos elípticos. Mediante un estudio de simulación, se compara el comportamiento de los estimadores robustos con los estimadores basados en la correlación de Pearson, para muestras finitas Gaussianas y contaminadas. Se proponen asimismo un procedimiento de convalidación cruzada robusta para elegir las dimensiones de los subespacios aproximantes y métodos para la detección de datos atípicos. Finalmente, se ilustra en un conjunto de datos reales las ventajas de los estimadores robustos ya que permiten identificar los datos atípicos y proveen estimaciones confiables.
Abstract: In many applications, measuring the association between two individual features is an important issue. Besides, in many practical situations data are recorded over a period of time or may correspond to images. In these situations, it is preferable to consider them as samples of an stochastic process instead of working with the discretized trajectories as multivariate data samples. A technique widely used to study the dependence between the two functions recorded for a sample of subjects is the functional canonical correlation analysis. Leurgans et al. (1993) demonstrated the need for regularization in functional canonical correlation analysis, since the natural extension of the multivariate estimators are not consistent. Leurgans et al. (1993) also derived the consistency of the estimators obtained penalizing the roughness. These results are complemented with those obtained in He et al. (2003) who provide conditions ensuring the existence and proper definition of the canonical directions and correlations when the random element belongs to L² (0, 1) x L² (0; 1). The aforementioned papers consider as association measure the Pearson correlation. However, it is well known that the Pearson correlation is not robust, being sensitive to outliers and this sensitivity is inherited by the canonical directions and correlations. In the multivariate case, a robust approach was given by Branco et al. (2005) and Alfons et al. (2016) who proposed estimators using projection-pursuit, that is, maximizing a robust bivariate association measure over the projected data. In this thesis, we consider separable Hilbert spaces H1 and H2 and random elements (X, Y ) Є H = H1 x H2 as well as robust bivariate measures of association. To show that the natural extension from the multivariate case to the functional case fails when using the projection-pursuit estimators of Branco et al. (2005), we generalize the result of Leurgans et al. (1993) to the case of general measures of association. On the other hand, to obtain robust and consistent estimators in a functional framework, we consider an approach that com6 bines projection-pursuit with Sieves which approximate the infinite-dimensional space H by means of finite-dimensional linear spaces growing with the sample size. Under regularity conditions, consistency results for the first canonical correlation and directions are derived. An important point to highlight is what the functional related to the proposed estimators represent, at least in some situations. For that purpose, Fisher consistency is obtained when the bivariate measure of association may be transformed to a Fisher-consistent bivariate association functional. In particular, the usual robust correlations allow to obtain consistent estimators of the quantities of interest when (X, Y )^t is a Gaussian or an elliptical process. Through a simulation study, we compare the performance of the robust proposals with the estimators based on the Pearson correlation, for clean and contaminated data. Furthermore, a robust cross-validation procedure is also proposed to select the dimension of the approximating linear spaces and outlier detection rules are studied. Finally, we illustrate on a real data set the advantages of the robust estimators which allow identify outliers and provide reliable estimates.
Título :
Métodos robustos en correlación canónica funcional = Robust inference in functional canonical correlation
Biblioteca Central Dr. Luis Federico Leloir - Facultad de Ciencias Exactas y Naturales - Universidad de Buenos Aires
Intendente Güiraldes 2160 - Ciudad Universitaria - Pabellón II - C1428EGA - Tel. (54 11) 4789-9293 int 34