Resumen:
Dadas dos variables aleatorias independientes, X0 y X, que llamaremos de referencia y de comparación respectivamente, se define la variable relativa como R = F0(X), siendo Fo la función de distribución acumulada de la variable X0. Existe abundante bibliografía sobre métodos para estimar la densidad de una variable a partir de observaciones independientes. En esta tesis consideramos el problema de estimar la densidad de la variable R, llamada densidad relativa, a partir de muestras independientes, X0,1,...X0,n y X1,...Xm, de ambas poblaciones. Para ello construimos predictores de la variable relativa obtenidos a partir de un estimador de la función F0 calculada en observaciones de la variable X. El conocimiento de la densidad de R, nos permite representar las similitudes o diferencias entre las distribuciones de X y X0. Para estimar la densidad relativa hemos combinado dos estimadores de la función de distribución, la función de distribución empírica y un estimador suavizado de la núsma, con estimadores de la densidad basados en núcleos y basados en vecinos más cercanos con núcleos. Respecto de la elección del parámetro de suavizado hemos considerado la ventana óptima y distintos procedimientos de validación cruzada. Mediante un estudio de simulación, se estudió el comportamiento para muestras pequeñas de los estimadores de la densidad relativa propuestos. Como medida del error de estimación se consideró una aproximación del error cuadrático medio integrado. El estimador basado en núcleos utilizando una ventana de validación cruzada sesgada y el que utiliza la ventana óptima, son los procedimientos con el mejor comportamiento.
Abstract:
Let X0 and X be given independent random variables, called reference variable and comparison variable, respectively. The relative variable is defined by R = F0 (X), where F0 is the accumulated distribution function of the variable X0. There is an extense bibliography dedicated to the estimation of the density of a given variable from the knowledge of independent observations. In this thesis, we will deal with the question of estimating the density of the variable R, called relative density, from the knowledge of independent samples, X0,1,...X0,n y X1,...Xm of the two populations under consideration. To achieve this, we build predictors of the relative variable, obtained from an estimator of the function F0 calculated at observations of the variable X. Knowledge of the density of R provides a way to represent similitudes and differences between the distributions of X0 and X. To estimate the relative density, we have used two estimators of the distribution function, the empiric distribution function, and a smoothed estimator of it, with estimators based on kernels, and on nearest neighbours with kernels. Regarding the choice of the soothing parameter, we have considered the optimal window and several cross-validation proceedures. By performing a simulation study, we have studied the behaviour for small samples of the proposed estimators of relative density. Wehave measured the error of estimation through an approximation of the meanintegrated squared error. The best perfomance of the error corresponds to the kernel method with biased cross-validation window, and the optimal window procedure comes in the second place.