Resumen: Los datos provenientes de un sistema de iluminación por radiación coherente, como lo son los datos de radar de apertura sintética - SAR (Synthetic Aperture Radar), pueden modelarse con el modelo multiplicativo. Este modelo es muy conveniente para explicar las características estadísticas de estos datos. El retorno multilook en formato amplitud se modela como una variable aleatoria que es el producto de otras dos variables aleatorias independientes. Estas variables aleatorias corresponden al backscatter y al ruido speckle. El modelo para el segundo, para el formato aquí considerado, es universalmente aceptado como la distribución Raiz Cuadrada de Gamma. Por otro lado, el modelo a utilizar para el backscatter solamente dependerá, idealmente, de algunos parámetros que representarán la información disponible a cerca de la rugosidad y de la textura de la imagen. Se pueden utilizar diferentes distribuciones para modelar el backscatter. Esta elección dependerá del grado de homogeneidad presente en las imágenes. Las distribuciones K han sido muy utilizadas para modelar datos que han sido generados por un sistema de iluminación coherente, en particular para imágenes SAR . El modelo multiplicativo clásico postula que el retorno en amplitud de áreas no homogéneas obedece un tipo de distribución K llamado KA. Si el área es homogénea la distribución Γ½ modelará bien los datos y, por ser ésta un caso particular de la anterior, se preserva la validez del modelo KA. Sin embargo, las distribuciones KA no modelan bien los datos provenientes de áreas muy heterogéneas. Se ha propuesto el uso de las llamadas distribuciones Gº, para el modelado de áreas extremamente heterogéneas. En este trabajo se estudia la factibilidad de substituir la distribución KA por la distribución GºA en el ajuste de datos. Con este fin se propondrá una aproximación entre ambas distribuciones. Se verificará que la aproximación de la distribución KA por la distribución GºA tiene sentido práctico, concluyendo que se debe adoptar como verdadero modelo a la distribución GºA.
Título :
La distribución G0A en el modelado y análisis de imágenes de radar de apertura sintética
Autor :
Mejail, Marta Estela
Director :
Frery, Alejandro C.
Jurados :
Yohai, V. ; Mashall, G. ; Frulla, L.
Año :
1999
Editor :
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación :
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales Departamento de Computación
Cita tipo APA: Mejail, Marta Estela . (1999). La distribución G0A en el modelado y análisis de imágenes de radar de apertura sintética. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_3188_Mejail.pdf
Cita tipo Chicago: Mejail, Marta Estela. "La distribución G0A en el modelado y análisis de imágenes de radar de apertura sintética". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 1999. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_3188_Mejail.pdf
Cita tipo APA: Ruedin, Ana María Clara . (2003). Multiwavelets no separables : construcción y aplicaciones para el procesamiento de imágenes. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_3558_Ruedin.pdf
Cita tipo Chicago: Ruedin, Ana María Clara. "Multiwavelets no separables : construcción y aplicaciones para el procesamiento de imágenes". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 2003. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_3558_Ruedin.pdf
Resumen: En esta tesis se deriva una nueva distribución polarimétrica para datos de radar de apertura sintética (Synthetic Aperture Radar - SAR). Esta distribución se basa en el uso del modelo multiplicativo, suponiendo una ley Wishart compleja multivariada para el speckle y la ley gaussiana inversa para el backscatter. Con esta propuesta se obtiene la distribución harmónica polarimétrica y, como caso particular, las distribuciones harmónicas para datos de intensidad y de amplitud. Se calculan los estimadores para los parámetros que indexan estas distribuciones por el método de los momentos. Se muestra que la extracción de estos parámetros como características es una forma de aumentar la información y el poder de discriminación en el problema de clasificación de imágenes SAR.
Abstract: This thesis presents the derivation of a new distribution for polarimetric Synthetic Aperture Radar (SAR) imagery. This distribution is based on the multiplicative model, assuming a multivariate complex Wishart law for the speckle and an inverse gaussian law for the backscatter. With this proposal, the harmonic polarimetric distribution and the harmonic distributions for intensity and amplitude data are obtained. Moments-based estimators for the parameters that index these distributions are derived and assessed. It is shown that the extraction of these parameters as features is a way of augmenting the information content and the discriminating power in SAR image classification.
Título :
Nuevas familias de distribuciones polarimétricas para imágenes SAR = New families of polarimetric distributions for SAR images
Autor :
Jacobo Berlles, Julio C. A.
Director :
Frery Orgambide, Alejandro
Consejero de estudios :
Loiseau, Irene
Jurados :
Bustos, O. ; Martín, M. ; d’ Avila Mascarenhas, N.
Año :
2005
Editor :
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación :
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales Departamento de Computación
Grado obtenido :
Doctor de la Universidad de Buenos Aires en Ciencias de la Computación
Resumen: Las imágenes de Radar de Apertura Sintética (SAR), tanto monopolarizadas como polarimétricas, son de suma importancia en la comprensión y entendimiento del medio ambiente, porque a partir de ellas puede obtenerse información que ningún otro tipo de imágenes provee. Sin embargo, las imágenes SAR tienen la desventaja de que son muy difíciles de analizar e interpretar. Hallar el contorno de regiones es una tarea particularmente complicada en este tipo de imágenes, debido al ruido speckle que corrompe la imagen e impide encontrar los puntos de la frontera entre diferentes regiones. En esta tesis se presenta un nuevo enfoque en modelado, extracción de características, detección de bordes y segmentación de imágenes SAR, por medio del ajuste del contorno de regiones en la imagen. Comienza con una síntesis sobre las herramientas que utilizamos durante todo el trabajo: las imágenes SAR monopoloarizadas, la familia de distribuciones estadísticas G y las curvas B-Spline. Luego se introduce una serie de procedimientos para detección de bordes en imágenes SAR, basados en hallar puntos de borde entre regiones a lo largo de segmentos de recta estratégicamente dispuestos sobre la imagen. Estos algoritmos comienzan con el proceso de inicialización, que consiste en ubicar una curva B-Spline, y continúan con los métodos de detección que trabajan en un entorno de la misma. El objetivo de la inicialización es que los métodos tengan más rápida convergencia y menor costo computacional. Los métodos de contornos deformables fallan cuando el objeto de interés no es convexo, proponemos entonces un algoritmo que soluciona los problemas que dependen de la forma del objeto. Se exponen también dos métodos alternativos en la búsqueda de los puntos de borde: uno que utiliza difusión anisotrópica para suavizar el arreglo de estimaciones y otro basado en estimaciones de la dimensión fractal. Todos los métodos son evaluados y comparados. Finalmente se presenta un algoritmo de detección de bordes en imágenes SAR polarimétricas. La validez y eficiencia de los métodos presentados está rigurosamente confirmada por experimentaciones en imágenes sintéticas y reales.
Abstract: Synthetic Aperture Radar (SAR) images, both monopolarized and polarimetric, are a very important tool in the understanding of the environment, because they provide information no other sensor can provide. Nevertheless, these images have the disadvantage of being very difficult of analyzing and interpreting. Finding region contours is a particularly complicated task in this type of images, due to the speckle noise that degrades them and makes it difficult to find the border points between two regions. This thesis presents a new approach for modelling, feature extraction, boundary detection and segmentation in SAR images, using region contour fitting. We begin with a synthesis about the tools we will use throughout this work: monopolarized SAR images, the G family of statistical distributions and the B-Spline curves. After this, a series of procedures for boundary detection in SAR images, based on finding points on the frontier between two regions along straight lines conveniently placed on the image, is introduced. These algorithms begin with an initialization process that consists in placing a B-Spline curve, and continue with detection methods that operate in a neighborhood of it. The objective of the initialization is allow all methods to converge faster and with a lower computational cost. The deformable contour methods fail when the object of interest is not convex. We thus propose an algorithm that solves the problems that depend on the object’s shape. We also expose two alternative methods for the search of the border points: one that uses anisotropic diffussion for smoothing the array of estimates, and other based on fractal dimension estimates. All the methods are evaluated and compared. Finally, a border detection algorithm in polarimetric SAR images, is presented. The validity and efficiency of the presented methods is rigurously confirmed by experiments in synthetic and real SAR images.
Título :
Modelos de segmentación basados en regiones y contornos activos aplicados a imágenes de radar de apertura sintética
Autor :
Gambini, María Juliana
Director :
Mejail, Marta Estela
Consejero de estudios :
Mejail, Marta Estela
Jurados :
Lucini, M. ; Chávez, J. ; D’ Avila Mascarenhas, N.
Año :
2006
Editor :
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación :
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales Departamento de Computación
Grado obtenido :
Doctor de la Universidad de Buenos Aires en Ciencias de la Computación
Cita tipo APA: Gambini, María Juliana . (2006). Modelos de segmentación basados en regiones y contornos activos aplicados a imágenes de radar de apertura sintética. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_3966_Gambini.pdf
Cita tipo Chicago: Gambini, María Juliana. "Modelos de segmentación basados en regiones y contornos activos aplicados a imágenes de radar de apertura sintética". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 2006. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_3966_Gambini.pdf
Resumen: Las formas juegan un rol clave en nuestro sistema cognitivo: en la percepción de las formas yace el principio de la formación de conceptos. Siguiendo esta línea de pensamiento, la escuela de la Gestalt ha estudiado extensivamente la percep- ción de formas como el proceso de asir características estructurales encontradas o impuestas sobre el material de estímulo.En resumen, tenemos dos modelos de formas: pueden existir físicamente o ser un producto de nuestros procesos cogni- tivos. El primer grupo está compuesto por formas que pueden ser definidas extra- yendo los contornos de objetos sólidos. En este trabajo nos restringiremos al caso bidimensional. Decimos entonces que las formas del primer tipo son formas planares. Atacamos el problema de detectar y reconocer formas planares. Cier- tas restricciones teóricas y prácticas nos llevan a definir una forma planar como cualquier pedazo de línea de nivel de una imagen. Comenzamos por establecer que los métodos a contrario existentes para de- tectar líneas de nivel son usualmente muy restrictivos: una curva debe ser enter- amente saliente para ser detectada. Esto se encuentra en clara contradicción con la observación de que pedazos de líneas de nivel coinciden con los contornos de los objetos. Por lo tanto proponemos una modificación en la que el algoritmo de detección es relajado, permitiendo la detección de curvas parcialmente salientes. En un segundo acercamiento, estudiamos la interacción entre dos maneras diferentes de determinar la prominencia de una línea de nivel. Proponemos un esquema para competición de características donde el contraste y la regularidad compiten entre ellos, resultando en que solamente las líneas de nivel contrastadas y regulares son consderedas salientes. Una tercera contribución es un algoritmo de limpieza que analiza líneas de nivel salientes, descartando los pedazos no salientes y conservando los salientes. Está basado en un algoritmo para detección de multisegmentos que fue extendido para trabajar con entradas periódicas. Finalmente, proponemos un descriptor de formas para codificar las formas detectadas, basado en el Shape Context global. Cada línea de nivel es codificada usando shape contexts, generando así un nuevo descriptor semi-local. A contin- uación adaptamos un algoritm
Abstract: Shape plays a key role in our cognitive system: in the perception of shape lies the beginning of concept formation. Following this lines of thought, the Gestalt school has extensively studied shape perception as the grasping of structural fea- tures found in or imposed upon the stimulus material. In summary, we have two models for shapes: they can exist physically or be a product of our cognitive pro- cesses. The first group is formed by shapes that can be defined by extracting contours from solid objects. In this work we will restrict ourselves to the two dimensional case. Therefore we say that these shapes of the first type are planar shapes. We ad- dress the problem of detecting and recognizing planar shapes. A few theoretical and practical restrictions lead us to define a planar shape as any piece of mean- ingful level line of an image. We begin by stating that previous a contrario methods to detect level lines are often too restrictive: a curve must be entirely salient to be detected. This is clearly in contradiction with the observation that pieces to level lines coincide with object boundaries. Therefore we propose a modification in which the detection criterion is relaxed by permitting the detection of partially salient level lines. As a second approach, we study the interaction between two different ways of determining level line saliency: contrast and regularity. We propose a scheme for feature competition where contrast and regularity contend with each other, resulting in that only contrasted and regular level lines are considered salient. A third contribution is a clean-up algorithm that analyses salient level lines, discarding the non-salient pieces and returning the salient ones. It is based on an algorithm for multisegment detection, which was extended to work with periodic inputs. Finally, we propose a shape descriptor to encode the detected shapes, based on the global Shape Context. Each level line is encoded using shape contexts, thus generating a new semi-local descriptor. We then adapt an existing a contrario shape matching algorithm to our particular case. The second group is composed by shapes that do not correspond to a solid object but are formed by integrating several solid objects. The simplest shapes in this group are arrangements of points in two dimensions. Clustering techniques might be helpful in these situations. In a seminal work from 1971, Zahn faced the problem of finding perceptual clusters according to the proximity gestalt and proposed three basic principles for clustering algorithms: (1) only inter-point distances matter, (2) stable results across executions and (3) independence from the exploration strategy. A last implicit requirement is crucial: clusters may have arbitrary shapes and detection algorithms must be capable of dealing with this. In this part we will focus on designing clustering methods that completely fulfils the aforementioned requirements and that impose minimal assumptions on the data to be clustered. We begin by assessing the problem of validating clusters in a hierarchical struc- ture. Based on nonparametric density estimation methods, we propose to com- pute the saliency of a given cluster. Then, it is possible to select the most salient clusters in the hierarchy. In practice, the method shows a preference toward com- pact clusters and we propose a simple heuristic to correct this issue. In general, graph-based hierarchical methods require to first compute the com- plete graph of interpoint distances. For this reason, hierarchical methods are often considered slow. The most usually used, and the fastest hierarchical clustering al- gorithm is based on the Minimum Spanning Tree (MST). We therefore propose an algorithm to compute the MST while avoiding the intermediate step of computing the complete set of interpoint distances. Moreover, the algorithm can be fully par- allelized with ease. The algorithm exhibits good performance for low-dimensional datasets and allows for an approximate but robust solution for higher dimensions. Finally we propose a method to select clustered subtrees from the MST, by computing simple edge statistics. The method allows naturally to retrieve clus- ters with arbitrary shapes. It also works well in noisy situations, where noise is regarded as unclustered data, allowing to separate it from clustered data. We also show that the iterative application of the algorithm allows to solve a phenomenon called masking, where highly populated clusters avoid the detection less popu- lated ones.
Título :
Detectando agrupamientos y contornos: un estudio doble sobre representación de formas
Autor :
Tepper, Mariano
Director :
Almansa, Andrés Mejail, Marta
Jurados :
Randall, G. ; Piccone, A. ; Bruckstein, A.
Año :
2011
Editor :
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación :
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Grado obtenido :
Doctor de la Universidad de Buenos Aires en el área de Ciencias de la Computación
FORMAS; LINEAS DE NIVEL; AGRUPAMIENTOS; DETECCION A CONTRARIO; ARBOL GENERADOR MINIMO; SHAPES; LEVEL; CLUSTERS; A CONTRARIO DETECTION; MINIMUM SPANNING TREE
Cita tipo APA: Tepper, Mariano . (2011). Detectando agrupamientos y contornos: un estudio doble sobre representación de formas. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_4827_Tepper.pdf
Cita tipo Chicago: Tepper, Mariano. "Detectando agrupamientos y contornos: un estudio doble sobre representación de formas". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 2011. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_4827_Tepper.pdf
Resumen: En esta tesis se presentan nuevas técnicas de compresión sin pérdida tendientes a reducir el espacio de almacenamiento requerido por imágenes satelitales. Dos tipos principales de imágenes son tratadas: multiespectrales e hiperespectrales. En el caso de imágenes multiespectrales, se desarrolló un compresor no lineal que explota tanto las correlaciones intra como interbanda presentes en la imagen. Este se basa en la transformada wavelet de enteros a enteros y se aplica sobre bloques no solapados de la imagen. Diferentes modelos para las dependencias estadísticas de los coeficientes de detalle de la transformada wavelet son propuestos y analizados. Aquellos coeficientes que se encuentran en las subbandas de detalle fino de la transformada son modelados como una combinación afín de coeficientes vecinos y coeficientes en bandas adyacentes, sujetos a que se encuentren en la misma clase. Este modelo se utiliza para generar predicciones de otros coficientes que ya fueron codificados. La información de clase se genera mediante la cuantización LloydMax, la cual también se utiliza para predecir y como contextos de condicionamiento para codificar los errores de predicción con un codificador aritmético adaptativo. Dado que el ordenamiento de las bandas también afecta la precisión de las predicciones, un nuevo mecanismo de ordenamiento es propuesto basado en los coeficientes de detalle de los últimos dos niveles de la transformada wavelet. Los resultados obtenidos superan a los de otros compresores 2D sin pérdida como PNG, JPEG-LS, SPIHT y JPEG2000, como también a otros compresores 3D como SLSQ-OPT, JPEG-LS diferencial y JPEG2000 para imágenes a color y 3D-SPIHT. El método propuesto provee acceso aleatorio a partes de la imagen, y puede aplicarse para la compresión sin pérdida de otros datos volumétricos. Para las imágenes hiperespectrales, algoritmos como LUT o LAIS-LUT que revisten el estado del arte para la compresión sin pérdida para este tipo de imágenes, explotan la alta correlación espectral de estas imágenes y utilizan tablas de lookup para generar predicciones. A pesar de ello, existen casos donde las predicciones no son buenas. En esta tesis, se propone una modificación a estos algoritmos de lookup permitiendo diferentes niveles de confianza a las tablas de lookup en base a las variaciones locales del factor de escala. Los resultados obtenidos son altamente satisfactorios y mejores a los de LUT y LAIS-LUT. Se han diseñado dos compresores sin pérdida para dos tipos de imágenes satelitales, las cuales tienen distintas propiedades, a saber, diferente resolución espectral, espacial y radiométrica, y también de diferentes correlaciones espectrales y espaciales. En cada caso, el compresor explota estas propiedades para incrementar las tasas de compresión.
Abstract: In this thesis, new lossless compression techniques aiming at reducing the size of storage of satellite images are presented. Two type of images are considered: multispectral and hyperspectral. For multispectral images, a nonlinear lossless compressor that exploits both intraband and interband correlations is developed. The compressor is based on a wavelet transform that maps integers into integers, applied to tiles of the image. Different models for statistical dependencies of wavelet detail coefficients are proposed and analyzed. Wavelet coefficients belonging to the fine detail subbands are successfully modelled as an affine combination of neighboring coefficients and the coefficient at the same location in the previous band, as long as all these coefficients belong to the same landscape. This model is used to predict wavelet coefficients by means of already coded coefficients. Lloyd-Max quantization is used to extract class information, which is used in the prediction and later used as a conditioning context to encode prediction errors with an adaptive arithmetic coder. The band order affects the accuracy of predictions: a new mechanism is proposed for ordering the bands, based on the wavelet detail coefficients of the 2 finest levels. The results obtained outperform 2D lossless compressors such as PNG, JPEG-LS, SPIHT and JPEG2000 and other 3D lossless compressors such as SLSQ-OPT, differential JPEG-LS, JPEG2000 for color images and 3D-SPIHT. Our method has random access capability, and can be applied for lossless compression of other kinds of volumetric data. For hyperspectral images, state-of-the-art algorithms LUT and LAIS-LUT proposed for lossless compression, exploit high spectral correlations in these images, and use lookup tables to perform predictions. However, there are cases where their predictions are not accurate. In this thesis a modification based also on look-up tables is proposed, giving these tables different degrees of confidence, based on the local variations of the scaling factor. Our results are highly satisfactory and outperform both LUT and LAIS-LUT methods. Two lossless compressors have been designed for two different kinds of satellite images having different properties, namely, different spectral resolution, spatial resolution, and bitdepth, as well as different spectral and spatial correlations. In each case, the compressor exploits these properties to increase compression ratios.
Título :
Compresión sin pérdida de imágenes satelitales multiespectrales e hiperespectrales = Lossless compression of satellite multispectral and hyperspectral images
Autor :
Acevedo, Daniel
Director :
Ruedin, Ana M.C.
Consejero de estudios :
Mejail, Marta
Jurados :
Marcellin, M. ; Tressens, S. ; Mejail, M.
Año :
2011
Editor :
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación :
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Grado obtenido :
Doctor de la Universidad de Buenos Aires en el área de Ciencias de la Computación
Cita tipo Chicago: Acevedo, Daniel. "Compresión sin pérdida de imágenes satelitales multiespectrales e hiperespectrales". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 2011. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_4928_Acevedo.pdf
Resumen: En el tratamiento de imágenes que se apartan del modelo Gaussiano aditivo, en particular aquellas que además exhiben una baja relación se nalruido o presentan ruido impulsivo, la aplicación de filtros lineales generalmente no da buenos resultados, siendo los problemas típicos el borroneo de bordes o una pobre atenuación del ruido. Por otro lado, la aplicación de filtros no-lineales a este tipo de imágenes logra filtrar los valores de los pixels más afectados por el ruido y al mismo tiempo preservar los bordes. Las imágenes de Radar de Apertura Sintética (Synthetic Aperture Radar, SAR en inglés) poseen un tipo de ruido llamado speckle, el cual no es ni Gaussiano ni aditivo, y que posee una baja relación se~nal-ruido. Esto hace que la aplicación de filtros no-lineales resulte atractiva para este tipo de datos. Dentro de los filtros no lineales existe la clase de los filtros stack la cual es muy amplia y permite el diseño de filtros óptimos, desde el unto de vista del Error Absoluto Medio (Mean Absolute Error, MAE en inglés), y además permiten el procesamiento paralelo. Es por estas razones que esta tesis se dedica al estudio de la aplicación de esta clase de filtros a imágenes de Radar de Apertura Sintética. Para la evaluación de la efectividad de los filtros stack se utilizaron imágenes SAR simuladas bajo el modelo G0 e imágenes reales. Este modelo fue adoptado debido a su buen comportamiento para diversos tipos de target y su tractabilidad computacional. Se recurrió a evaluaciones de parámetros estadísticos, performance en la clasificación y calidad perceptual. También se estudió la utilización del modelo Gh en segmentación de imágenes SAR utilizando conjuntos de nivel y competencia de regiones.
Abstract: In the treatment of images that do no follow the Gaussian additive model, particularly those that exhibit a low signal to noise ratio, or are affected by impulsive noise, the use of linear filters usually does not yield good results, being edge blurring or poor noise attenuetion the most common problems. On the other hand, the use of non-linear filters with this type of images, filters out the values of the most noisy pixels while, preserving the edges at the same time. Synthetic Aperture Radar (SAR) images possess a noise called speckle which is neither Gaussian nor additive, and which exhibits a low signal to noise ratio. This makes atractive the use of non-linear filters with this type of data. Within the class of non-linear filters, the stack filters represent a wide and flexible class that allows the design of optimal filters which minimize the Mean Absolute Error, and also allow to perform parallel processing. This is the reason why this thesis is devoted to the study of the application of stack filters to SAR images. To evaluate the effectivity of stack filtering, simulated SAR images under the G0 law and real SAR images, were used. This model has been adopted here due to its good behavior for different types of target and its computational tractability. Evaluation of statistical parameters, classification performance and perceptual quality assessment were performed. The suitability of the Gh modeling SAR images for segmentation, using level sets and region competition, has also been studied.
Título :
Tratamiento de imágenes de radar de apertura sintética mediante filtros stack = Synthetic aperture radar image processing using stack filters
Autor :
Buemi, María Elena
Director :
Berllés, Julio César Jacobo
Consejero de estudios :
Mejail, Marta
Jurados :
Gómez Deniz, Luis ; Pardo Piccone, Alvaro ; Ruedin, Ana
Año :
2012
Editor :
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación :
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales Departamento de Computación
Grado obtenido :
Doctor de la Universidad de Buenos Aires en el área de Ciencias de la Computación
Cita tipo Chicago: Buemi, María Elena. "Tratamiento de imágenes de radar de apertura sintética mediante filtros stack". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 2012. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_5129_Buemi.pdf
Resumen: Uno de los desafíos actuales de la robótica móvil es alcanzar el mayor grado de autonomía, es decir, lograr que un robot desarrolle sus tareas sin la necesidad de un operador humano. El objetivo principal de este trabajo es el desarrollo de un nuevo sistema de navegación autónomo basado en visión para robot móviles en entornos interiores/exteriores. El sistema propuesto utiliza sólo una cámara y sensores de odometría, no depende de ningún sistema de localización externo o infraestructura similar. Además, es capaz de tratar con variaciones en el ambiente (por ejemplo, cambios de iluminación o estaciones del año) y satisface las restricciones para guiar al robot en tiempo real. Para alcanzar el objetivo de este trabajo, se propone un enfoque híbrido que hace uso de dos técnicas de navegación visual: una basada en segmentación de imágenes y otra basada en marcas visuales. Para representar el ambiente se construye un mapa topológico que puede ser interpretado como un grafo, donde las aristas corresponden a caminos navegables y los nodos a espacios abiertos. Para recorrer los caminos (aristas) se desarrolló un método original basado en segmentación y para navegar por los espacios abiertos (nodos) se realizó una mejora y adaptación de un método basado en marcas visuales. Se evaluaron diversos algoritmos de extracción de características distintivas de las imágenes para determinar cuál representa la mejor solución para el caso de la navegación basada en marcas visuales, en términos de performance y repetibilidad. El sistema desarrollado es robusto y no requiere de la calibración de los sensores. La convergencia del método de navegación se ha demostrado tanto desde el punto de vista teórico como práctico. Su complejidad computacional es independiente del tamaño del entorno. Para validar el método realizamos experiencias tanto con sets de datos como con el robot móvil ExaBot, que se presenta como parte de este trabajo. Los resultados obtenidos demuestran la viabilidad del enfoque híbrido para abordar el problema de la navegación basa en visión en entornos complejos interiores/exteriores.
Abstract: One of the current challenges of mobile robotics is to achieve complete autonomy, i.e. to develop a robot that can carry out its tasks without the need of a human operator. The main goal of this work is to develop a new vision-based mobile robot system for autonomous navigation in indoor/outdoor environments. The proposed system uses only a camera and odometry sensors, it does not rely on any external localization system or other similar infrastructure. Moreover, it can deal with real environmental changing conditions (illumination, seasons) and satisfies motion control constraints to guide the robot in real time. To achieve the goal of this work, a hybrid method is proposed that uses both segmentation-based and landmark-base navigation techniques. To represent the environment, a topological map is built. This map can be interpreted as a graph, where the edges represent navigable paths and the nodes open areas. A novel segmentation-based navigation method is presented to follow paths (edges) and a modifed landmark-based navigation method is used to traverse open areas (nodes). A variety of image features extraction algorithms were evaluated to conclude which one is the best solution for landmark-based navigation in terms of performance and repeatability. The developed system is robust and does not require sensor calibration. The convergence of the navigation method was proved from theoretical and practical viewpoints. Its computational complexity is independent of the environment size. To validate the method we perform experiments both with data sets and with the mobile robot ExaBot, which is presented as part of this work. The results demonstrate the feasibility of the hybrid approach to address the problem of vision based navigation in indoor/outdoor environments.
Título :
Sistema de navegación monocular para robots móviles en ambientes interiores/exteriores = Vision-based mobile robot system for monocular navigation in indoor/outdoor environments
Autor :
De Cristóforis, Pablo
Director :
Mejail, Marta
Consejero de estudios :
Mejail, Marta
Jurados :
Scolnik, Hugo ; Sappa, Angel ; Ruiz del Solar, Javier
Año :
2013
Editor :
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación :
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales Departamento de Computación
Grado obtenido :
Doctor de la Universidad de Buenos Aires en el área de Ciencias de la Computación
Computación / Robótica Computación / Procesamiento de Imágenes Computación / Ciencia de la Computación e Inteligencia Artificial
Palabras claves :
ROBOTS MOVILES; NAVEGACION AUTONOMA BASADA EN VISION; SEGMENTACION DE IMAGENES; CARACTERISTICAS DE IMAGENES; MOBILE ROBOTS; AUTONOMOUS VISION-BASED NAVIGATION; IMAGE SEGMENTATION; IMAGE FEATURES
Cita tipo Chicago: De Cristóforis, Pablo. "Sistema de navegación monocular para robots móviles en ambientes interiores/exteriores". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 2013. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_5398_DeCristoforis.pdf
Resumen: Dentro del Plan Espacial Nacional (PEN), la Comisión Nacional de Actividades Espaciales (CONAE) tiene previsto el lanzamiento de la misión satelital SAOCOM, un radar de apertura sintética (SAR) que opera en microondas (λ = 23cm) y cuyo principal objetivo es la estimación de humedad del suelo sobre Pampa Húmeda. El problema de la estimación de variables biogeofísicas a partir de imágenes SAR es un problema mal condicionado, donde con frecuencia existen muchas combinaciones de parámetros de la superficie que producen las mismas observaciones SAR. Por esta razón, existen diversas técnicas de inversión, las cuales deben tener en cuenta lo siguiente: 1. la dificultad en la parametrización de los modelos de dispersión que rigen la respuesta del blanco ante un onda electromagnética incidente sobre él, 2. las incertezas en la medición del radar proveniente de ruido de origen coherente (conocido como ruido speckle), 3. las incertezas provenientes de la ingeniería del sensor, 4. las incertezas provenientes de la variabilidad espacial de las variables del blanco, en particular de la humedad del suelo. En este trabajo de tesis se desarrolló un esquema de inversión bayesiano que toma en cuenta todos estos temas. Dicho esquema se evaluó con datos SAR y mediciones de campo provenientes de varias campa˜nas con sistemas aerotransportados y satelitales. El esquema bayesiano considera todas las dificultades encontradas en el desarrollo de un producto operativo de humedad del suelo y puede resultar en un algoritmo alternativo al desarrollado por CONAE para la misión satelital SAOCOM.
Abstract: Within the framework of the Argentinean Space Plan (PEN), the National Space Activities Commission (CONAE) plans to launch the SAOCOM mission, which involves a synthetic aperture radar (SAR) operating in the microwave region (λ = 23cm) and whose main goal is the estimation of soil moisture over the Pampas Plains. Estimation of biogeophysical variables through radar images is an ill-posed problem, where there are often many combinations of surface parameters that produce the same SAR observations. For this reason, there are various retrieval techniques, which should take into account 1. the difficulty of parameterizing the scattering models which govern the response of the target to an electromagnetic wave impinging on it, 2. uncertainties in the radar measurement due to speckle noise, 3. instrumental noise from the sensor, 4. uncertainties from the spatial variability of the target variables, in particular of soil moisture. In this thesis a Bayesian retrieval scheme was developed, which takes into account all these issues. This scheme is assessed with SAR data and field measurements from various campaigns involving airborne and satellite systems. Also, the Bayesian scheme considers all the difficulties encountered in the development of an operational soil moisture product and can lead to an alternative algorithm to that developed by CONAE for the SAOCOM mission.
Título :
Parametrización y optimización de modelos de inversión para la obtención de humedad del suelo a partir de datos satelitales de Radares de Apertura Sintética = Parameterization and optimization of inversion models for soil moisture retrieval from Synthetic Aperture Radar (SAR) data
Autor :
Barber, Matías Ernesto
Director :
Grings, Francisco
Consejero de estudios :
Osella, Ana
Jurados :
Thibeault, Marc ; Bonomo, Néstor ; Galarza, Cecilia
Año :
2013
Editor :
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación :
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales Instituto de Astronomía y Física del Espacio (IAFE). Grupo de Teledetección Cuantitativa
Grado obtenido :
Doctor de la Universidad de Buenos Aires en el área de Ciencias Físicas
Cita tipo APA: Barber, Matías Ernesto . (2013). Parametrización y optimización de modelos de inversión para la obtención de humedad del suelo a partir de datos satelitales de Radares de Apertura Sintética. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_5453_Barber.pdf
Cita tipo Chicago: Barber, Matías Ernesto. "Parametrización y optimización de modelos de inversión para la obtención de humedad del suelo a partir de datos satelitales de Radares de Apertura Sintética". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 2013. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_5453_Barber.pdf
Resumen: Los bosques de decisión son una herramienta que se han popularizado para resolver diferentes tareas de visión por computadora. Sus principales ventajas son su alta eficiencia computacional, los resultados competitivos con el estado del arte que se obtienen al emplearlos y que son inherentemente clasificadores multiclase. Usualmente, para cada nueva tarea de visión por computadora donde se tiene que entrenar un bosque de decisión, un nuevo conjunto de entrenamiento debe ser confeccionado desde cero. En esta tesis, presentamos un nuevo método de transferencia de aprendizaje que utiliza bosques de decisión y lo aplicamos para reconocer gestos y caracteres. El método propuesto extrae conocimiento de otras tareas de visión por computadora y lo aplica a una tarea destino, reduciendo el problema de crear nuevos conjuntos de entrenamiento. Introducimos dos extensiones en el modelo de los bosques de decisión para poder transferir conocimiento de varias tareas de origen a una tarea destino. La primera es la ganancia de información mixta, que se puede interpretar como un regularizador basado en los datos. La segunda es la propagación de etiquetas, que infiere el estructura de la variedad del espacio de características. Demostramos que ambas extensiones son importantes para obtener altas tasas de reconocimiento. Nuestros experimentos demuestran mejoras sobre los bosques de decisión tradicionales en el ChaLearn Gesture Challenge y en el conjunto de datos MNIST (Mixed National Institute of Standards and Technology) de dígitos escritos a mano. Además demostramos mejoras en tasas de reconocimiento en comparación con otros clasificadores del estado del arte.
Abstract: Decision forests are an increasingly popular tool in computer vision tasks. Their advantages include high computational efficiency, stateof- the-art accuracy and multi-class support. Usually for each new computer vision task where a decision forest has to be learned a new training set is collected from scratch. In this thesis, we present a novel method for transfer learning which uses decision forests, and we apply it to recognize gestures and characters. This method extracts knowledge from previous computer vision tasks and applies it to the target task, thus reducing the problem of collecting new datasets. We introduce two extensions into the decision forest framework in order to transfer knowledge from several source tasks to a given target task. The first one is mixed information gain, which is a data-based regularizer. The second one is label propagation, which infers the manifold structure of the feature space. We show that both of them are important to achieve higher recognition rates. Our experiments demonstrate improvements over traditional decision forests in the ChaLearn Gesture Challenge and MNIST (Mixed National Institute of Standards and Technology) dataset of handwritten digits. Also, we show that the transfer learning decision forests compare favorably against other state-of-the-art classifiers.
Título :
Transferencia de aprendizaje mediante bosques de decisión = Tranfer learning using decision forests
Autor :
Goussies, Norberto Adrián
Director :
Mejail, Marta E.
Consejero de estudios :
Mejail, Marta E.
Jurados :
Sappa, Angel D. ; Ballarin, Virginia L. ; Granitto, Pablo
Año :
2014-11-28
Editor :
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación :
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales Departamento de Computación
Grado obtenido :
Doctor de la Universidad de Buenos Aires en el área de Ciencias de la Computación
BOSQUES DE DECISION; TRANSFERENCIA DE APRENDIZAJE; RECONOCIMIENTO DE GESTOS; RECONOCIMIENTO DE CARACTERES; PROPAGACION DE ETIQUETAS; DECISION FORESTS; TRANSFER LEARNING; GESTURE RECOGNITION; OPTICAL CHARACTER RECOGNITION; LABEL PROPAGATION
Cita tipo Chicago: Goussies, Norberto Adrián. "Transferencia de aprendizaje mediante bosques de decisión". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 2014-11-28. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_5641_Goussies.pdf
Resumen: El movimiento es una característica fundamental para el procesamiento de video y sus posteriores aplicaciones. La estimación de movimiento en video es de gran utilidad para definir la correspondencia de puntos en una escena, calcular sus velocidades y así poder discriminar objetos, acciones, segmentar movimiento, etc. El objetivo de este trabajo es realizar un seguimiento preciso y una estimación de movimiento de un gran conjunto de puntos. Esto se conoce como estimación densa de movimiento. Para ello, se proponen dos líneas principales de estudio: modelos estadísticos de movimiento utilizando texturas dinámicas y el cálculo del flujo óptico minimizando la energía con graph cuts, en ambos casos considerando secuencias de imágenes RGB y RGB-D. El modelo de texturas dinámicas está muy bien condicionado para la segmentación de movimiento, y dentro de este contexto desarrollamos una aplicación con características novedosas: (i) proceso de aprendizaje desacoplado y (ii) algoritmos optimizados para trabajar en placas gráficas GPU (Graphic Process Unit). Además, el modelo ha sido extendido para contemplar secuencias de imágenes RGB-D, el cual no había sido estudiado hasta el momento, permitiéndonos identificar procesos visuales en 3D. Experimentos sobre la base de datos DynTex muestran resultados exitosos de performance y de clasificación para la mayoría de las casos. Luego, nuestros análisis sobre secuencias RGB-D revelan la viabilidad de este modelo para aplicaciones 3D. El problema de la estimación del flujo óptico (optical flow) fue abordado mediante la minimización de la energía del campo de vectores utilizando la técnica de graph cuts con una formulación novedosa de la energía. Ampliamos esta formulación para tener en cuenta la profundidad y así calcular el flujo de la escena (scene flow). Hasta donde sabemos, en la literatura, nunca se había utilizado graph cuts para estimar el scene flow. Los resultados obtenidos sobre el dataset Middlebury muestran que nuestros algoritmos son competitivos comparados con los presentes en el estado del arte y los mejores con en términos de error angular.
Abstract: Motion is a fundamental cue for video processing and its further applications. Video motion estimation is very useful to find correspondences of points in a scene, computing their velocities, discriminate objects, actions, segment motion, etc. The aim of this work is to accurately track the motion of a large set of points in videos. This is known as dense motion estimation. To this end, two main lines of study were proposed: statistical models of motion using dynamic textures and optical flow calculation using graph cuts for energy minimization, considering in both cases sequences of RGB and RGB-D images. The dynamic textures model is well suited for motion segmentation, and in this context we develop an application with novel features: (i) a decoupled learning step (ii) GPU-translated algorithms optimized to work on GPU (Graphic Process Unit). Also, the model has been extended to process RGB-D sequences, which had not been studied so far, allowing us to identify visual processes in 3D. Experiments on the Dyntex dataset show successful results of performance and classification for most cases. Then our analysis of RGB-D sequences reveal the viability of this model for 3D applications. The problem of optical flow estimation was addressed by minimizing the energy of the vector field using the graph cuts method with a novel formulation of energy. We extend this formulation to take depth into account and thus estimate the Scene Flow. To the best of our knowledge, scene flow estimation using graph cuts has never been used in the literature. The results obtained on the Middlebury dataset show that our algorithms are competitive with the state of the art and the best performing in terms of angular error.
Título :
Estimación de movimiento en secuencias de imágenes RGB y RGB-D = Motion estimation in RGB and RGB-D image sequences
Autor :
Gómez Fernández, Francisco Roberto
Director :
Mejail, Marta Pardo Piccone, Alvaro D.
Consejero de estudios :
Mejail, Marta
Jurados :
Gómez, Juan Carlos ; Ferreira Vázquez, Enrique ; Wachs, Juan P.
Año :
2016-03-30
Editor :
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación :
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales Departamento de Computación
Grado obtenido :
Doctor de la Universidad de Buenos Aires en el área de Ciencias de la Computación
Cita tipo Chicago: Gómez Fernández, Francisco Roberto. "Estimación de movimiento en secuencias de imágenes RGB y RGB-D". Tesis de Doctorado. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires. 2016-03-30. http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_5985_GomezFernandez.pdf
http://digital.bl.fcen.uba.ar
Biblioteca Central Dr. Luis Federico Leloir - Facultad de Ciencias Exactas y Naturales - Universidad de Buenos Aires
Intendente Güiraldes 2160 - Ciudad Universitaria - Pabellón II - C1428EGA - Tel. (54 11) 4789-9293 int 34