Hola a todos. Bienvenidos a la última semana del curso de detección de objetos. Esta semana será un poco diferente a las anteriores. El propósito principal es poner sobre la mesa una serie de conceptos de mucho interés avanzados, pero en los que no podremos entrar en mucho detalle you que cada uno de ellos requiere pues una o dos semanas de curso, de todas formas nos han salido unos vídeos un poco largos, you os lo anticipo. Espero que de todas formas os resulten interesantes. En este vídeo lo que voy a hacer es desglosar un poco en qué va a consistir los contenidos de esta semana. Bien, a lo largo de estas semanas hemos visto toda una secuencia de procesamiento que nos permite dada una imagen pues detectar objetos con técnicas relativamente avanzadas. Por ejemplo, hemos visto el ejemplo guía de la detección de peatones o la detección de caras. Bien, sin embargo hay otras técnicas aún más avanzadas que creemos interesante que al menos conozcáis, como decía anteriormente no podemos entrar en detalle porque requiere mucho tiempo pero creo que es interesante que al menos tengas una idea de qué son esas técnicas. Primero nos vamos a fijar en el módulo de clasificación. En este módulo cuando planteábamos el aprendizaje de modelos, de alguna manera siempre asumíamos que los objetos eran un todo, es decir eran rígidos y no tenían partes móviles, etcétera. Sin embargo, los propios peatones por ejemplo, tienen piernas, tienen brazos que son partes móviles, entonces hay modelos alternativos que intentan explotar esa situación o ese conocimiento. Por ejemplo, uno muy conocido es el DPM del inglés deformable part based model que intenta tener en cuenta pues que los objetos pueden tener partes que son móviles. También un poco en esa línea el random forest en inglés de expertos locales intenta tener en cuenta todas esas situaciones. Bien, pues hablaremos de estos dos conceptos que como digo están íntimamente relacionados con el módulo de clasificación de candidatos. Además de eso, en este módulo también implícitamente hemos estado viendo bueno, pues descriptores como el HOG, como el LBP, como los Haar, y lo que tienen en común es que todos se han diseñado a mano, es decir hay una serie de investigadores que propusieron estos descriptores, a base de pensar que podrían ser útil para la detección de objetos, por ejemplo. Es cierto que algunos como el Haar pues está inspirado o tiene una inspiración en hasta cierto punto en biológica, pero bueno al final todos están diseñado a mano. Bien, pues igual que asociados a estos descriptores íbamos aprendiendo modelos, la cuestión es, es posible aprender también los descriptores, es decir en vez de tener una serie de descriptores prefijados de antemano, ¿es posible aprenderlos también? Bien, pues desde ese punto de vista también vamos a ver en qué consisten las redes neuronales de convolución, en inglés convolutional neural networks. O sea que vamos a ver este paradigma también desde el punto de vista aprender la propia representación, aprender los propios descriptores, no solo lo que es digamos el clasificador o el modelo que da pie al clasificador, de hecho en este paradigma no vamos a distinguir una cosa de otra, tendremos un conjunto de parámetros que se tendrán que aprender para, bueno pues hacer el modelo que nos interesa. También en relación con la clasificación de candidatos, cuando aprendíamos modelos, aunque no se decía explícitamente, se estaba suponiendo que las muestras que se utilizaban para hacer el aprendizaje, realmente eran representativas del dominio esos modelos tenían que trabajar finalmente. Sin embargo, hay muchas situaciones prácticas en que esto no es así. Puede ser que cambiemos de sensor, puede ser que nuestro detector, nuestra aplicación estaba enfocada en ciudad y ahora tiene que trabajar en el campo, etcétera. Hay multitud de razones por la cual el dominio de aplicación cambia, y ¿qué sucede? Que si nuestras muestras dejan de ser representativas de ese nuevo dominio, pues seguramente el rendimiento de nuestro detector va a bajar, entonces lo que querríamos hacer es evitar rehacer todo el trabajo, coger nuevas muestras, etcétera y lo que nos gustaría hacer es reaprovechar el conocimiento previo, digamos pero adaptándolo al nuevo dominio que tenemos ahora, y por tanto otro tema que vamos a tocar aquí es la adaptación de dominio. Bien, además de eso también respecto a la manera de generar candidatos, hay otras alternativas que comentaremos brevemente. También es cierto que nos hemos centrado mucho en imágenes tipo RGB, pero hay otras modalidades de datos que también comentaremos brevemente. Así pues, en esta semana vamos a ver lo que podríamos llamar temas más avanzados que tienen que ver con la utilización de otras modalidades de datos, otras alternativas en generación de candidatos, la adaptación de dominio y modelos deformables por partes o basados en partes, así como el aprendizaje de los descriptores de imágenes.