Computer Vision

Descripción

El presente proyecto se centra en la investigación y desarrollo de algoritmos y técnicas para la extracción de información desde secuencias de imágenes de video. En particular, interesa el desarrollo de métodos eficientes para el análisis temporal de objetos de interés (como personas o vehículos) en tiempo real, con aplicaciones al ámbito comercial, la seguridad, la industria y el transporte. Para ello, se propone considerar a los objetos como volúmenes vistos de manera parcial desde un punto de observación (como una cámara), por lo que cualquier transformación (cambio de orientación, desplazamiento o alejamiento) afecta la sección detectada del objeto que se estudia. Esta situación sucede habitualmente en los entornos de interés para este proyecto (por ejemplo cuando un vehículo se ubica detrás de otro o, cuando una persona se acerca al punto de observación) lo que provoca que la mayoría de los algoritmos existentes de seguimiento y clasificación fallen. Aplicando métodos de reconstrucción espacial, a partir de una secuencia de imágenes del mismo objeto en distintos momentos, pueden inferirse características espaciales de forma a fin de lograr obtener un modelo digital del objeto con mayor precisión que los algoritmos tradicionales y al mismo tiempo realizar análisis de trayectorias para detectar comportamientos de interés.

Objetivos

El análisis de secuencia de imágenes constituye la base de un gran número aplicaciones avanzadas que requieren comprender su contenido y variación en el tiempo. Esta tarea en gran parte se basa en la detección dinámica de objetos, la cual consiste en separar las estructuras de interés del resto de la imagen. Una de las aplicaciones más extendida es en el área de video-vigilancia, donde la detección del movimiento, una de las formas más básicas de análisis, se usa como indicador que ha sucedido un evento y permite alertar al personal de seguridad, y al mismo tiempo priorizar las imágenes que deben ser registradas y almacenadas. Este tipo de análisis también es muy importante para los sistemas inteligentes de transporte ya que permiten extraer información de forma automática acerca del estado del tráfico, accidentes, infracciones, entre otras. Además, puede aportar información muy valiosa sobre el comportamiento de las personas con posibles aplicaciones al turismo, el comercio, el deporte, etc.

Aunque existen varias propuestas en la bibliografíasobre el tema, en general los métodos son específicos a cada situación y adolecen de problemas relacionados con el movimientoy disposición de los objetos en el espacio. Estas limitaciones dadas por la representación de imágenes, pueden ser mitigadas definiendo características estructurales de los objetos y de su comportamiento teniendo en cuenta la tercera dimensión. El otro desafío presente es analizar y administrar el gran volumen de información por unidad de tiempo, ya sea por las múltiples fuentes de imágenes (varias cámaras de video simultáneas) o por la alta resolución y velocidad con que se trabaja (video HD, cámaras de profundidad o de alta velocidad a 60 tramas por segundo). Por esto, es importante contar con algoritmos muy eficientes y arquitecturas de alta velocidad que permitan a manipular con estos datos en forma inmediata.

El objetivo principal de este proyecto es abordar el problema de seguimiento de múltiples clases de objetos a partir de secuencia de imágenes obtenidas desde cámaras de video con diferentes características. Para este fin, se estudiarán algoritmos de detección, clasificación y seguimiento de los objetos, y se propondrán nuevas estrategias que tengan en cuenta información a priori sobre el problema (ej. la distancia a la cámara, geometría de la escena y de los objetos) que permitan una reconstrucción del escenario en forma eficiente. A partir del seguimiento de los objetos detectados, de sus posiciones y de sus trayectorias, es posible obtener suficiente información como para reconocer automáticamente comportamientos de interés (ej. vandalismo, preferencias de clientes, flujo de tránsito, etc.).Los métodos propuestos serán lo suficientemente generalizables para que puedan adaptarse a las distintas áreas de aplicación mencionadas. Se propone también utilizar las placas gráficas (GPUs) como unidades de procesamiento de alta velocidad, para lo cual se desarrollarán metodologías de paralelización de los problemas en sus diversas etapas. Finalmente, se estudiarán métricas formales de evaluación de los resultados y un método de validación automática, a partir de la generación de escenarios virtuales realistas utilizando técnicas de computación gráfica y simulación.

Todos los temas de investigación nombrados se encuentran estrechamente vinculados al grupo de trabajo, que cuenta con experiencia principalmente en el área de informática. Asimismo, se integran colaboradores profesionales expertos en otras disciplinas, tal como tránsito y mercadotecnia, que aportarán conocimientos y crítica especializada sobre los resultados obtenidos. Durante el período que se lleve a cabo este proyecto, se prevé formar recursos humanos en estudios de grado y posgrado en carreras afines.

Resultados

Los integrantes del grupo de trabajo han desarrollado una importante experiencia en el estudio y desarrollo de aplicaciones relacionadas a los temas involucrados en el presente proyecto, principalmente relacionadas con el procesamiento de imágenes, visualización computacional, paralelización y simulación numérica, según se describe a continuación y se manifiesta en el listado de publicaciones relativas al tema del proyecto.

A continuación se listan algunos de los resultados relativos al tema del proyecto publicados por el equipo de trabajo en los últimos 10 años, en congresos nacionales o internacionales con referato y revistas indexadas internacionales:

Aragone, D’Amato, Lotito, Parente. MIN-MAX gradient surface reconstruction via absolute minimization, Mecánica Computacional, Vol XXVIII, pp. 2563-2572 , 2009.
Barbuzza, Vénere, Clausse, Quality assurance of manufactures by means of intelligent processing, Journal of Testing and Evaluation, ASTM International, ISSN: 0090-3973, Vol. 35, 1, pp. 59-65, 2007.
Barbuzza, del Fresno, Vénere, Clausse, Herramienta para control de calidad en industria mediante inspección tomográfica, 39º Jornadas Argentinas de Informática JAIIO 2010, 7º Jornadas de Informática Industrial, Buenos Aires, 30 de agosto al 3 de septiembre de 2010.
Barbuzza, Lotito, Clausse, Tomography reconstruction by entropy maximization with smoothing filtering, Inverse Problems in Science and Engineering, Taylor & Francis, ISSN: 1741-5977, 18: 5, pp 711-722, 2010.
Barbuzza, Clausse, Metrópolis Montecarlo for tomographic reconstruction with prior smoothness, IET Image Processing Journal, ISSN 1751-9659, Vol 5, Issue 2, pp. 198-204, 2011.
Dalponte, Rinaldi P., Vénere, Clausse, Cellular automata algorithm for simulation of surface flows in large plains. Simulation Modelling Practice and Theory V.15: 315–327, 2007.
del Fresno, D’Amato, Vénere. Un indicador de calidad para evaluar superficies segmentadas, Mecánica Computacional, Vol XXVII, págs. 3009-3021, 2008.
D’Amato, Rubiales, Mayorano, Massa, Tristan, Migrating multi espectral image processing to the GPU. 1er Congreso Latinoamericano en High Performance Computing (JAIIO 2009) – Mar del Plata, Argentina, 2009
D’Amato, Lotito, Asla, Valdéz. Herramienta para el entrenamiento y detección de vehículos en video con clasificadores Adaboost, Escuela de Ciencias de las imágenes, ISBN 978-987-1648-18-4 pp. 35-41, Bahía Blanca, Argentina, 2010.
D’Amato, Boroni, Garcia Bauza, Vénere, Real-time aircraft radar simulator for a navy training system, Computer Applications in Engineering Education. ISSN: 1099-0542. DOI: 10.1002/cae.20505, 2010.
D’Amato, Negri, Lotito, Estimating the queue length to optimize the green time for an urban traffic control system, III Congreso de Matemática Aplicada Computacional e Industrial, Bahia Blanca, Argentina, 2011.
D’Amato, GarcíaBauza, Boroni. Colorbased fruits classification using GPU, IEEE Latin American Transactions, 9 (3), p. 366-370, ISSN 1548-0992, 2011.
D’Amato, Vénere. A CPU–GPU framework for optimizing the quality of large meshes. Journal of Parallel and Distributed Computing. Academic Press Inc Elsevier Science. vol. 83 n°. 8 p 1127-1134, 2013.
Diez, dos Reis, Rinaldi E., Instrumento de medición de la satisfacción de los usuarios de hospitales públicos, Encuentro de Docentes Universitarios de Comercialización de Argentina y América Latina 2012 – EDUCA-AL, 2012.
Ferrante, del Fresno, D´Amato, Vénere, Detección y reconstrucción de geometrías a partir de MRI para seguimiento de tumores, Mecánica Computacional, XXX, pp 1903-1914 , 2011.
Garcia Bauza, Boroni, Vénere, Clausse. Real-time interactive animations of liquid surfaces with Lattice-Boltzmann engines, Aust. J. Basic & appl. Sci., 4 (8), p. 3730-3740, ISSN 1991-8178, 2010.
Lazo, Garcia Bauza, Boroni, Clausse, Real-time physical engine for floating objects with two-way fluid-structure coupling. World Applied Sciences Journal. 22(12), p. 1685-1694, ISSN 1818-4952, 2013
Mayorano, Rubiales, Lotito, Optimal control based heuristic for congestion reduction in traffic networks, Latin America Applied Research, In press: 2013
Rinaldi , Dari,Vénere, Clausse .A Lattice-Boltzmann solver for 3D fluid simulation on GPU. Simulation Modelling Practice and Theory, 25: 163-171. DOI: 10.1016/j.simpat.2012.03.004. ISSN: 1569-190X, 2012

Áreas de investigación involucradas

El análisis en tiempo real de video se relaciona con el área de Computer Vision, Informática médica y optimización

Personas de contacto

D’Amato, Juan Pablo,
Barbuzza, Rosana,
García Bauza, Cristian
Rinaldi, Pablo
Lazo, Marcos
Mayorano, Fernando
Gervasoni, Luciano