Generación automática de resúenes de vídeos obtenidos desde cámaras móviles utilizando vectores de movimiento generados por un codificador H.264/AVC

Giralt Muiña, Juan

Generación automática de resúenes de vídeos obtenidos desde cámaras móviles utilizando vectores de movimiento generados por un codificador H.264/AVC

Giralt Muiña, Juan

Zuzendaria:

Luis Jiménez Linares Zuzendaria
Luis Rodriguez Benitez Zuzendaria

Defentsa unibertsitatea: Universidad de Castilla-La Mancha

Fecha de defensa: 2014(e)ko abendua-(a)k 15

Epaimahaia:

Mario G. Piattini Velthuis Presidentea
Macarena Espinilla Estévez Idazkaria
M. Carmen Aranda-Garrido Kidea

Mota: Tesia

Teseo: 376640 DIALNET RUIdeRA editor

Laburpena

El estudio de vídeos de tráfico para detectar infracciones o conductas antirreglamentarias así como la investigación de las causas de los accidentes de tráfico puede ser de una gran utilidad para la sociedad. El acceso a un contenido particular en un fichero de vídeo puede ser complejo debido a dos factores principales: la propia naturaleza de los archivos de video y el gran número de contenidos que existen. Con los resúmenes de vídeo, se pretende que el usuario acceda a alguna representación de éste que le permita conocer dicho contenido de la manera más rápida posible. También se trata que la navegación a través del vídeo sea dirigida, pudiendo acceder a las secciones concretas que sean de interés para cada usuario en particular. La generación de estos resúmenes es muy costosa desde el punto de vista de eficiencia computacional y temporal, debido principalmente al tamaño de los datos que hay que procesar. En esta Tesis se proponen una serie de técnicas que van a permitir la generación automática y eficiente de este tipo de resúmenes. Para conseguir dicha eficiencia, se trabaja de manera directa con la información almacenada en el video comprimido. Con esta decisión, se ahorrará todo el tiempo que se necesita para descomprimir el vídeo y además a diferencia de una gran mayoría de algoritmos que utilizan como entrada la señal del vídeo comprimido, en este trabajo sólo se trabajará con la información que obtienen el codificador H.264/AVC de la estimación y codificación del movimiento, es decir, los vectores de movimiento. Con respecto al ámbito o entorno de aplicación, ha de indicarse que una gran mayoría de técnicas que utilizan la información del movimiento para procesar vídeo, lo hacen en entornos controlados en los que suele existir información a priori del escenario del contenido del propio vídeo, además, en la mayoría de los casos los vídeos son capturados desde cámaras ubicadas en un punto fijo. En contraste con lo anterior, las técnicas y algoritmos propuestos en esta Tesis se han diseñado para poder ser utilizados en vídeos grabados desde cámaras móviles. En definitiva, el propósito general de esta Tesis consiste en obtener resúmenes de vídeo de tráfico, capturados desde cámaras on-board, analizando de manera exclusiva la información de la estimación y compensación de movimiento de H.264 para así minimizar la información a procesar y poder obtener estos resúmenes de la manera más eficiente posible.