Accede a Declaración de AccesibilidadAccede al menú principalAccede al pieAccede al contenido principal
Español

Grupos de investigación

Video Processing and Understanding LabGrupo de Tratamiento e Interpretación de Vídeo

Grupos de investigación - Video Processing and Understanding LabGrupo de Tratamiento e Interpretación de Vídeo

Grupo consolidado

Acrónimo
VPULab
Coordinadores
JOSE MARIA MARTINEZ SANCHEZ, JESUS BESCOS CANO
Palabras clave
Computer Vision (Visión Artificial). Deep-Learning (Aprendizaje profundo). Inteligencia Artificial. Video-monitorización. Imagen médica. Smart-cities. Tratamiento digital de vídeo. Tratamiento digital de imágenes.
Enlaces

Líneas de investigación

Técnicas de visión artificial basadas en el aprendizaje profundo aplicadas, dirigidas a escenarios con escasez de datos de entrenamiento o anotaciones de entrenamiento, con un foco especial en: el entrenamiento autosupervisado, la generación de datos de entrenamiento sintéticos a través de técnicas de IA visual y generativa, y el análisis del impacto de la transferibilidad de modelos visuales preentrenados. Redes de grafos neuronales e IA generativa visual para la adaptación de dominio no-supervisada, enfocada en mejorar la transferencia de conocimiento en entornos con disponibilidad de datos limitada como son la conducción autónoma de vehículos y el seguimiento de múltiples objetos con varias cámaras. Algoritmos de visión por computador que integren técnicas de detección, clasificación y reidentificación de objetos, con un enfoque en el aprendizaje incremental y la adaptación de dominio, con el objetivo de mejorar la capacidad de los sistemas para reconocer y seguir objetos en entornos cambiantes y no vistos previamente. Técnicas de aprendizaje profundo aplicadas al procesamiento, comprensión, mejora, generación y transmisión de contenidos visuales. Algortimos y estrategías para promover modelos de aprendizaje profundo que se ajusten a las normativas y los estándares de sostenibilidad (p. ej., consumo, impacto), explicabilidad y confiabilidad (p. ej., desactivación de violaciones de derechos de propiedad intelectual, sesgos sociales) y fiabilidad (p. ej., solidez a las modificaciones de datos, cambios de distribución), considerando aplicaciones indeterminadas y potencialmente imprevistas (p. ej., para modelos fundacionales).

Miembros

JOSE MARIA MARTINEZ SANCHEZ
Email: josem.martinez@uam.es
ALVARO GARCIA MARTIN
Email: alvaro.garcia@uam.es
CECILIA DIANA ALBELDA
Email: cecilia.diana@estudiante.uam.es
JAVIER MONTALVO RODRIGO
Email: javier.montalvo@uam.es
JESUS BESCOS CANO
Email: j.bescos@uam.es
JUAN CARLOS SAN MIGUEL AVEDILLO
Email: juancarlos.sanmiguel@uam.es
KIRILL SIROTKIN
Email: kirill.sirotkin@uam.es
LUIS HERRANZ ARRIBAS
Email: luis.herranz@uam.es
MARCOS ESCUDERO VIÑOLO
Email: marcos.escudero@uam.es
MIGUEL ANGEL GARCIA GARCIA
Email: miguelangel.garcia@uam.es
PABLO AYUSO ALBIZU
Email: pablo.ayuso@uam.es
PABLO CARBALLEIRA LOPEZ
Email: pablo.carballeira@uam.es
PAULA MORAL DE EUSEBIO
Email: paula.moral@uam.es
ROBERTO ALCOVER COUSO
Email: roberto.alcover@uam.es

Miembros asociados externos/Máster UAM

Juan Ignacio Bravo Pérez-Villar

Publicaciones

Publicaciones más relevantes

(últimos 5 años) Paula Moral, Marcos Escudero-Viñolo, Alvaro Garcia-Martin: "Towards automatic waste containers management in cities via computer vision: containers localization and geo-positioning in city maps", Waste Management, 152 (1): pp. 59-68, octubre 2022, ISSN 0956-053X. Elena Luna, Juan C. SanMiguel, Jose M. Martinez, Pablo Carballeira: "Graph Neural Networks for Cross-Camera Data Association", IEEE Transactions on Circuits and Systems for Video Technology, 33(29):589-601, febrero 2023., ISSN 1051-8215 Alejandro Lopez-Cifuentes, Marcos Escudero, Jesús Bescós, Juan C. SanMiguel: "Attention-based Knowledge Distillation in Scene Recognition: the Impact of a DCT-driven Loss", IEEE Transactions on Circuits and Systems for Video Technology, vol. 33, no. 9, pp. 4769-4783, Sept. 2023. Juan Ignacio Bravo Pérez-Villar, Álvaro García-Martín, Jesús Bescós, Marcos Escudero-Viñolo, "Spacecraft Pose Estimation: Robust 2D and 3D-Structural Losses and Unsupervised Domain Adaptation by Inter-Model Consensus", IEEE Transactions on Aerospace and Electronic Systems, Online 21 August 2023. Electronic ISSN: 1557-9603, Print ISSN: 0018-9251. Pablo Marcos-Manchón, Roberto Alcover-Couso, Juan Carlos SanMiguel, José M. Martínez, "Open-Vocabulary Attention Maps with Token Optimization for Semantic Segmentation in Diffusion Models", IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle (USA), Jun. 2024.

Proyectos

Proyectos más relevantes

(últimos 5 años) 2017/YERUN/02 (SOFDL) Segmentación Objeto-Fondo basado en técnicas de aprendizaje automático Deep Learning (2017-2019). TEC2017-88169-R (MobiNetVideo) Análisis de vídeo para implementación práctica de redes de cámaras móviles cooperativas (2018-2020). SI1/PJI/2019-00414 (AISEEME) Aiding diagnosis by self-supervised deep learning from unlabeled medical imaging (2020-2022). PID2021-125051OB-I00 (HVD) Recolección de datos visuales: permitiendo la visión por computador en escenarios con datos desfavorables (2022-2025). TED2021-131643A-I00 (SEGA-CV) Geoposicionamiento y valoración de elementos urbanos mediante visión artificial (2022-2024).