Grupo consolidado
- Acrónimo
- VPULab
- Coordinadores
- JOSE MARIA MARTINEZ SANCHEZ, JESUS BESCOS CANO
- Palabras clave
- Computer Vision (Visión Artificial). Deep-Learning (Aprendizaje profundo). Inteligencia Artificial. Video-monitorización. Imagen médica. Smart-cities. Tratamiento digital de vídeo. Tratamiento digital de imágenes.
- Enlaces
Líneas de investigación
Técnicas de visión artificial basadas en el aprendizaje profundo aplicadas, dirigidas a escenarios con escasez de datos de entrenamiento o anotaciones de entrenamiento, con un foco especial en: el entrenamiento autosupervisado, la generación de datos de entrenamiento sintéticos a través de técnicas de IA visual y generativa, y el análisis del impacto de la transferibilidad de modelos visuales preentrenados. Redes de grafos neuronales e IA generativa visual para la adaptación de dominio no-supervisada, enfocada en mejorar la transferencia de conocimiento en entornos con disponibilidad de datos limitada como son la conducción autónoma de vehículos y el seguimiento de múltiples objetos con varias cámaras. Algoritmos de visión por computador que integren técnicas de detección, clasificación y reidentificación de objetos, con un enfoque en el aprendizaje incremental y la adaptación de dominio, con el objetivo de mejorar la capacidad de los sistemas para reconocer y seguir objetos en entornos cambiantes y no vistos previamente. Técnicas de aprendizaje profundo aplicadas al procesamiento, comprensión, mejora, generación y transmisión de contenidos visuales. Algortimos y estrategías para promover modelos de aprendizaje profundo que se ajusten a las normativas y los estándares de sostenibilidad (p. ej., consumo, impacto), explicabilidad y confiabilidad (p. ej., desactivación de violaciones de derechos de propiedad intelectual, sesgos sociales) y fiabilidad (p. ej., solidez a las modificaciones de datos, cambios de distribución), considerando aplicaciones indeterminadas y potencialmente imprevistas (p. ej., para modelos fundacionales).
Miembros
- JOSE MARIA MARTINEZ SANCHEZ
- Email: josem.martinez@uam.es
- ALVARO GARCIA MARTIN
- Email: alvaro.garcia@uam.es
- CECILIA DIANA ALBELDA
- Email: cecilia.diana@estudiante.uam.es
- JAVIER MONTALVO RODRIGO
- Email: javier.montalvo@uam.es
- JESUS BESCOS CANO
- Email: j.bescos@uam.es
- JUAN CARLOS SAN MIGUEL AVEDILLO
- Email: juancarlos.sanmiguel@uam.es
- KIRILL SIROTKIN
- Email: kirill.sirotkin@uam.es
- LUIS HERRANZ ARRIBAS
- Email: luis.herranz@uam.es
- MARCOS ESCUDERO VIÑOLO
- Email: marcos.escudero@uam.es
- MIGUEL ANGEL GARCIA GARCIA
- Email: miguelangel.garcia@uam.es
- PABLO AYUSO ALBIZU
- Email: pablo.ayuso@uam.es
- PABLO CARBALLEIRA LOPEZ
- Email: pablo.carballeira@uam.es
- PAULA MORAL DE EUSEBIO
- Email: paula.moral@uam.es
- ROBERTO ALCOVER COUSO
- Email: roberto.alcover@uam.es
Miembros asociados externos/Máster UAM
- Juan Ignacio Bravo Pérez-Villar
Publicaciones
Publicaciones más relevantes
(últimos 5 años) Paula Moral, Marcos Escudero-Viñolo, Alvaro Garcia-Martin: "Towards automatic waste containers management in cities via computer vision: containers localization and geo-positioning in city maps", Waste Management, 152 (1): pp. 59-68, octubre 2022, ISSN 0956-053X. Elena Luna, Juan C. SanMiguel, Jose M. Martinez, Pablo Carballeira: "Graph Neural Networks for Cross-Camera Data Association", IEEE Transactions on Circuits and Systems for Video Technology, 33(29):589-601, febrero 2023., ISSN 1051-8215 Alejandro Lopez-Cifuentes, Marcos Escudero, Jesús Bescós, Juan C. SanMiguel: "Attention-based Knowledge Distillation in Scene Recognition: the Impact of a DCT-driven Loss", IEEE Transactions on Circuits and Systems for Video Technology, vol. 33, no. 9, pp. 4769-4783, Sept. 2023. Juan Ignacio Bravo Pérez-Villar, Álvaro García-Martín, Jesús Bescós, Marcos Escudero-Viñolo, "Spacecraft Pose Estimation: Robust 2D and 3D-Structural Losses and Unsupervised Domain Adaptation by Inter-Model Consensus", IEEE Transactions on Aerospace and Electronic Systems, Online 21 August 2023. Electronic ISSN: 1557-9603, Print ISSN: 0018-9251. Pablo Marcos-Manchón, Roberto Alcover-Couso, Juan Carlos SanMiguel, José M. Martínez, "Open-Vocabulary Attention Maps with Token Optimization for Semantic Segmentation in Diffusion Models", IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle (USA), Jun. 2024.
Proyectos
Proyectos más relevantes
(últimos 5 años) 2017/YERUN/02 (SOFDL) Segmentación Objeto-Fondo basado en técnicas de aprendizaje automático Deep Learning (2017-2019). TEC2017-88169-R (MobiNetVideo) Análisis de vídeo para implementación práctica de redes de cámaras móviles cooperativas (2018-2020). SI1/PJI/2019-00414 (AISEEME) Aiding diagnosis by self-supervised deep learning from unlabeled medical imaging (2020-2022). PID2021-125051OB-I00 (HVD) Recolección de datos visuales: permitiendo la visión por computador en escenarios con datos desfavorables (2022-2025). TED2021-131643A-I00 (SEGA-CV) Geoposicionamiento y valoración de elementos urbanos mediante visión artificial (2022-2024).