GITT. Implementación de un modelo de detección de manos para aplicaciones de visión artificial con OpenCV
Abstract
En este documento se presenta un proyecto de Detección de Manos e identificación de sus partes características en imágenes estáticas y de vídeo para futuras aplicaciones de Realidad Aumentada (RA).
Para ello, se utilizan distintos algoritmos y librerías de Visión Artificial (VA) para presentar dos modelos distintos.
El primero, consiste en una propuesta original que parte de una Segmentación por Color que, integrado junto a otros algoritmos de VA implementados en la librería OpenCV, realiza la pseudodetección
de una mano presente en la imagen o fotograma bajo ciertas condiciones iniciales de posición de la mano y temperatura de color de la imagen, mientras que el segundo utiliza la herramienta contrastada MediaPipe
Hands, adaptando sus características a los objetivos definidos, para detectar y realizar el seguimiento de una o varias manos en imágenes estáticas y en vídeo en tiempo real.
Se realiza una presentación y análisis de los resultados obtenidos mediante el estudio por separado del funcionamiento de cada modelo sobre distintas imágenes estáticas y de vídeo del banco de pruebas, seguida de una comparativa entre ambos, valorando la calidad del primer modelo con respecto a la utilización de un producto comercial como es el segundo.
Se concluye que, pese a que ambos modelos realizan un trabajo similar en aquellas imágenes estáticas que cumplen con las condiciones de funcionamiento del primer modelo, el algoritmo basado en segmentación
por color encuentra dificultades a la hora de analizar imágenes de vídeo en tiempo real. Es por esto que las posibles mejoras del proyecto se centran en disminuir el tiempo de procesado e incrementar el rango de
imágenes sobre las que pueda actuar con éxito el primer modelo, ya que, se define MediaPipe Hands como una herramienta útil en todos los casos estudiados que permite su aplicación en infinidad de futuros proyectos
de VA.