Las personas tenemos distintas formas de comunicarnos, ya sea hablando, escribiendo e incluso con nuestras manos, siendo esta última la que puede ayudar a muchas personas a que puedan interactuar con distintas plataformas tecnológicas, es por eso que se ha desarrollado una inteligencia artificial que puede entender el lenguaje de señas con las manos.

Es todo un reto para la visión por computadora el captar las distintas expresiones que uno puede lograr al utilizar sus manos, por que se presenta una variedad de posiciones y movimientos que uno puede lograr con las palmas y los dedos.

Pero parece ser que un grupo de investigadores de Google han encontrado de identificar esos sutiles movimientos al inferir 21 puntos clave 3D partiendo desde una sola imagen.

Todo empieza con la palma de la mano

Es fundamental tener un punto de partida cuando se quieren captar los movimientos de las manos y en este caso se vuelve fundamental el poder detectar la palma, siendo mucho más fácil de identificar que toda la mano.

Se tuvo que identificar una palma para distintos tamaños y enfoques en las imágenes que se van registrando, pero después de mucho trabajo se logró identificar con una precisión del 95.7%.

La siguiente tarea fue determinar los 21 puntos claves necesarios para modelar la mano y poder seguir cada uno de sus movimientos. Uno de los puntos sería donde inicia la palma y de ahí 4 puntos más para cada uno de los dedos.

Fue necesario utilizar una base de poco más de 30 mil imágenes, donde se han determinado estos 21 puntos clave, para que la Inteligencia Artificial pueda tenerlos de referencia cuando este registrando los movimientos de las manos.

Identificando los gestos

Una vez que la Inteligencia Artificial sabe en que posición esta la palma y los dedos, se puede proceder a realizar la interpretación de lo que se quiere decir con cada movimiento, lo interesante de este desarrollo es que se puede aplicar para gestos en distintos idiomas, logrando identificar un «OK», un «Rock» o un simple conteo de números.

Los investigadores planean extender esta tecnología para que sea más robusta y estable, además de aumentar la cantidad de gestos que se pueden detectar de manera confiable.

Esta nueva tecnología aparte de innovadora, también es de código abierto, por lo que cualquier persona podría utilizarla para implementaciones personalizadas.