Una nueva cámara imita los movimientos involuntarios del ojo humano para crear imágenes más nítidas y precisas para robots, smartphones y otros dispositivos de captura de imágenes.
PUBLICIDAD
Un equipo dirigido por informáticos de la Universidad de Maryland (UMD) inventó un mecanismo de cámara que mejora la forma en que los robots ven y reaccionan ante el mundo que les rodea. El prototipo y las pruebas de la cámara del equipo –denominada Artificial Microsaccade-Enhanced Event Camera (AMI-EV)– se detallan en un artículo publicado en la revista Science Robotics.
“Las cámaras de eventos son una tecnología relativamente nueva que rastrea mejor los objetos en movimiento que las cámaras tradicionales, pero las cámaras de eventos actuales tienen problemas para capturar imágenes nítidas y sin desenfoque cuando hay poco movimiento”, dijo a Metro Botao He, autor principal del artículo y estudiante de doctorado de Informática en la UMD.
“Es un gran problema porque los robots y muchas otras tecnologías, como los coches autónomos, dependen de imágenes precisas y oportunas para reaccionar correctamente ante un entorno cambiante. Así que nos preguntamos: ¿Cómo se aseguran los humanos y los animales de que su visión se mantiene centrada en un objeto en movimiento?”, agregó.
“Cuando se trabaja con robots, hay que sustituir los ojos por una cámara y el cerebro por un ordenador. Mejores cámaras significan mejor percepción y reacciones para los robots”.
— Yiannis Aloimonos, coautor del estudio y profesor de informática de la UMD
Para el equipo de He, la respuesta fueron las microsacadas, pequeños y rápidos movimientos oculares que se producen involuntariamente cuando una persona intenta enfocar la vista. Mediante estos movimientos diminutos pero continuos, el ojo humano puede mantener la atención en un objeto y sus texturas visuales –como el color, la profundidad y las sombras– con precisión a lo largo del tiempo.
“Pensamos que, al igual que nuestros ojos necesitan esos minúsculos movimientos para mantener el enfoque, una cámara podría utilizar un principio similar para captar imágenes claras y precisas sin borrosidad causada por el movimiento”, explica.
El equipo reprodujo con éxito las microsacadas insertando un prisma giratorio en el interior de la AMI-EV para redirigir los haces de luz captados por el objetivo. El movimiento rotatorio continuo del prisma simulaba los movimientos que se producen de forma natural en el ojo humano, lo que permitía a la cámara estabilizar las texturas de un objeto grabado igual que lo haría un ser humano.
PUBLICIDAD
Utilidades de la nueva cámara
- Puede ser usada en robots
- En el mejoramiento de las cámaras de los autos autónomas
-Para hacer más precisos los estudios científicos
-Puede ser usada en lentes de realidad virtual
5 preguntas a…
Botao He, autor principal del artículo y estudiante de doctorado de Informática en la UMD.
P: ¿En qué se inspiró para desarrollar esta cámara?
–La visión humana hace frente al desvanecimiento perceptivo mediante el mecanismo activo de pequeños movimientos involuntarios de los ojos, los más destacados de los cuales se denominan microsacadas. Al mover los ojos constante y ligeramente durante la fijación, las microsacadas pueden mantener sustancialmente la estabilidad y persistencia de la textura.
Inspirándonos en las microsacadas, diseñamos un sistema de percepción basado en eventos capaz de mantener simultáneamente un tiempo de reacción bajo y una textura estable.
P: ¿Por qué se inspira en el ojo humano?
–Tanto las cámaras de eventos como los ojos humanos sufren de desvanecimiento perceptivo, lo que significa que si no hay movimiento, la imagen se desvanecerá gradualmente. La visión humana hace frente a este problema mediante el mecanismo activo de los pequeños movimientos involuntarios de los ojos, entre los que destacan las microsacadas. Al mover los ojos constante y ligeramente durante la fijación, las microsacadas pueden mantener sustancialmente la estabilidad y persistencia de la textura. Inspirándonos en las microsacadas, diseñamos un sistema de percepción basado en eventos capaz de mantener simultáneamente un tiempo de reacción bajo y una textura estable.
P: ¿Cómo funciona la cámara?
–En este diseño, se montó un prisma de cuña giratorio delante de la apertura de una cámara de eventos para redirigir la luz y activar los eventos. La óptica geométrica del prisma de cuña giratorio permite compensar algorítmicamente el movimiento de rotación adicional, lo que da como resultado una apariencia de textura estable y un alto rendimiento informativo independiente del movimiento externo. El dispositivo de hardware y la solución de software se integran en un sistema que denominamos cámara Artificial MIcrosaccade-enhanced EVent (AMI-EV).
P:¿Cómo imita los diminutos movimientos involuntarios que utiliza el ojo para mantener una visión nítida y estable a lo largo del tiempo?
–Los humanos movemos el globo ocular constante y ligeramente para estimular la neurona visual y mantener estable nuestra percepción visual. AMI-EV también tiene un prisma de cuña giratorio montado delante de la apertura de una cámara de eventos para redirigir la luz entrante y desencadenar eventos constantemente (igual que la microsacada estimula las neuronas visuales).
P: ¿Qué función o uso real puede tener esta cámara?
–En primer lugar, puede utilizarse directamente como cámara de alta velocidad. Puede grabar y reconstruir vídeos a 3000 fps con una buena calidad de imagen. Además, como puede conservar las ventajas de las cámaras de eventos estándar en cuanto a alto rango dinámico y respuesta rápida, resulta adecuada para la conducción autónoma o los teléfonos inteligentes, especialmente en situaciones de iluminación difíciles.
Y lo que es más importante, dado que resuelve fundamentalmente el problema de la dependencia del movimiento de la visión basada en eventos, tiene el potencial de mejorar el rendimiento de la mayoría de las tareas de visión basadas en eventos existentes, y puede abrir la puerta a nuevas tareas que las cámaras existentes no pueden manejar por ahora, como el seguimiento de movimiento a alta velocidad sin desvanecimiento perceptivo, como se detalla en nuestro artículo.