Muchas personas piensan que la visión computarizada es un área de la tecnología reservada para genios matemáticos japoneses.
Nada más lejos de la realidad.
Mientras que en efecto se hace uso intensivo de matemática muy avanzada, y de sistemas computacionales de última generación; la realidad es que, gracias al código abierto, existen bibliotecas y frameworks que hace accesible estas tecnologías a todas las personas que, con una dosis adecuada de interés quieran adentrarse en este mundo tan fascinante y a la vez de vital importancia para nuestra sociedad moderna.
En esta entrega les mostramos una extensión de nuestro artículo anterior sobre «Visión Computarizada: Contando Gente con OpenCV, ROS,..» donde exploramos la creación un programa básico en lenguaje Python que haga uso modesto de los datos generados por el contador de personas.
Recordemos que ROS (Robot Operating System) es un meta-sistema operativo de tipo publicador/suscriptor que facilita la comunicacion entre diversos nodos computacionales; y que está orientado a sistemas robóticos.
Como dijimos, en el artículo anterior exploramos cómo configurar un sistema Up-Board con Ubuntu Linux, para utilizar los datos provenientes de una cámara para analizar las imagenes en tiempo real y detectar personas. Fascinante.
Ahora, basados en el tutorial básico de ROS para creación de programas Python de publicación y escucha, acá listamos los pasos básicos para la creación de publicadores y escuchadores que funcionen con ROS.
(!) Antes, tengamos en cuenta que la detección de personas que viene con opencv_apps de ROS lo que hace es buscar en las imágenes patrones que coincidan con cierta geometría rectangular alta. Por eso en la imagen destacada de este artículo vemos marcas de rectángulos donde no hay personas. Al final de este artículo hablamos del comando rosrun rqt_reconfigure rqt_reconfigure
que permite ajustar parámetros «en caliente» para mejorar la precisión.
También, antes de ejecutar estos procedimientos, es probable que necesite ejecutar las instrucciones de algunos artículos anteriores que se listan en esta página: https://costaricamakers.com/?p=914 a partir del punto 4.
En caso de duda o si algo no funciona, les agradezco nos lo hagan saber en los comentarios.
PASO 1 – Primeramente creamos un espacio de trabajo de tipo catkin. Es decir la estructura básica de archivos y herramientas de un espacio de trabajo para ROS usando el sistema de construcción Catkin.
mkdir -p ~/catkin_ws/src cd ~/catkin_ws/src cd ~/catkin_ws/ catkin_make source devel/setup.bash
PASO 2 – Seguidamente crearemos un paquete de ROS al que llamaremos «beginner_tutorials»que no es otra cosa que un conjunto de programas que se pueden manipular mediante ROS.
cd ~/catkin_ws/src catkin_create_pkg beginner_tutorials std_msgs rospy roscpp cd ~/catkin_ws catkin_make . ~/catkin_ws/devel/setup.bash
De nuevo, para más información sobre la creación de paquetes puede visitar el tutorial oficial en http://wiki.ros.org/ROS/Tutorials/CreatingPackage
PASO 3 – Ahora escribiremos los programas básicos de publicación y escucha.
roscd beginner_tutorials mkdir scripts cd scripts wget https://raw.github.com/ros/ros_tutorials/kinetic-devel/rospy_tutorials/001_talker_listener/talker.py chmod +x talker.py
El comando wget de la linea 4 arriba se encargará de descargar nuestro programa de python llamado «talker.py» que se encarga de publicar mensajes en un nodo denominado «chatter» que luego serán leidos desde el programa de escucha o suscriptor.
Para crear el programa de escucha usamos los siguientes comandos:
roscd beginner_tutorials/scripts/ wget https://raw.github.com/ros/ros_tutorials/kinetic-devel/rospy_tutorials/001_talker_listener/listener.py chmod +x listener.py
Con esto se descarga el programa «listener.py» en nuestra carpeta scripts para programas de python.
Este programa escuchará datos publicados al nodo «chatter» y los mostrará en la pantalla.
PASO 4 – Pongamos a prueba estos programas.
Para esto primero compilaremos el paquete usando los siguientes comandos
cd ~/catkin_ws catkin_make
y luego ejecutaremos ambos scripts en terminales diferentes:
rosrun beginner_tutorials listener.py rosrun beginner_tutorials talker.py
Al ejecutarse se puede apreciar como, el listener.py no hace nada, hasta que el talker.py es ejecutado. El programa talker.py envia mensajes con un numero al tópico chatter; estos mensajes son entonces escuchados por el programa listener.py el cual los muestra en la pantalla al recibirlos. Es una dinámica muy simple.
PASO 5 – Modifiquemos el listener.py
Ahora modificaremos el programa listener.py para que en lugar de escuchar el tópico ‘chatter’ publicado por talker.py, escuche un tópico un tanto más avanzado: la cuenta de personas de nuestra cámara.
Usando el siguiente comando abrimos listener.py usando el editor gedit que viene con Ubuntu.
cd ~/catkin_ws sudo gedit src/beginner_tutorials/scripts/listener.py
Luego reemplazamos el contenido del script con el siguiente:
#!/usr/bin/env python # Software License Agreement (BSD License) # # Copyright (c) 2008, Willow Garage, Inc. # All rights reserved. # # Redistribution and use in source and binary forms, with or without # modification, are permitted provided that the following conditions # are met: # # * Redistributions of source code must retain the above copyright # notice, this list of conditions and the following disclaimer. # * Redistributions in binary form must reproduce the above # copyright notice, this list of conditions and the following # disclaimer in the documentation and/or other materials provided # with the distribution. # * Neither the name of Willow Garage, Inc. nor the names of its # contributors may be used to endorse or promote products derived # from this software without specific prior written permission. # # THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS # 'AS IS' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT # LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS # FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE # COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, # INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, # BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; # LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER # CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT # LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN # ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE # POSSIBILITY OF SUCH DAMAGE. # # Revision $Id$ ## Simple talker demo that listens to std_msgs/Strings published ## to the 'chatter' topic import rospy from std_msgs.msg import String from opencv_apps.msg import RectArrayStamped def callback(data): rospy.loginfo(rospy.get_caller_id() + 'I AAAA heard %s', data) def listener(): # In ROS, nodes are uniquely named. If two nodes with the same # name are launched, the previous one is kicked off. The # anonymous=True flag means that rospy will choose a unique # name for our 'listener' node so that multiple listeners can # run simultaneously. rospy.init_node('listener', anonymous=True) rospy.Subscriber('people_detect/found', RectArrayStamped, callback) # spin() simply keeps python from exiting until this node is stopped rospy.spin() if __name__ == '__main__': listener()
Podemos observar las partes clave del programa:
- Linea 41: Importamos de la librería
opencv_apps.msg
el tipo de datosRectArrayStamped
, que es el tipo de datos con que se publican las personas encontradas . - Linea 44: Se muestra en consola los datos recibidos por el suscriptor. Nótese que donde dice
data
, podríamos ponerdata.rects
para obtener unicamente el arreglo de rectángulos que representa a cada persona. - Linea 55: Se define un suscriptor para el tópico
peopledetect/found
con un tipo de datoRectArrayStamped
que al escuchar datos llamatrá la funcióncallback
. Esta función se define en la línea 43 y 44.
Para ejecutar este script usariamos el siguiente comando que nos mostrará los datos escuchados.
rosrun beginner_tutorials listener.py
Otros comandos que suelen ser útiles:
Para listar todos los tópicos que están manejando en la instancia de ROS: rostopic list
Para ver la información de un tópico particular: rostopic echo people_detect/found
Para configurar los tópicos activos mediante un utilitario GUI: rosrun rqt_reconfigure rqt_reconfigure
Finalmente acá les dejamos otra versión del listener.py, el cual hace uso de otro «launcher» de ROS del paquete opencv_apps denominado «hough_circles» que implementa un algoritmo denominado «Transformación Hough Circles» que detecta áreas circulares en una imagen, y mide su radio relativo y su posición en la imagen. ¡Qué lo disfruten!
#!/usr/bin/env python # Software License Agreement (BSD License) # # Copyright (c) 2008, Willow Garage, Inc. # All rights reserved. # # Redistribution and use in source and binary forms, with or without # modification, are permitted provided that the following conditions # are met: # # * Redistributions of source code must retain the above copyright # notice, this list of conditions and the following disclaimer. # * Redistributions in binary form must reproduce the above # copyright notice, this list of conditions and the following # disclaimer in the documentation and/or other materials provided # with the distribution. # * Neither the name of Willow Garage, Inc. nor the names of its # contributors may be used to endorse or promote products derived # from this software without specific prior written permission. # # THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS # "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT # LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS # FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE # COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, # INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, # BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; # LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER # CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT # LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN # ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE # POSSIBILITY OF SUCH DAMAGE. # # Revision $Id$ ## Simple talker demo that listens to std_msgs/Strings published ## to the 'chatter' topic import rospy from std_msgs.msg import String from opencv_apps.msg import CircleArrayStamped def callback(data): rospy.loginfo(rospy.get_caller_id() + 'I AAAA heard %s', data.circles[0].radius) def listener(): # In ROS, nodes are uniquely named. If two nodes with the same # name are launched, the previous one is kicked off. The # anonymous=True flag means that rospy will choose a unique # name for our 'listener' node so that multiple listeners can # run simultaneously. rospy.init_node('listener', anonymous=True) rospy.Subscriber('hough_circles/circles', CircleArrayStamped, callback) # spin() simply keeps python from exiting until this node is stopped rospy.spin() if __name__ == '__main__': listener()
Podemos observar las partes clave del programa:
- Linea 41: Importamos de la librería
opencv_apps.msg
el tipo de datosCircleArrayStamped
, que es el tipo de datos con que se publican los círculos encontrados . - Linea 44: Se muestra en consola los datos recibidos por el suscriptor. Nótese que donde dice
data.circles[0].radius
, muestra la medida relativa de radio del primer elemento del arreglo. - Linea 55: Se define un suscriptor para el tópico
hough_circles/circles
con un tipo de datoCircleArrayStamped
que al escuchar datos llamatrá la funcióncallback
. Esta función se define en la línea 43 y 44.
11,887 total views, 1 views today
Comentarios
Hola, estoy intentando hacer el tutorial, pero al momento de realizar el cambio en el contenido del script de listener.py me está mostrando el siguiente error: ** (gedit:32208): WARNING **: Set document metadata failed: Setting attribute metadata::gedit-spell-enabled not supported ** (gedit:32208): WARNING **: Set document metadata failed: Setting attribute metadata::gedit-encoding not supported por lo tanto no puedo avanzar, porque no puedo ver los datos escuchados, no sé porque está sucediento? o si hay alguna manera para solucionarlo? les agradecería la ayuda 🙂
Hola Rebeca 🙂 Tarde pero seguro: La respuesta para su pregunta es que esos mensajes de WARNING ** son solamente advertencias que el editor de texto envía a la consola para efectos de «debugging»… En nuestro caso ud. puede obviar esos mensajes completamente. Saludos.
Hola Jose, mi nombre es Arturo y estoy en España, me gustaría ponerme en contacto con vosotros para un proyecto. Un saludo!