Robotica


La robótica móvil es un campo de investigación relativamente nuevo que está relacionado con el control de vehículos autónomos o semi-autónomos. Los robots móviles no son sólo una colección de algoritmos, sino también sistemas físicos que trabajan en entornos reales. Así, los robots móviles facilitan un marco de trabajo en el mundo real donde se pueden probar conceptos teóricos y algoritmos. Aunque la mayoría de los robots móviles son experimentales, hay aplicaciones emergentes de importancia industrial o comercial.

El trabajo presenta una serie de trabajos relacionados a la robótica móvil, que abarcan los distintos niveles necesarios para conseguir que un robot móvil realice tareas de forma independiente en un entorno previamente desconocido. Se emplean técnicas de Soft- Computing (redes neuronales, algoritmos genéticos, y especialmente lógica difusa) para el desarrollo de los distintos niveles.

Se empieza describiendo la arquitectura hardware que da lugar a la plataforma Quaky- Ant, un robot autónomo móvil que es la base de la mayor parte de las pruebas de los distintos algoritmos en entorno real. Tomando como base esta plataforma, se presenta una solución al problema de la fusión sensorial no basada en modelo del entorno.

Dicha fusión se resuelve inicialmente con una red neuronal simple para, posteriormente, utilizar un sistema híbrido que genera reglas difusas y basadas en la red ANFIS y algunos algoritmos de clustering, uno de los cuales ha sido desarrollado en el marco de este trabajo, el clustering difuso con búsqueda tabú. Una vez que se asumen unos sensores mejorados (tras el proceso de fusión sensorial), se plantea el problema de la navegación. Este se resuelve, en dos etapas, por la aplicación de dos técnicas de navegación. En la primera etapa se aplica un mapa de celdillas difusas para el problema de la elaboración de mapas, así como una búsqueda para el problema de la generación de trayectorias. En la segunda etapa se aplica un mapa de segmentos difusos para el problema de la elaboración de mapas, así como un sistema de localización basado en el mapa de segmentos difusos.

Para realizar todos estos trabajos en los cuales el nivel inteligencia artificial debe ser muy superior a lo acostumbrado, debiendo de utilizar de esta forma una logia difusa además que se requiere fusionar los conceptos de sensores de robots de gran percepción y un sistema que utilice sistemas neuro difusos; Es preciso reconocer que la visión por computador a veces no es la mejor solución a un problema.
Existen muchas ocasiones en las que el problema es tan complejo que la solución humana es lo mejor.

En muchos de los casos las soluciones humanas carecen de sentido tienden a ser subjetivas y en ocasiones son lentas, pero aun de esa forma muchas son soluciones acertadas y otras no acertadas.

No obstante, la solución humana es menos estructurada que la solución artificial y muchos problemas de visión por computador requieren un nivel de inteligencia mucho mayor que el que la máquina pueda ofrecer. El sistema de visión humana puede describir automáticamente una textura en detalle, un borde, un color, una representación bidimensional de una tridimensional, ya que puede diferenciar entre imágenes de diferentes personas, firmas, colores, etc., puede vigilar ciertas zonas, diagnosticar enfermedades a partir de radiografías, etc. Sin embargo, aunque algunas de estas tareas pueden llevarse a cabo mediante visión artificial, el software o el hardware necesario no consigue los resultados que serían deseables.

Aun a pesar de las limitaciones expuestas, cada día es mayor el número de aplicaciones de la visión artificial. Por ello sólo es posible dar una pequeña reseña sobre las múltiples aplicaciones en las que la visión artificial se ha aplicado hasta el momento.

Las redes neuronales artificiales (RNAs) son la implementación en hardware y software de modelos matemáticos idealizados de la neuronas biológicas, están dan como resultado neuronas artificiales que son interconectadas una a otras y distribuidas en capas, emulando la estructura neuronal de cerebro, esta forma de estructura ofrece diversos tipos de procesamiento a partir de estímulos similares a un sistema cerebral biológico.
Estas redes a diferencia de las computadoras ordinarias que son programadas para realizar tareas específicas, las redes neuronales artificiales, tal como los sistemas cerebrales biológicos, deben ser entrenadas. Tomando en cuenta estas consideraciones redes neuronales artificiales aparentan ser obsoletas al inicio pero con entrenamiento su eficiencia en cualquier ámbito puede ser ilimitada. Los algoritmos de aprendizaje dependen esencialmente del tipo de aplicación de la red así como de su topología.

La lógica difusa o borrosa es una técnica de computación flexible Soft-Computing que le permite a un computador clasificar información del mundo real, proporciona un soporte matemático formal al razonamiento basa en el lenguaje natural, es un razonamiento aproximado que hace uso de proposiciones que expresan información imprecisa.

En cualquier caso, el proceso que normalmente hay que seguir para llegar a una determinada aplicación se resume en el esquema de la figura 1, donde partiendo de la adquisición de las imágenes se llega a las aplicaciones de interés.


Adquisición de la imagen                Muestreo y digitalización
Procesamiento                                              Realzado, suavizado, etc.
Detección de Bordes                                   Gradiente, pasos por cero
Segmentación                                               Extracción de objetos
Extracción de Características                      Representación matemática de los objetos
Reconocimiento y Localización       Qué son y dónde están
Interpretación de la escena Aplicaciones
                                               
Para la navegación en robótica se recurre generalmente a técnicas de visión estereoscópica con el fin de poder reconstruir la escena 3-D. Si a esto se le añade algún módulo de reconocimiento 3-D con el fin de identificar la presencia de determinados objetos, hacia los que debe dirigirse o evitar, tanto mejor.

La medicina utiliza muchas aplicaciones en las que aparece el procesamiento de imágenes, la mayoría de ellas orientadas hacia el diagnóstico de dolencias o enfermedades, entre las que se incluyen radiografías, resonancias magnéticas, tomografías, etc.
Éste es un campo extraordinariamente amplio donde la mejor fuente de ejemplos y aplicaciones la constituye la revista IEEE Trans. Medical Imaging. A veces, en algunas otras revistas de medicina se incluyen diversas aplicaciones basadas en imágenes médicas. Lester y Arridge presentan una revisión de métodos relativos a lo que en inglés se denomina Image Registration y que en definitiva se trata de definir una estrategia para encontrar la correspondencia entre un modelo y un objeto, siendo necesario definir las características o estructuras, el espacio de búsqueda y la métrica para determinar el grado de semejanza, los parámetros definidos que buscan algunas características en las radiografías resonancia histogramas, etc., permiten a un sistema diagnosticar y hacer algún tipo de prescripción adecuada a la situación adecuada.

Todas estas herramientas permiten un uso óptimo de esta aplicación y una vez que se tienen desarrolladas las capacidades básicas de navegación y percepción del entorno, se define una arquitectura distribuida de control (BGA) que sirve como base del desarrollo de los distintos elementos de control. Esta arquitectura permite distinguir entre procesos deliberativos y comportamientos reactivos. Los distintos elementos de la arquitectura se comunican por medio de un protocolo basado en KQML sobre UDP. Para facilitar el desarrollo de programas de control por medio de la arquitectura BGA, se ha definido un lenguaje (BG) que hace uso de la lógica difusa para especificar y definir los distintos módulos de control.

La arquitectura BGA y el lenguaje BG se han integrado en un entorno de programación y simulación (BGen) desarrollado íntegramente en Java, con el objetivo de poder ser integrado en distintos robots móviles. Para resolver el problema de la fusión de comportamientos se ha utilizado un algoritmo genético que genera y sintoniza el conjunto de reglas difusas de fusión, evaluando las distintas soluciones candidatas en el entorno BGen. Finalmente, se muestra una aplicación de la plataforma Quaky-Ant y del entorno BGen en un entorno web (BGen-Web) que permite la teleoperación del robot móvil en tareas de exploración y presenta al usuario gran interactividad gracias al uso de la transmisión de vídeo multicast.