Redes Neuronales

Indice

Presentación

Reseña Histórica
- Intentos
- Emergente
- Frustración
- Innovación
- Resurgimiento
- Hoy

La Neurona Biológica

La Neurona Artificial

Definición de red neuronal

Parte 2

INTRODUCCION Y CONCEPTOS BASICOS (Parte 1)

PRESENTACION

Muchos de los desarrollos del hombre se deben a su capacidad para explicar y emular funciones que son realizadas por seres vivos. Por ejemplo, se puede citar el radar, que surge como imitación de la forma como un murciélago es capaz de detectar los objetos que están en su camino sin necesidad de verlos, por medio de emisión de una onda ultrasónica, la posterior recepción de la señal de eco y su procesamiento. Así como el anterior hay muchos ejemplos más : El helicóptero, el avión, el submarino, para citar algunos. Aunque el hombre ha sido capaz de emular funciones de los animales, para él siempre ha sido un sueño poder conocer e imitar, la llamada por muchos la máquina perfecta : el cerebro humano.
Cuando la neurociencia pudo explicar de forma un poco convincente el funcionamiento de la unidad principal de procesamiento de información que posee el cerebro, la neurona, surge casi de manera automática la idea de poder emular dicho funcionamiento en un elemento artificial "La neurona artificial."

RESEÑA HISTÓRICA DE LAS REDES NEURONALES

Las simulaciones de redes neuronales no son un desarrollo reciente. Este campo fue establecido antes del advenimiento de los computadores, pero su verdadero desarrollo tuvo lugar cuando las simulaciones por computador fueron factibles por capacidad de procesamiento y bajo costo. Luego de un periodo inicial de entusiasmo, las redes neuronales cayeron en un periodo de frustración y desprestigio. Durante este periodo, cuando el soporte económico y computacional era mínimo, solo unos pocos investigadores consiguieron logros importantes. Estos pioneros fueron capaces de desarrollar una tecnología que sobrepasara las limitaciones identificadas por Minsky and Papert en 1969, cuando publicaron un libro con el que sembraron un desencanto y frustración general en la comunidad científica contra las redes neuronales, que aceptó las conclusiones de estos investigadores sin un mayor análisis. Actualmente, las redes neuronales es un campo en el cual resurgió el interés y correspondientemente la financiación para investigar en las mismas ha aumentado. La historia de las redes neuronales puede dividirse en varios periodos :

1. Primeros intentos: Se realizaron algunas simulaciones usando lógica formal. McCulloch and Pitts (1943) desarrollaron modelos de redes neuronales basados en su conocimiento de neurología. Dichos modelos tenían varios supuestos acerca del funcionamiento de las neuronas. Sus redes se basaban en neuronas simples, consideradas como dispositivos binarios con umbrales fijos. Los resultados de sus modelos fueron funciones lógicas elementales tales como "a o b" y "a y b". Dos grupos (Farley and Clark, 1954; Rochester, Holland, Haibit and Duda, 1956) lo intentaron usando simulaciones computacionales. El primer grupo conformado por investigadores de IBM mantenía un contacto cercano con neurocientíficos de la universidad de McGill, estableciendo una tendencia interdisciplinaria que se mantienes en la actualidad.

2. Tecnología emergente y promisoria: No solo la neurociencia influía en el desarrollo de las redes neuronales, también los físicos y los ingenieros contribuían al progresos de las simulaciones de redes neuronales. Rosenblatt (1958) revitalizó fuertemente el interés y la actividad en esta área cuando diseñó y desarrollo su Perceptrón. El Perceptrón tiene tres capas, incluida la capa del medio denominada de asociación. Este sistema pudo aprender a conectar y asociar unas entradas dadas a una unidad de salida aleatoria. Otro sistema fue el ADALINE (ADAptive LInear Element) el cual fue desarrollado en 1960 por Widrow and Hoff (de la Universidad de Stanford ). El ADALINE fue un dispositivo electrónico analógico hecho de componentes simples, con un método de aprendizaje diferente al del Perceptron, empleando una regla de aprendizaje basada en mínimos cuadrados (LMS).

3. Periodo de frustración y desprestigio: En 1969 Minsky and Papert escribieron un libro en cual ellos generalizaban las limitaciones de un Perceptron monocapa a sistemas multicapa. En el libro ellos decían: "...nuestro intuitivo juicio es que la extensión (a sistemas multicapa) es una tarea estéril". El resultado de las afirmaciones de este libro fue eliminar la financiación para los investigadores que trabajaban con simulaciones de redes neuronales. Las conclusiones del libro de Minsky and Papert soportadas con el desencanto de los investigadores en el área, trajo como resultado un gran prejuicio contra la actividad de la misma.

4. Innovación : Aunque el interés público por las redes neuronales era mínimo, varios investigadores continuaron trabajando en el desarrollo de métodos computacionales basados en neuromorfología para problemas de identificación de patrones. Durante este periodo varios paradigmas fueron generados, los cuales aun continúan con trabajos modernos, se puede mencionar a: Steve Grossberg and Gail Carpenter quienes desarrollaron la teoría de la resonancia adaptativa, ART (Adaptive Resonance Theory),. Anderson y Kohonen (1982) quienes desarrollaron técnicas para aprendizaje asociativo. Hopfield (1984)quien desarrolló una red neuronal haciendo un símil energético. Werbos (Paul Werbos 1982) desarrolló y usó el método de aprendizaje conocido como Backpropagation, destancando que varios años después de popularizarse este método, es actualmente la arquitectura de red neuronal mejor conocida y más utilizada en las aplicaciones de redes neuronales. En esencia una red Back-propagation es un Perceptron con múltiples capas, con diferentes funciones de activación en las neuronas artificiales y con una regla de aprendizaje más robusta y confiable.

5. Resurgimiento : Durante el final de la década de los 70s y principios de los 80s, fue importante el resurgimiento del interés en el campo de las redes neuronales. Varios factores han influenciado este movimiento, tales como la aparición de libros y conferencias que han dado a conocer las bondades de esta técnica a personas de diferentes áreas. Introducción de cursos en los programas académicos de las principales universidades europeas y americanas. El financiamiento a proyectos de investigación en redes neuronales en Europa, EUA y Japón que han hecho que aparezcan una gran variedad de aplicaciones comerciales e industriales.

6. Hoy : Se han realizado progresos muy significativos en el campo de las RNA, lo suficientes como para atraer una gran atención e interés en financiar investigaciones. Ya se encuentran comercialmente circuitos integrados basados en RNAs y las aplicaciones desarrolladas resuelven problemas cada vez más complejos. Sin lugar a dudas, hoy es un periodo de transición y fuerte evolución para la tecnología en redes neuronales.

LA NEURONA BIOLÓGICA.

Una neurona es una célula viva, y como tal, contiene los mismos elementos que forman parte de todas las células biológicas, además, de poseer elementos característicos que la diferencian. En general una neurona consta de un cuerpo celular más o menos esférico de 5 a 10 micras de diámetro, del que sale una rama principal el axón, y varias ramas más cortas denominadas dentritas. A su vez el axón puede producir ramas en torno a su punto de arranque, y con frecuencia se ramifica extensamente cerca de su extremo, figura 1.

Figura No. 1 Esquema de una neurona biológica

Una de las características que diferencian a las neuronas del resto de células vivas, es su capacidad de comunicarse. En términos generales, las dentritas y el cuerpo celular reciben señales de entrada, el cuerpo celular las combina e integra y emite señales de salida. El axón transporta esas señales a los terminales axónicos, que se encargan de distribuir información a un nuevo conjunto de neuronas. Por lo general una neurona recibe información de miles de otras neuronas y, a su vez, envía información a miles de neuronas más. Se calcula que en el cerebro humano existen del orden de 10 a la 15 conexiones. En la tabla 1 se muestra un paralelo entre un computador secuencial (Computador de Von Neumann) y un sistema biológico

Característica	Computador secuencial	Sistema biológico neuronal
Unidad de Procesamiento	Compleja, Veloz, Unica	Simple, Lenta, Muchas
Memoria	Separada del procesador, Localizada	Integrada dentro del procesador, Distribuida, Direccionable por contenido
Procesamiento de los Datos	Centralizado, Secuencial, Programas almacenados	Distribuido ,Paralelo, Auto aprendizaje
Confiabilidad	Muy vulnerable	Robusto
Especialización	Manipulaciones simbólicas y numéricas	Problemas perceptuales
Ambiente de operación	Bien definido, Muy restringido	Pobremente definido, Sin restricciones

LA NEURONA ARTIFICIAL

Cualquier modelo de red neuronal consta de dispositivos elementales de procesamiento: las neuronas. A partir de ellas, se pueden generar representaciones específicas, de tal forma que un estado conjunto de ellas pueda significar una letra, un número o cualquier otro objeto. Generalmente se pueden encontrar tres tipos de neuronas:
1. Aquellas que reciben estímulos externos, relacionas con el aparato sensorial, que tomarán la información de la entrada, denominadas unidades de entrada.

2. Dicha información se transmite a ciertos elementos internos que se ocupan de su proceso. Es la sinapsis y neuronas correspondientes a este segundo nivel donde se genera cualquier tipo de representación interna de la información. Puesto que no tienen relación directa con la información de entrada y de salida, estos elementos se denominan unidades ocultas.

3. Una vez ha finalizado el periodo de procesado, la información llega a las unidades de salida, cuya misión es dar la respuesta del sistema.

Figura No. 2 Esquema de una neurona artificial

La tecnología basada en redes neuronales artificiales es de caracter bio-inspirado pues su funcionamiento trata de imitar el funcionamiento de elementos biologicos que en este caso los constituyen las neuronas del cerebro. En la figura 2 se ilustra una neurona artificial

DEFINICIÓN DE RED NEURONAL

Darpa (1988), define una red neuronal como un sistema compuesto de muchos elementos simples de procesamiento los cuales operan en paralelo y cuya función es determinada por la estructura de la red, el peso de las conexiones; realizándose el procesamiento en cada uno de los nodos o elementos de computo.

Según Haykin (1994), una red neuronal es un procesador paralelo masivamente distribuido que tiene una facilidad natural para el almacenamiento de conocimiento obtenido de la experiencia para luego hacerlo utilizable. Se parece al cerebro en dos aspectos:

1. El conocimiento es obtenido por la red a través de un proceso de aprendizaje.
2. Las conexiones interneuronales conocidas como pesos sinápticos son utilizadas para almacenar dicho conocimiento.

Kohonen (1998) las define como redes de elementos simples (usualmente adaptativos) masivamente interconectados en paralelo y con organización jerárquica, las cuales intentan interactuar con los objetos del mundo real del mismo modo que lo hace el sistema nervioso biológico.

En síntesis se puede considerar que una Red Neuronal Artificial es un sistema de procesamiento de información que tiene ciertas características de comportamiento en común con las redes neuronales biológicas. Las redes neuronales artificiales han sido desarrolladas como generalizaciones de modelos matemáticos del conocimiento humano o de la biología neuronal, con base en los siguientes considerandos :
1. El procesamiento de información se realiza en muchos elementos simples llamados neuronas.
2. Las señales son pasadas entre neuronas a través de enlaces de conexión
3. Cada enlace de conexión tiene un peso asociado, el cual, en una red neuronal típica, multiplica la señal transmitida.
4. Cada neurona aplica una función de activación (usualmente no lineal) a las entradas de la red (suma de las señales de entrada pesadas) para determinar su señal de salida.

Las RNAs han sido aplicadas en un gran número de problemas reales de complejidad considerable. Su más importante ventaja es la de resolver problemas que son muy complejos para tecnologías convencionales, problemas que no tienen una solución determinística o para los cuales una solución determinística es muy complicado encontrarla. En general, por ser una abstracción del cerebro biológico, las RNA son buenas para resolver aquellos problemas que las personas resuelven adecuadamente, pero que los computadores no. Estos problemas, entre otros, incluyen reconocimiento de patrones y problemas de pronóstico (los cuales requieren el reconocimiento de una tendencia en unos datos).

Arriba

Parte 2

Comentarios
jes_alf_lopez@yahoo.com

[Redes Neuronales] [Computación Evolutiva] [Lógica Difusa] [Principal]

Ultima modificación Agosto/03/2000