Detalles de: Aprendizaje de selección de acciones en un mundo simple pero impredecible / › Biblioteca Universidad Católica de Colombia Koha

Tipo:

Análitica de Seriada

Aprendizaje de selección de acciones en un mundo simple pero impredecible /
Autor:	Rojas, Sergio.
Tema(s):	C [LENGUAJE DE PROGRAMACION DE COMPUTADORES] INTELIGENCIA ARTIFICIAL TEORIA DE LAS MAQUINAS
Resumen:	Uno de los principales problemas estudiados en la simulación de agentes artificiales autónomos es el de la selección de acciones: un mecanismo que le permita al sistema escoger la acción más apropiada para la situación en que se encuentre, de tal forma que maximice su medida de éxito. El aprendizaje por refuerzo representa un enfoque atractivo para atacar este problema, ya que se basa en la búsqueda de señales de premio y la evasión de señales de castigo mediante un proceso de ensayo y error. En este artículo presentamos al PAISA I, una criatura artificial que aprende a comportarse (seleccionar acciones) utilizando una técnica de aprendizaje por refuerzo (aprendizaje Q) para optimizar la cantidad de comida que puede encontrar en un mundo impredecible, aunque con un espacio estado-acción pequeño

Etiquetas de esta biblioteca: No hay etiquetas de esta biblioteca para este título. Ingresar para agregar etiquetas.

No hay ítems correspondientes a este registro

Industrial

Uno de los principales problemas estudiados en la simulación de agentes artificiales autónomos es el de la selección de acciones: un mecanismo que le permita al sistema escoger la acción más apropiada para la situación en que se encuentre, de tal forma que maximice su medida de éxito. El aprendizaje por refuerzo representa un enfoque atractivo para atacar este problema, ya que se basa en la búsqueda de señales de premio y la evasión de señales de castigo mediante un proceso de ensayo y error. En este artículo presentamos al PAISA I, una criatura artificial que aprende a comportarse (seleccionar acciones) utilizando una técnica de aprendizaje por refuerzo (aprendizaje Q) para optimizar la cantidad de comida que puede encontrar en un mundo impredecible, aunque con un espacio estado-acción pequeño

No hay comentarios en este titulo.

para colocar un comentario.

Aprendizaje de selección de acciones en un mundo simple pero impredecible /

Código QR