z-logo
open-access-imgOpen Access
Método de error de Bellman con ponderación de volumen para mallado adaptativo en programación dinámica aproximada
Author(s) -
Leopoldo Armesto Ángel,
Antonio Sala
Publication year - 2021
Publication title -
revista iberoamericana de automática e informática industrial
Language(s) - Spanish
Resource type - Journals
eISSN - 1697-7920
pISSN - 1697-7912
DOI - 10.4995/riai.2021.15698
Subject(s) - humanities , philosophy , physics
El control óptimo y aprendizaje por refuerzo lleva asociada una "función de valor'' que debe ser adecuadamente aproximada. Estos problemas de aproximar funciones de valor tienen, usualmente, diferentes requerimientos de precisión en diferentes regiones del espacio de estados. Un mallado uniforme tiene problemas porque desperdicia recursos en regiones en las que la función de valor es suave, mientras que no tiene la suficiente resolución en zonas con grandes cambios en dicha función.  El presente trabajo propone una metodología de programación dinámica aproximada con mallado adaptativo, para poder adaptarse a dichos requerimientos cambiantes sin incrementar en exceso el número de parámetros del aproximador. La propuesta se basa en mallados simpliciales y en el error en la ecuación de Bellman con un criterios para añadir y quitar puntos del mallado: se modificarán propuestas de la literatura incluyendo el volumen de los símplices afectados en los criterios, y se detallarán las manipulaciones de la triangulación necesarias.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here