z-logo
open-access-imgOpen Access
Análise da influência da taxa de aprendizado e do fator de desconto sobre o desempenho dos algoritmos Q-learning e SARSA: aplicação do aprendizado por reforço na navegação autônoma
Author(s) -
André Luiz Carvalho Ottoni,
Erivelton G. Nepomuceno,
Marcos Santos de Oliveira,
Lara Toledo Cordeiro,
Rubisson Duarte Lamperti
Publication year - 2016
Publication title -
revista brasileira de computação aplicada
Language(s) - Portuguese
Resource type - Journals
ISSN - 2176-6649
DOI - 10.5335/rbca.v8i2.5249
Subject(s) - mathematics , humanities , physics , philosophy
Nos algoritmos de aprendizado por reforço, a taxa de aprendizado (alpha) e o fator de desconto (gamma) podem ser definidos entre qualquer valor no intervalo entre 0 e 1. Assim, adotando os conceitos de regressão logística, é proposta uma metodologia estatística para a análise da influência da variação de \alpha e \gamma nos algoritmos Q-learning e SARSA. Como estudo de caso, o aprendizado por reforço foi aplicado em experimentos de navegação autônoma. A análise de resultados mostrou que simples variações em \alpha e \gamma podem interferir diretamente no desempenho do aprendizado por reforço

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here