Análise da influência da taxa de aprendizado e do fator de desconto sobre o desempenho dos algoritmos Q-learning e SARSA: aplicação do aprendizado por reforço na navegação autônoma | Zendy

André Luiz Carvalho Ottoni | Zendy; Erivelton G. Nepomuceno | Zendy; Marcos Santos de Oliveira | Zendy; Lara Toledo Cordeiro Ottoni | Zendy; Rubisson Duarte Lamperti | Zendy

Open Access

Análise da influência da taxa de aprendizado e do fator de desconto sobre o desempenho dos algoritmos Q-learning e SARSA: aplicação do aprendizado por reforço na navegação autônoma

Author(s) -

André Luiz Carvalho Ottoni,

Erivelton G. Nepomuceno,

Marcos Santos de Oliveira,

Lara Toledo Cordeiro Ottoni,

Rubisson Duarte Lamperti

Publication year - 2016

Publication title -

revista brasileira de computação aplicada

Language(s) - Portuguese

Resource type - Journals

ISSN - 2176-6649

DOI - 10.5335/rbca.v8i2.5249

Subject(s) - mathematics , humanities , physics , philosophy

Nos algoritmos de aprendizado por reforço, a taxa de aprendizado (alpha) e o fator de desconto (gamma) podem ser definidos entre qualquer valor no intervalo entre 0 e 1. Assim, adotando os conceitos de regressão logística, é proposta uma metodologia estatística para a análise da influência da variação de \alpha e \gamma nos algoritmos Q-learning e SARSA. Como estudo de caso, o aprendizado por reforço foi aplicado em experimentos de navegação autônoma. A análise de resultados mostrou que simples variações em \alpha e \gamma podem interferir diretamente no desempenho do aprendizado por reforço

The content you want is available to Zendy users.

Already have an account? Click here to sign in.

Having issues? You can contact us here

Empowering knowledge with every search

About

About Careers Publisher Partners Contact Us

Learn

FAQs Blog Terms of Use Privacy Policy

About

Learn

Discover

Explore