
Choix de la fonction de renforcement et des valeurs initiales pour accélérer les problèmes d'Apprentissage par Renforcement de plus court chemin stochastique.
Author(s) -
Laëtitia Matig,
Guillaume J. Laurent,
Nadine Le Fort-Piat
Publication year - 2006
Publication title -
hal (le centre pour la communication scientifique directe)
Language(s) - French
Resource type - Conference proceedings
Subject(s) - humanities , philosophy