z-logo
open-access-imgOpen Access
Choix de la fonction de renforcement et des valeurs initiales pour accélérer les problèmes d'Apprentissage par Renforcement de plus court chemin stochastique.
Author(s) -
Laëtitia Matig,
Guillaume J. Laurent,
Nadine Le Fort-Piat
Publication year - 2006
Publication title -
hal (le centre pour la communication scientifique directe)
Language(s) - French
Resource type - Conference proceedings
Subject(s) - humanities , philosophy

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here