L'objet du projet est de s'inspirer finement des propriétés d'un modèle de neurosciences computationnelles pour construire un algorithme d'apprentissage par renforcement performant.
Les articles principaux :
Prioritized memory access explains planning and hippocampal replay | MG , ND Daw - Nature Neuroscience, 2018 | Pdf
Efficient Learning and Planning within the Dyna Framework | Jing Peng, Ronald J. Williams, Adaptive Behavior, 1(4):437-454, 1993 | pdf
Prioritized experience replay | Schaul, T., Quan, J., Antonoglou, I., & Silver, D. arXiv preprint arXiv:1511.05952, 2015 | pdf