Skip to content

Un projet d'apprentissage par renforcement testant divers algorithmes RL, notamment la Programmation Dynamique, Monte Carlo et l'Apprentissage par Différence Temporelle, sur plusieurs environnements comme Grid World, Monty Hall et Pierre-Papier-Ciseaux. 🚀

License

Notifications You must be signed in to change notification settings

Mileristovski/AI-ReinforcementLearning

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Reinforcement Learning Algorithms

Aperçu

Ce projet explore et teste divers algorithmes d'Apprentissage par Renforcement (RL) à travers plusieurs environnements. L'objectif est d'évaluer leurs performances et de comprendre leur comportement dans différents contextes.

Fonctionnalités

  • Algorithmes RL implĂ©mentĂ©s :

    • Programmation Dynamique
    • MĂ©thodes de Monte Carlo
    • Apprentissage par DiffĂ©rence Temporelle
    • Algorithmes de Planification
  • Environnements testĂ©s :

    • Monde en Grille (Grid World)
    • Monde en Ligne (Line World)
    • Problème de Monty Hall (3 portes)
    • Problème de Monty Hall (5 portes)
    • Pierre-Papier-Ciseaux
    • Environnement Secret 🚀

Installation

  1. Cloner le dépôt :
    git clone https://github.com/Mileristovski/reinforcementLearning.git
  2. Se déplacer dans le répertoire du projet :
    cd reinforcementLearning/src/bin/back
  3. Installer les dépendances :
    cargo build --release

Utilisation

  1. Exécuter un algorithme RL sur un environnement donné :
    cargo run --release
  2. Suivre la progression de l'entraînement via les journaux ou les visualisations.

Environnements Testés

  • Monde en Grille (Grid World)
  • Monde en Ligne (Line World)
  • Problème de Monty Hall (3 portes)
  • Problème de Monty Hall (5 portes)
  • Pierre-Papier-Ciseaux
  • Environnement Secret

Algorithmes RL Implémentés

  • Programmation Dynamique
  • MĂ©thodes de Monte Carlo
  • Apprentissage par DiffĂ©rence Temporelle
  • Algorithmes de Planification

Contribution

Les contributions sont les bienvenues ! N'hésitez pas à forker le dépôt et à soumettre une pull request.

Licence

Ce projet est sous licence MIT. Consultez le fichier LICENSE pour plus de détails.


🚀 Bon apprentissage par renforcement !

About

Un projet d'apprentissage par renforcement testant divers algorithmes RL, notamment la Programmation Dynamique, Monte Carlo et l'Apprentissage par Différence Temporelle, sur plusieurs environnements comme Grid World, Monty Hall et Pierre-Papier-Ciseaux. 🚀

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages