-
Notifications
You must be signed in to change notification settings - Fork 0
NXabo/EarthLander_ReinforcementLearning
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
# EarthLander - Nicolas Xaborov - Modifié pour Reinforcement Learning - README # 04/2023 # #### DOSSIER #### Vérifiez que dans votre dossier se trouve les éléments suivants : - EarthLanderQL, fichier par lequel vous allez générer la matrice de prise de décision pour votre agent de réenforcement. - EarthLanderManual, fichier dans lequel vous pourrez lancer le jeu au format graphique et tester votre matrice de prise de décision. - trans_matrix.txt, fichier texte dans lequel sera sauvé la matrice de prise de décision et qui sera chargé dans EarthLanderManual lors de votre test graphique. #### MAKE IT WORK #### Ligne par ligne vous sera décrit quoi changer/introduire. ## MatrixGenerator.py : ligne 17 et 18, introduire vos paramètres de départ (altitude et vitesse) ligne 22 et 23, introduire les vecteurs d'altitudes et vitesses possibles EXEMPLE : alt_poss = [[0,1000],[1000,2000],[2000,3000], [3000,4000],[4000,5000],[5000,99999999999]] speed_poss = [[-999,0],[0,40],[40,999999]] VEILLEZ à ce que les intervalles se suivent directement, que la valeur de droite soit la valeur de gauche dans l'intervalle qui suit. ligne 27 à 30, introduire vos paramètres epsilon (eps_...) et episodes (epi_...) ligne 34 à 36, introduire vos paramètres de feedback (reward positif et négatif et le disrupt factor) ligne 37, pour un gain de temps de traitement, vous pouvez mettre en commentaire last_speed mais devez alors également commenter la ligne 53 et la ligne 123 ligne 63 et 64, ré-introduire les vecteurs d'altitudes et vitesses possibles ligne 70, réglez la fréquence de mise à jour de la progression en modifiant la valeur après le modulo (%). Plus la valeur est grande, moins souvent la progression est rapportée ligne 82 et 83, ré-introduisez vos paramètres de départ ## EarthLanderManual.py : ligne 12, 13, 20 et 21, ré-introduisez les paramètres en respectant ce que vous avez fait dans EarthLanderQL. #### trans_matrix #### N'oubliez pas de vider le fichier entre chaque entrainement, car sinon votre matrice précédente influencera vos résultats. Clic droit sur le fichier -> ouvrir avec -> bloc-note -> supprimez tous pour en faire un fichier texte vide. BONNE CHANCE, Nicolas Xaborov.
About
This repository is a project made for school. A simple and short introduction to reinforcement learning.
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published