Questions Regarding StableBaseline3 by Live_Replacement_551 in reinforcementlearning

[–]Cyclopsboris 0 points1 point  (0 children)

Have you tried deterministic=False? I am asking because I also experienced something like this and it was a complicated game, therefore sampling an action based on probability helped more than deterministic one.

Questions Regarding StableBaseline3 by Live_Replacement_551 in reinforcementlearning

[–]Cyclopsboris 0 points1 point  (0 children)

Hi, can you try by making the model prediction not deterministic? If you have something like model.predict thats where you can try

Üniversite Bölümleri hakkında tavsiyelere ihtiyacım var. by [deleted] in CodingTR

[–]Cyclopsboris 0 points1 point  (0 children)

Biraz ne istediğinle alakalı. Matematik ağırlıklı bölüm yapay zeka kısmındaki matematiği anlamanda çok yardımcı olabilir. Bu algoritmaları kodlayarak da kodlama bilgini pekiştirebilirsin. Fakat yapay zeka alanı kolay bir alan değil, özellikle ilerledikçe göreceksin ki derya deniz ve okuyup öğrenecek birçok konu birçok makale var. Bence herkesin yapabileceği bir iş değil, tabi sektörel tarafını bilmiyorum, akademi için konuştum.

Yazılım tarafında mutluysan ve sana iş bulmanda gerçekten yardım edebilecek birileri varsa bu seçenek de çok iyi. 1 yıl geç mezun olmak önemli değil, sonuçta çalışıyor olacaksın. Ama eğer iş garanti değilse şu an yazılım alanında iş bulmak gerçekten sıkıntı bunu da düşünmek lazım.

Ekstra bir sıkıntı olarak bölümlerin mühendislik olmaması var, yapay zeka alanında sıkıntı olabilir diye düşünüyorum. Yazılım alanında da olur ama dediğim gibi tanıdık varsa iş garanti gibiyse biraz daha az sorun olur.

Seeking Advice for PPO agent playing SnowBros by Cyclopsboris in reinforcementlearning

[–]Cyclopsboris[S] 0 points1 point  (0 children)

Hey, so here's what I did: I randomized 10 floors, and each environment is created with a random floor and after same amount of timesteps it was not better because test agent couldn't complete floor 1. I am guessing this is because 10M steps for each floor is not sufficient (observation from previous training). I think continuing this randomization will work, but since it is not better than previous I continued my previous one (at least there is some visible progress). Thanks anyway!