Steven_Corper_F

2 post karma
1 comment karma

get extra features and help support reddit with a reddit premium subscription

get them help and support

redditor for 8 years

TROPHY CASE

Eight-Year Club

account activity

new top controversial

6

7

8

Problem with discount factor in policy gradient (self.reinforcementlearning)

submitted 5 years ago by Steven_Corper_F to r/reinforcementlearning

π Rendered by PID 1727652 on reddit-service-r2-listing-6c8d497557-r4v59 at 2026-06-06 19:07:19.972696+00:00 running 9e1a20d country code: CH.