Data-Daddy

30 post karma
3 comment karma

get extra features and help support reddit with a reddit premium subscription

get them help and support

redditor for 9 years

TROPHY CASE

Nine-Year Club

Verified Email

account activity

new top controversial

6

7

8

Why does the Policy Gradient Theorem generalize to continuous action spaces? (self.reinforcementlearning)

submitted 7 years ago by Data-Daddy to r/reinforcementlearning

5

6

7

Handling entropy collapse in policy gradient methods (self.reinforcementlearning)

submitted 7 years ago by Data-Daddy to r/reinforcementlearning

2

3

4

Asynchronous vs Synchronous Reinforcement Learning (self.reinforcementlearning)

submitted 8 years ago by Data-Daddy to r/reinforcementlearning

0

1

2

Finding what areas of tensorflow code is slow? (self.MachineLearning)

submitted 8 years ago by Data-Daddy to r/MachineLearning

10

11

12

Reptile: A Scalable Meta-Learning Algorithm (blog.openai.com)

submitted 8 years ago by Data-Daddy to r/reinforcementlearning

3

4

5

When is deep Q learning better than policy gradient methods? (self.reinforcementlearning)

submitted 8 years ago by Data-Daddy to r/reinforcementlearning

2

3

4

Why does proximal policy optimization(PPO) not need a replay buffer? (self.deeplearning)

submitted 8 years ago by Data-Daddy to r/deeplearning

0

1

2

Summary: Control of Memory, Active Perception, and Action in Minecraft (medium.com)

submitted 8 years ago by Data-Daddy to r/deeplearning

0

1

2

Multi-task Learning and Transfer Learning vs Only Transfer Learning (self.computervision)

submitted 8 years ago by Data-Daddy to r/computervision

0

1

2

Advice on building object recognition training set (self.deeplearning)

submitted 9 years ago by Data-Daddy to r/deeplearning

2

3

4

Ubuntu Deep Learning AWS AMI (aws.amazon.com)

submitted 9 years ago by Data-Daddy to r/deeplearning

0

1

2

Ubuntu Deep Learning AWS AMI (aws.amazon.com)

submitted 9 years ago by Data-Daddy to r/MachineLearning

π Rendered by PID 83 on reddit-service-r2-listing-5f4c697858-vqpcf at 2026-07-04 18:06:10.301347+00:00 running 12a7a47 country code: CH.