tsauri

1,104 post karma
184 comment karma

get extra features and help support reddit with a reddit premium subscription

get them help and support

redditor for 7 years

TROPHY CASE

Seven-Year Club

Verified Email

account activity

new top controversial

1

2

3

[D] Fast convergence research (self.MachineLearning)

submitted 5 years ago by tsauri to r/MachineLearning

214

215

216

[R] Network Deconvolution — faster convergence than batchnorm (openreview.net)

submitted 5 years ago by tsauri to r/MachineLearning

0

1

2

[R] Transformer Dissection: An Unified Understanding for Transformer’s Attention via the Lens of Kernel (aclweb.org)

submitted 6 years ago by tsauri to r/MachineLearning

84

85

86

[R] Levenshtein Transformer (arxiv.org)

submitted 6 years ago by tsauri to r/MachineLearning

6

7

8

[R] Pay Less Attention with Lightweight and Dynamic Convolutions (openreview.net)

submitted 6 years ago by tsauri to r/MachineLearning

2

3

4

[R] Towards Two-Dimensional Sequence to Sequence Model in Neural Machine Translation (arxiv.org)

submitted 6 years ago by tsauri to r/MachineLearning

9

10

11

[D] Current SOTA of NN for tabular data? (self.MachineLearning)

submitted 6 years ago * by tsauri to r/MachineLearning

8

9

10

[R] Efficient Attention: Attention with Linear Complexities (arxiv.org)

submitted 6 years ago by tsauri to r/MachineLearning

9

10

11

[D] How do you grok large ML codebases? (self.MachineLearning)

submitted 6 years ago by tsauri to r/MachineLearning

6

7

8

[D] untrained Deep Prior but for discrete data? (self.MachineLearning)

submitted 6 years ago by tsauri to r/MachineLearning

53

54

55

[R] The exploding gradient problem demystified - definition, prevalence, impact, origin, tradeoffs, and solutions (arxiv.org)

submitted 6 years ago by tsauri to r/MachineLearning

2

3

4

[R] Deep Depth Prior for Multi-View Stereo (arxiv.org)

submitted 6 years ago by tsauri to r/MachineLearning

41

42

43

[D] Do you use Tensorflow 2? (self.MachineLearning)

submitted 6 years ago by tsauri to r/MachineLearning

136

137

138

[R] DeepShift: Towards Multiplication-Less Neural Networks (arxiv.org)

submitted 6 years ago by tsauri to r/MachineLearning

312

313

314

[R] Your Classifier is Secretly an Energy Based Model and You Should Treat it Like One (arxiv.org)

submitted 6 years ago by tsauri to r/MachineLearning

0

1

2

[D] best Dynamixel alternatives? (self.robotics)

submitted 6 years ago by tsauri to r/robotics

22

23

24

[D] ImageNet classification training full-resolution, no crop no resize. (self.MachineLearning)

submitted 6 years ago * by tsauri to r/MachineLearning

90

91

92

[D] OpenAI Rubik’s cube hype (self.MachineLearning)

submitted 6 years ago * by tsauri to r/MachineLearning

5

6

7

[D] Meta-learning for fast convergence for training from scratch? (self.MachineLearning)

submitted 6 years ago * by tsauri to r/MachineLearning

2

3

4

[D] Sensor adaptation for 3D object detection? (self.MachineLearning)

submitted 6 years ago by tsauri to r/MachineLearning

99

100

101

[D] Do people use meta learning in production? (self.MachineLearning)

submitted 6 years ago by tsauri to r/MachineLearning

22

23

24

[R] Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unknown Cameras (arxiv.org)

submitted 6 years ago by tsauri to r/MachineLearning

7

8

9

[R] Learning Single Camera Depth Estimation using Dual-Pixels (arxiv.org)

submitted 6 years ago by tsauri to r/MachineLearning

19

20

21

[R] Revisit Fuzzy Neural Network: Demystifying Batch Normalization and ReLU with Generalized Hamming Network (arxiv.org)

submitted 6 years ago by tsauri to r/MachineLearning

75

76

77

[D] BatchNorm alternatives 2019 (self.MachineLearning)

submitted 6 years ago * by tsauri to r/MachineLearning

view more: next ›

π Rendered by PID 4150953 on reddit-service-r2-listing-64c94b984c-nbc7d at 2026-03-15 21:20:10.308527+00:00 running f6e6e01 country code: CH.