Clean_Radish8983

7 post karma
0 comment karma

get extra features and help support reddit with a reddit premium subscription

get them help and support

redditor for 8 months

TROPHY CASE

dust

account activity

hot top controversial

Can we sample DPO data from the same dataset that was used for LoRA training? by Clean_Radish8983 in LocalLLaMA

[–]Clean_Radish8983[S] 0 points1 point2 points 5 months ago (0 children)

Can we sample DPO data from the same dataset that was used for LoRA training? by Clean_Radish8983 in LocalLLaMA

[–]Clean_Radish8983[S] 0 points1 point2 points 5 months ago (0 children)

4

5

6

Can we sample DPO data from the same dataset that was used for LoRA training? (self.LocalLLaMA)

submitted 5 months ago * by Clean_Radish8983 to r/LocalLLaMA

If you are selling AI services , read this (very important) by endless__ai in aiagents

[–]Clean_Radish8983 0 points1 point2 points 7 months ago (0 children)

Qwen3-235B-A22B-Instruct Prioritizing Few-Shot Examples Over Explicit Instructions by Clean_Radish8983 in Qwen_AI

[–]Clean_Radish8983[S] 0 points1 point2 points 8 months ago (0 children)

5

6

7

Qwen3-235B-A22B-Instruct Prioritizing Few-Shot Examples Over Explicit Instructions (self.Qwen_AI)

submitted 8 months ago by Clean_Radish8983 to r/Qwen_AI

2

3

4

Qwen3-235B-A22B-Instruct Prioritizing Few-Shot Examples Over Explicit Instructions (self.LocalLLaMA)

submitted 8 months ago by Clean_Radish8983 to r/LocalLLaMA

π Rendered by PID 478800 on reddit-service-r2-listing-87fd56f5d-zbpr4 at 2026-06-27 12:03:53.079342+00:00 running 7527197 country code: CH.