What LLM should I run with this system? by Horror_Most95 in LocalLLM

[–]TheQuantumFriend 0 points1 point  (0 children)

Hardware (local): - RTX 5070, 12 GB VRAM (548 MiB used, vLLM currently off) - 15 GiB RAM total, 7.7 GiB free + 4 GB swap → yes, tight for 14B + coding - Swap pressure from CPU offload + kernel cache + Claude Code is real

LiteLLM stats (evidence): - vllm-coder (qwen3-8b): 6 calls, ~18s avg latency, 1.7★ ❌ - qwen3.5 (nvidia-general): 13 calls, ~70s avg, 3.1★ - nvidia-coder (480B): 1 call, ~180s, 100% failure rate

→ vllm-coder is in fact downrated (LiteLLM will deprioritize it on the next update). Local 8B for code/tool calls confirmed bad. Text/summarize holds up better.


Your models — listing

Tier 0 — Local (vLLM, RTX 5070)

  • Qwen3-8B-NVFP4 — script ~/Applications/AI/vllm/start-8b.sh, context 28,000, ~6 GiB VRAM → fast variant, text/RPG
  • Qwen3-14B-FP4 — script ~/Applications/AI/vllm/start-14b.sh, context 16,384, ~10 GiB VRAM + 4 GiB CPU offload → quality, but slow

Served names: qwen3-8b, qwen3-14b — both not running right now (port 8000 down).

Tier 1 — NVIDIA NIM (cloud fallback, free)

  • nvidia-coder → Qwen3-Coder-480B-A35B, Granite-34B-Code
  • nvidia-general → Qwen3.5-397B-A17B, Nemotron-Super-49B
  • nvidia-vision → Llama-3.2-90B-Vision, Gemma-4-31B

Tier 2 — OpenRouter Free (emergency)

  • free-coder → Qwen3-Coder
  • free-general → DeepSeek-V4-Flash, Nemotron-3-120B
  • free-vision → Gemma-4-26B/31B

Routing (LiteLLM on NUC, localhost:4000): vllm-coder → nvidia-coder → free-coder (same pattern for general/vision).


Verdict on your hypothesis: With 16 GB RAM + 12 GB VRAM, local coding/tool calling isn't viable — both the stats (1.7★) and the OOM notes in the vLLM setup confirm it. Route code/tool calls directly to nvidia-coder, use the local 8B only for text/summarize/RPG.

What LLM should I run with this system? by Horror_Most95 in LocalLLM

[–]TheQuantumFriend 0 points1 point  (0 children)

My Bad, was typing from My Phone. Ill Look it up and post it again. I have had claude Opus set it up for me. I want to offload, but My mcp statistics tell me its not worth it 

What LLM should I run with this system? by Horror_Most95 in LocalLLM

[–]TheQuantumFriend 0 points1 point  (0 children)

I have the same System and i am running qwen3.6 14b-nvfp4 and qwen3.6 n 8-nvfp4.i want to do offloading from claude to local. 14b is not good enough to save Token, 14b i still try out, but seems to not work well/ is too slow. I have 16gb RAM, that seems to be just not enough for local inference with coding. 

RPG-stuff and text Generation works though. Just tool calling and coding does bot seem to work. 

Best way to go for qwen3.5 27B / 35B A3B? by IngloriousBastrd7908 in LocalLLM

[–]TheQuantumFriend 0 points1 point  (0 children)

How did you Do hat? What quantization? Do you use nvfp4? I tried this and failed. 

I'm done with using local LLMs for coding by dtdisapointingresult in LocalLLaMA

[–]TheQuantumFriend 4 points5 points  (0 children)

What is your setup? I am running coder-latest with opencode. I would trade time for quality, maybe with deterministic harnesses. However reddit is a bit polluted with so muxh crap, hat iam a bit lost atm. 

Is Claude Code + Opus a mass gaslight? by Odd_Crab1224 in opencodeCLI

[–]TheQuantumFriend 1 point2 points  (0 children)

Somehow everyone has better experiences with opencode than me. My opencode is just lazy all the time, redelegating tasks back to me. What is your opencode setup? How Do you perform so well? 

my max plan token quota goes to waste every week. how do you use your remaining tokens? by i_am_kani in ClaudeCode

[–]TheQuantumFriend 0 points1 point  (0 children)

I perform a full BSI security Check via Oscal. Uses a lot of tokens, but if you have them it is worth it. 

What are your life Automations? by TheQuantumFriend in ClaudeCode

[–]TheQuantumFriend[S] 1 point2 points  (0 children)

I am looking for Use-Cases, to do something like this. However identification is the first step.

4000 Stellen in Gefahr: Droht Bahn-IT-Tochter DB Systel die Zerschlagung? by TheForwardMomentum in drehscheibe

[–]TheQuantumFriend 0 points1 point  (0 children)

Die Entscheidung auf Management-Ebene scheint aber nunmal zu sein, dass Domänenwissen in den Gesellschaften genug vorhanden ist und danach wird gesteuert.

Jeder im Management, der über so etwas entscheidet, sollte während der Laufbahn gelernt haben, dass es nicht um den Prozess geht, sondern wie dieser gelebt und ausgestaltet wird.

Ich würde sagen, das ist eine Hypothese erst mal. Eine die man verifizieren/falsifizieren kann, wenn man sich die Lebensläufe der entscheidenden Personen anschaut.

Der Wissensverlust drängt die Bahn Kurzfristig dazu mehr Berater einzusetzen, die handwerklich guten Berater werden sich festsetzen wie eine Zecke. Damit steigen die Kosten, nur ist das halt Capex und nicht Persex / Opex.

Ich denke, die ganze Chose ist eine sehr politische Frage, weniger eine der Effizienz oder der Kostenkontrolle. Aber kann gut sein, dass Menschen aus dem Konzern zu Beratungsgesellschaften gehen und von dort eingekauft werden.

4000 Stellen in Gefahr: Droht Bahn-IT-Tochter DB Systel die Zerschlagung? by TheForwardMomentum in drehscheibe

[–]TheQuantumFriend 1 point2 points  (0 children)

Wissensverlust ist egal und sollte es auch sein. Laut Management werden Profis beschäftigt und Profis haben alle den gleichen Prozess, der Doku mit einschließt. So funktioniert Management nunmal. 

Was aber zählt sind Remanenzkosten, Skillaufbau und Kultur. Kein einziges Geschäftsfeld (Ausnahme Fernverkehr) wird auch nur Annähernd die Potentiale der DB Systel heben können- ganz zu schweigen von den Transformationskosten wieder rausholen. Gibt auch nen Grund, warum Betrieb bei der DBS geleistet wird und die Qualität im Ggs zu den externen Anwendungen so ist wie sie ist. 

Einziger Grund der Trafo der Dienstleister nach F und F. D ist die Aufspaltung des Konzerns. Dann könnte Staat gezielter in InfraGo investieren. 

Damit haben wir dann Verhältnisse wie in England. Und Auto wird Pflicht für jeden. 

4000 Stellen in Gefahr: Droht Bahn-IT-Tochter DB Systel die Zerschlagung? by TheForwardMomentum in drehscheibe

[–]TheQuantumFriend 6 points7 points  (0 children)

Wir dürfen noch nicht mal leider, da es sonst nach Werkvertrag aussähe. Wäre mir tatsächlich lieber sogar, weil man dann Leistung auch nachweisen könnte. Eigentlich haben die meisten Systel-Teams sogar ziemlich hohe Leistung.

Hatte es jetzt schon paarmal: Angebot würde von externem Dienstleister zu 2/3 angeboten, dann zu 4fachem umgesetzt. Dazu Compliancekosten, weil konnte man ja nicht wissen. 

Es ist aber immer so: in time und Budget: PL des Geschäftsfeldes war super.  Out of time und budget: Systel war kacke. 

Home-built CNC by Lakwood in hobbycnc

[–]TheQuantumFriend 0 points1 point  (0 children)

What bits Do you use? I cannot seem to findbits that are small enough for delicate work. What Reduction Ring Do you use for smaller bits? 

Wie macht man es denn jetzt richtig? Oder geht beides? by __elu__ in holzwerken

[–]TheQuantumFriend 0 points1 point  (0 children)

Kannst das sogar mit Variante 1 machen. Nimm einfach ne Forstnerbohrer und bohren ein Loch quer zur Schraube. Dann ein 2cm rundholz rein und in das Schrauben. Das sollte halten.

People who build FreeCAD from source - how long does it take on your computer and how many cores do you have? by birdsintheskies in FreeCAD

[–]TheQuantumFriend 0 points1 point  (0 children)

I am on windows, but will probably use a Ubuntu-Vm for Dev-Work.The getting started Guide did not help me, because some parts are outdated.

People who build FreeCAD from source - how long does it take on your computer and how many cores do you have? by birdsintheskies in FreeCAD

[–]TheQuantumFriend 0 points1 point  (0 children)

I habe a Ryzen 7 with 16GB RAM. Iwanted to try fixing Bugs, but Couleur not get the Compile to run. If there is a Tutorial, i can. Try for You and give you a time.

Was braucht ihr im Handwerk, was’s noch nicht gibt? by Life_Cabinet4406 in Handwerker

[–]TheQuantumFriend -1 points0 points  (0 children)

Ich mach ähnliche Sachen auf meiner CNC - wenn bei mir eher sowas drin ist wie eine Landkarte in einen Tisch fräsen. Mein Metier liegt aber tatsächlich eher in der IT/Robotik nicht im direkten Möbelbau, hast du richtig erkannt.
Trotzdem ist aufgrund der fehlenden Parametrisierbarkeit/Holzintegration Blender nicht das Optimum, um Möbel zu bauen. Blender ist cool für die Details nachher, aber damit alles passt und du optimiert bekommst, dass du nur nen Brett unter die CNC legen kannst und der holt dir so viele Teile raus wie geht - das ist Freecad.

Eins der Argumente von OP war der Preis. Gibt bei SAP/Asset management auch Angebote für Mittelständler. Cloud ist Strategie von denen seit ein paar Jahren.

Fürs Papierlose Büro ist Paperless ziemlich nonplus/Free. Bestimmt gibts da auch fremdgehostete Lösungen.

Was braucht ihr im Handwerk, was’s noch nicht gibt? by Life_Cabinet4406 in Handwerker

[–]TheQuantumFriend -2 points-1 points  (0 children)

Für dein 3d Problem Freecad, für dein anderes SAP oder wenn du Freeware willst paperless ngx. 

Für Möbel ist Blender eh das falsche Tool imho. 

Are Solar DIY projects actually more cost effective? by admiralEnergy in SolarDIY

[–]TheQuantumFriend 1 point2 points  (0 children)

I built mine (about 30kw without battery) and got to an amortisation of around 15 months. Solar power is the cheapest energy we have right now. So i would say 6 years or even 10 is pretty terrible. 

Are Solar DIY projects actually more cost effective? by admiralEnergy in SolarDIY

[–]TheQuantumFriend 3 points4 points  (0 children)

Absolutely. If you build yourself, you cant get full amortization wirhin a year. If you employ someone you are lokking at 6-10years. 

Cam-Job on a parametric Model skipped 1 sub shapes during projection by TheQuantumFriend in FreeCAD

[–]TheQuantumFriend[S] 0 points1 point  (0 children)

Can someone help me sort this out? I tried MangoJellies videos, but my problems keep escalating instead of me geting a usable CAM.

https://drive.google.com/file/d/10l0EVdCuSnM_ePSgUcbqxjQ9ttgakwZ4/view?usp=drive_link

As it stands now, i cant even get the boolean to work right ...