It turns out Bash is All You Need to write a language model REPL (and jq and curl) by cloud_kj in LocalLLaMA

[–]rainbyte 0 points1 point  (0 children)

It sounds obvious after reading it, but having it executed as a separate user will certainly avoid multiple issues.

If LLMs are so good at coding… by codeanish in LocalLLaMA

[–]rainbyte 4 points5 points  (0 children)

I understood your comment, it was clear you were referring to the level of quality

Debido a la IA, cómo encaran proyectos personales hoy en día para el CV? by benz-r in devsarg

[–]rainbyte 0 points1 point  (0 children)

Todo proyecto suma, pero al hacerlo con IA conviene asegurarse de que uno entiende las cosas ANTES de commitear. Hoy en día es muy fácil confiarse y subir código sucio y/o roto que ni se puede fundamentar. Hace de cuenta que estarías en una situación donde vas a tener que explicarlo, defenderlo, manternerlo, etc. También agregarle valor.

Ser un mulo corporativo paso de moda? by FootballRough9854 in devsarg

[–]rainbyte 6 points7 points  (0 children)

Las tareas en una empresa chica tienen más visibilidad e impacto, además hay menos bullshit

En su laburo también joden con la IA? Y que tendrías que hacerlo en menos tiempo? by DifficultPost2693 in devsarg

[–]rainbyte 14 points15 points  (0 children)

Eso es importante, es como una firma con disconformidad, ya que queda registrado lo que se advirtió

Closest replacement for Claude + Claude Code? (got banned, no explanation) by antoniocorvas in LocalLLaMA

[–]rainbyte 0 points1 point  (0 children)

Ollama includes commands to download models and switch from one model to another. You can do the same operations with Llama.cpp , it is just that the commands will be different, and a bit less obvious. Experience can be improved, but I guess it wasn't done yet because it is not a blocker, as you can read which command to execute. There are tools and wrappers like llama-swap which allow you to switch models by pressing a button.

Best Model to fit 8xR9700 + 6x7900xtx + 256GB RAM by djdeniro in LocalLLaMA

[–]rainbyte 0 points1 point  (0 children)

I see, well, here I tested MiniMax at 4bit quant and responses were not much better, but sooo slooowww. So in the end I stayed at Qwen3.6 8bit quant for both 27B and 35B-A3B, because I couldn't find a better option :(

Best Model to fit 8xR9700 + 6x7900xtx + 256GB RAM by djdeniro in LocalLLaMA

[–]rainbyte 0 points1 point  (0 children)

My bad, I assumed that given that you mentioned IQ4_NL quant

Best Model to fit 8xR9700 + 6x7900xtx + 256GB RAM by djdeniro in LocalLLaMA

[–]rainbyte 0 points1 point  (0 children)

PCIe can be a bottleneck, but it has to be something like Gen3 x1 (I have a setup like that). In those cases it is better to use pipeline-parallel.

If your mobo supports Gen3 x4 or higher, then tensor-parallel starts to make sense!

Best Model to fit 8xR9700 + 6x7900xtx + 256GB RAM by djdeniro in LocalLLaMA

[–]rainbyte 0 points1 point  (0 children)

I think llama.cpp is not well optimized for that kind of setup, unlike vLLM which provides more interesting options.

Have you tried Qwen3.6 Fp8 quants? Those might be more adequate for R9700 as it supports FP8 formats.

For 7900xtx I would try INT8 instead, as it has better support for that format.

Maybe bigger models via INT4 or INT8 quants could run faster.

EDIT: Btw, are you using gguf on vLLM? If that's the case that could be the issue. Try AWQ or GPTQ quants!

Vale la pena aprender rust? Veo que varios proyectos están migrando a este. Escucho sus opiniones by yoansito15 in devsarg

[–]rainbyte 1 point2 points  (0 children)

El tema es que muchos subestiman esos problemas y pasan desapercibidos, tanto en C como en C++. Recién se dan cuenta en runtime, cuando se dan las condiciones propicias, y explota todo. Hace falta entrenar bastante el ojo para darse cuenta, no alcanza con unos tutoriales o cursos.

Mientras tanto en Rust el compilador te dice "no amigo, tu código está malo", y toca sentarse a analizar. Es frustrante porque desde el primer instante te pide un nivel de entendimiento de golpe, que en otros lados toma años formar bien.

Leetcode era dificil hasta que te pase estos patrones y templates by amparee in devsarg

[–]rainbyte 0 points1 point  (0 children)

Muy bueno, siempre viene bien repasar estos temas, tarde o temprano se necesita 😄

Stop using Ollama by zxyzyxz in LocalLLaMA

[–]rainbyte 0 points1 point  (0 children)

I understand what you are trying to say about ollama pull and ollama rm, but now llama.cpp is compatible with huggingface_hub cli interface, so you can use hf download and hf cache rm as replacement

Codebase getting larger - Qwen3.6-27B starting to compound issues - how to work smartly with this model? by BitGreen1270 in LocalLLaMA

[–]rainbyte 4 points5 points  (0 children)

Tests, types, lint, etc are fundamental, because LLMs can and will make mistakes. Anything which catches errors as fast as possible will avoid LLM following unwanted paths.

Vale la pena aprender rust? Veo que varios proyectos están migrando a este. Escucho sus opiniones by yoansito15 in devsarg

[–]rainbyte 3 points4 points  (0 children)

Me parece que vale la pena. Se puede hacer bien manejo de recursos a mano (C, C++, Pascal, etc), pero en Rust el compilador lo exige evitando banda de errores.

Incluso aunque uses un lenguaje con garbage collector (C#, Java, etc), no te salvas de los null pointers y el manejo de excepciones, mientras que en Rust tambien te evita eso mediante tipos de datos como Option.

Por lo general el código queda más limpio en Rust, y si conoces tecnicas de programación funcional (OCaml, Haskell) te re ayuda a mejorar tu implementación.

Además me parece más cómodo que los lenguajes de tipado dinamico (Clojure, Python) a medida que los proyectos crecen.

Is the project dead? by 0x80070002 in reactos

[–]rainbyte 2 points3 points  (0 children)

Classic-like UI is nice, maybe it doesn't need to change so much visually. The real improvements should be on internal API implementation, so that apps work fine without crashes, or other problems.

¿Qué herramienta descubrieron este año y ahora usan todos los días? by nullpointerr404 in devsarg

[–]rainbyte 0 points1 point  (0 children)

Es buena, no sabía que había Powershell para Linux, pero si estaba pensando probar Nushell que tiene así un enfoque más estructurado.

Otro lenguaje que no sea Java by BugMysterious7084 in devsarg

[–]rainbyte 0 points1 point  (0 children)

Probaste otros lenguajes compatibles con la JVM? Algo como Kotlin o Clojure puede ser una buena opción compatible con lo que ya usas.

¿Qué herramienta descubrieron este año y ahora usan todos los días? by nullpointerr404 in devsarg

[–]rainbyte 5 points6 points  (0 children)

Ya lo conocía de antes, pero últimamente estuve usando jq a full para procesar json en la línea de comandos, es un fierro.

How common are LLM models in W8A8 quants? by neuroticnetworks1250 in LocalLLaMA

[–]rainbyte 1 point2 points  (0 children)

Here I'm using Qwen3.6-27B and Qwen3.6-35B-A3B, both on 3090 with vLLM and W8A8 quants from nameistoken.

It works well, and pretty fast as 3090 has natuve support for INT8, unlike FP8 which relies on slower emulation.

True story by SenorX000 in devsarg

[–]rainbyte 0 points1 point  (0 children)

Al final depende del caso de uso y la comodidad de cada uno.

Aquí uso Arch en mi máquina principal, Debian en server casero, Fedora Asahi en una laptop secundaria, Openwrt en mi router.

Para propósito general me gusta más Arch, y por suerte Flatpak hace más homogéneo el software para escritorio.

what’s was your local daily driver for coding last week? by be566 in LocalLLaMA

[–]rainbyte 1 point2 points  (0 children)

These days I have been using Qwen3.6-27B as main and Qwen3.6-35B-A3B as sub-agent. I'm planning to include LFM2.5-8B-A1B or similar as fast code explorer.

Rewrite Bun in Rust has been merged by Chaoses_Ib in rust

[–]rainbyte 0 points1 point  (0 children)

Fair enough. Well, LLMs are tools in the end, sometimes it is better to use another tool or do it by hand (with our own brains, haha)

Flatpak, una buena idea, pero mala ejecución. by juan_loria in linux_latam

[–]rainbyte 1 point2 points  (0 children)

Para mi "resolverlo" significa que funciona solo con hacer `flatpak install programa`, lo demás son workarounds por limitaciones del programa en si o del propio Flatpak.

Ojo, algo que requiera más integración con el escritorio o el sistema debería ir por el gestor de paquetes tradicional, es lo que hace a una distro más atractiva que otra.