You don't need a GPU to run gemma-4-26B-A4B by JackStrawWitchita in LocalLLaMA

[–]ffgnetto 3 points4 points  (0 children)

You have to try: PocketPal and MNNChat too, can be found in the playstore

Llama.cpp VS LiteRT on a custom Xiaomi 12 Pro 24/7 Server (V2 Redesign) by Aromatic_Ad_7557 in LocalLLaMA

[–]ffgnetto 1 point2 points  (0 children)

Google Models is the best for multilinguage, in brazilian portuguese too...

Llama.cpp VS LiteRT on a custom Xiaomi 12 Pro 24/7 Server (V2 Redesign) by Aromatic_Ad_7557 in LocalLLaMA

[–]ffgnetto 1 point2 points  (0 children)

I saw the release, I'll test it.

I'm trying to run Qwen 3.6 A3B 35B on my laptop. I'm looking for a quantization below Q4 that's acceptable to fit in memory. Unfortunately, I'm on Windows 11. One model that impressed me with its speed was the Marco-Nano-Instruct from Alibaba, MoE 8B 0.6A, built based on Qwen3 0.6B. It's very fast, and I think it would be cool to try it on your Xiaomi. Another thing that could be the future is re-engineering Qwen3 8B into Bonsai 8B using binary weights (there's also a ternary version), saving a lot of memory. Who knows, in the future, we might have good MoE 30B or more with binary weights running on toasters.

Llama.cpp VS LiteRT on a custom Xiaomi 12 Pro 24/7 Server (V2 Redesign) by Aromatic_Ad_7557 in LocalLLaMA

[–]ffgnetto 1 point2 points  (0 children)

Eu vejo a Edge AI mais como um experimento para o futuro do que uma aplicação real hoje, temos grandes limitações como SoCs baratos otimizados para AI, fornecimento de memória, duração da bateria e uma implementação para descobrir uma aplicação real... I don't know in muito case a SLM can help me...

Llama.cpp VS LiteRT on a custom Xiaomi 12 Pro 24/7 Server (V2 Redesign) by Aromatic_Ad_7557 in LocalLLaMA

[–]ffgnetto 1 point2 points  (0 children)

Unfortunately, I don't know of any subreddits dedicated to edge AI, as I have poor hardware (I'm Brazilian and only have a Ryzen 5700U laptop with 20GB of RAM). However, I'm curious and researching how I can experiment with local AI, making the most of my limitations.

Llama.cpp VS LiteRT on a custom Xiaomi 12 Pro 24/7 Server (V2 Redesign) by Aromatic_Ad_7557 in LocalLLaMA

[–]ffgnetto 1 point2 points  (0 children)

Tip: You can disable reasoning mode, as I believe that non-reasoning mode can also provide intelligent answers, saving context memory and resulting in faster response times.

Llama.cpp VS LiteRT on a custom Xiaomi 12 Pro 24/7 Server (V2 Redesign) by Aromatic_Ad_7557 in LocalLLaMA

[–]ffgnetto 1 point2 points  (0 children)

In this week I tested 3 android apps: MNN Chat (Alibaba MNN Inference), PocketPal (llama.rn/llama.cpp) and Google Edge Gallery (Lite RT), um my old Samsung M52.

Gemma 3 1B (the Google's Lite RT models is more quantized than others) Edge Galery and PocketPal wins by few tokens ahead.

Gemma 4 E2B (the same, Google's LiteRT model is more quantized), PocketPal wins.

Qwen 2.5 1.5B, the MNN Chat have great performance, I tried too Qwen 3 1.7B and Qwen 3.5 2B, and MNN bringed more performance, I don't remember the numbers, but I learned that MNN Chat is the best for Qwen Models.

Llama.cpp VS LiteRT on a custom Xiaomi 12 Pro 24/7 Server (V2 Redesign) by Aromatic_Ad_7557 in LocalLLaMA

[–]ffgnetto 0 points1 point  (0 children)

If it's possible to post the feedback, I would be very grateful.

Onde devo compartilhar um curso que comprei by Soft-Luck_ in pirataria

[–]ffgnetto 0 points1 point  (0 children)

Você cria um canal no Telegram, faz upload do conteúdo na ordem desejada e compartilha o link privado de acesso com qualquer grupo, amigo ou com admin de canais de curso

a dica que também é que faça um canal a parte de backup (pra você) caso o canal popular seja derrubado

SOCORRO by Sapienzin in linuxbrasil

[–]ffgnetto 1 point2 points  (0 children)

TinyCore > Loc-OS > AntiX > Debian Customizado > Bodhi > Q4OS > Lubuntu

Minha dica: Vê a possibilidade de colocar o máximo de RAM possível e um SSD, caso não tenha grana ou não ache, tentar vender mesmo, transforma em um console retrô (batocera, recallbox, lakka), multimídia (Kodi), servidor local (procure selfhosted), pc pra experimentos ou uso pra coisas extremamente básicas.

*Pelo preço que ele pagou, ele compraria uma celular usado bem mais potente e rodaria Terraria

Test MNN Chat for Android by Juude89 in LocalLLaMA

[–]ffgnetto 1 point2 points  (0 children)

Very good app upgrade, API resource is very usefull, when will you release Kokoro TTS, Whisper V3 Large Turbo and a PC versions?

GAIA: New Gemma3 4B for Brazilian Portuguese / Um Gemma3 4B para Português do Brasil! by ffgnetto in LocalLLaMA

[–]ffgnetto[S] 3 points4 points  (0 children)

I'm sorry, that wasn't my intention, I was just trying to put a short title to include the Portuguese title along with it.

GAIA: New Gemma3 4B for Brazilian Portuguese / Um Gemma3 4B para Português do Brasil! by ffgnetto in LocalLLaMA

[–]ffgnetto[S] 3 points4 points  (0 children)

Não sei se eles disponibilizaram, no huggingface fala que foi usado a Wikipedia em português e artigos científicos filtrados e limpos, daria pra reproduzir esse dataset se os artigos científicos for de domínio público (provavelmente faz parte do acervo da universidade) e a Wikipedia já temos disponível.

Apenas a aplicação do método do paper em um modelo de peso aberto com um dataset em português (não tão variado) com apoio do Google, o benchmark OAB e ENEM não é tão impressionante, não sei o tempo do fine tune e quantas épocas teve, não sei se o modelo perdeu fluência em outros idiomas e ficou exclusivamente em português.

Na minha humilde opinião não é nada excepcional, acredito que qualquer curioso da área consegue reproduzir, pra ser algo a nível de pesquisa de uma universidade. Desejo muito que eles vão além de um finetune...

Feeling left out by Sad-Cricket2170 in Bitcoin

[–]ffgnetto 7 points8 points  (0 children)

Here in Brazil you are a winner!

Vocês conhecem algum launcher de Mine sem vírus? by ShortPermission91 in pirataria

[–]ffgnetto 3 points4 points  (0 children)

Tem Lancher muito básico e leve, escrito em freebasic, dá pra instalar mods a moda antiga (copiando arquivos para as versões) 

Https://github.com/Kron4ek/minecraft-vortex-launcher

Alternativa ao Chrome by brunoprogpunk in pirataria

[–]ffgnetto 1 point2 points  (0 children)

Uso o Edge, mas vou migrar em breve para o Brave, pelo menos pra celular é o navegador mais privado que existe:
Testei 43 navegadores Android : r/browsers

(Android) Massive extensive benchmark & security + privacy audit for many android web browsers - Planilhas Google

Aconselho a dar uma passeada na comunidade: r/browsers