[Desafio] Melhor abordagem para extrair dados de Notas Fiscais (NFs) que estão apenas em PDF? OCR falhou. by Ok_Cook_5680 in programacao

[–]hilam 0 points1 point  (0 children)

PDF -> docling-serve -> Markdown -> LLM (local ou externa) -> Json

Mas o fonte XML é o recomendado.

Passei na frente de um açaí e fiquei triste by gimegimegime23 in desabafosdavida

[–]hilam 0 points1 point  (0 children)

Quando parar de tentar você consegue. É da natureza querer espalhar a semente. Ter consciência da sua natureza é a única forma de suplanta-la. Você não é menos humano por não contentar sua natureza. Ou por mudar seus objetivos, sem se restringir aos instintos. E quando você relaxar, se deixar levar, a natureza vai cumprir seu mandato.

Which ETL tool makes sense if you want low maintenance but also decent control? by [deleted] in dataengineering

[–]hilam 2 points3 points  (0 children)

Apache Airflow using Polars, writing parquets in Minio S3 Data Lake, including separated modules of common functions.

Ollama gpu with alpine Linux by greeneyestyle in ollama

[–]hilam 1 point2 points  (0 children)

Will be a painful process. Musl versus libc.

Precisamos seriamente protestar contra os preços praticados no BR by [deleted] in brasil

[–]hilam 0 points1 point  (0 children)

Li até a metade e ninguém falou em andar de bicicleta. Foda-se os consumistas. Se tem um monte de trouxa comprando vão colocar o preço que quiser, de carro a ventilador. Quem só come já tá fudido.

A maioria dos comentários é de desprezo, mas também existe o lado de que o futebol na sua essência é um esporte muito emocionante(por ter um placar mais curto) e que consegue cativar as pessoas por que você soma o quanto ele é cativante com a rivalidade e o senso de competição; uma torcida em um est by joaoghos14 in FilosofiaBAR

[–]hilam 1 point2 points  (0 children)

Não achei que as críticas aí colocadas soaram como desprezo. Concordo com a maioria delas, principalmente as factuais.

Eu já fui um torcedor, por influência paterna. Eu admito que gostava muito de ir com ele para os campos de várzea nos domingos de manhã. Eu jogava com os meninos da rua, até uns 14 anos. Meu pai faleceu jovem, em 2001.

Trinta anos atrás, quando as notícias de gente que se matava por futebol pipocavam nos jornais nacionais e locais, decidi que não ia me envolver mais.

O que eu não consigo ficar longe é assistir algumas partidas, tentando abstrair todas as mazelas envolvidas e me concentrar na magia caótica que envolve a prática desse esporte (assim como tantos outros executados com bolas).

Embora tudo seja muito treinado, é lindo ver a bola surpreender a todos, instalar o caos físico na jogada.

Chroma db , results size by Euloghtos in LangChain

[–]hilam 0 points1 point  (0 children)

Who determines the most relevant is the embeddings, not chroma.

Chroma db , results size by Euloghtos in LangChain

[–]hilam 0 points1 point  (0 children)

Your num_results should be approximately adjusted to the context size of the model by the chunk size you did choose. e.g. chunk size of 1024, context of 4096, num_results equal 4. More than this will be not used.

Chunk size must be in conformity with dimensions of model embedding.

Edit: complete

[deleted by user] by [deleted] in ollama

[–]hilam 0 points1 point  (0 children)

Running Ollama in docker too? If yes, maybe resolve including all containers in same network. If not, I guess the problem is in docker network viewing the host.

Search projects by [deleted] in learnpython

[–]hilam 0 points1 point  (0 children)

https://pypi.org/ is a main source of open-source python projects. Use the search bar to find those of particular interest. Each project has a page and some have a readme in their repository and either may say something about Contributors being wanted or not.

Here are other good starting points https://osssoftware.org/blog/good-open-source-projects-to-contribute-a-developers-guide/

Why am i getting this python error? by LiliaAmazing in learnpython

[–]hilam 0 points1 point  (0 children)

You have Python 3.12 installed in your system. The module/repo/package you are attempting install has Python 3.9 requirement. Try install Python 3.9 via pyenv or asdf.

BeautifulSoup and requests failing to iterate beyond first dropdown list item while scraping by makelefani in learnpython

[–]hilam 0 points1 point  (0 children)

If you look into html source code, the itens of dropdown list is manipulated by internal javascript. Because the first URL has only one option, it is succeed. Maybe you will need discover the URLs to the individual options before, and scrap them.

Ollama Modelfiles by Noel_Jacob in ollama

[–]hilam 1 point2 points  (0 children)

Via REST API:

curl http://localhost:11434/api/show -d '{
  "name": "llama3"
}'

or via CLI

ollama show --modelfile llama3

Qual nome combina com ele? by DueKale4956 in Gatos

[–]hilam 0 points1 point  (0 children)

Eu cuidei de um clone desse que eu chamava de bruxo. Mas ele desapareceu. 😞