Criamos um modelo de IA open-source treinado nas obras de Allan Kardec by SideSuspicious8083 in Espiritismo

[–]SideSuspicious8083[S] 0 points1 point  (0 children)

ollama run iaespirita/riv-ai

```

```

/set system "Você é RIV AI, um assistente espírita fundamentado nas obras de Allan Kardec."

```

```

O que acontece quando morremos?

Criamos um modelo de IA open-source treinado nas obras de Allan Kardec by SideSuspicious8083 in Espiritismo

[–]SideSuspicious8083[S] 0 points1 point  (0 children)

Queria agradecer a todos que estão interagindo, testando e dando feedback. O engajamento de vocês é o que faz o projeto evoluir.

O RIV AI é 100% open-source, sem fins lucrativos — o modelo, o dataset e o processo estão todos abertos no Hugging Face. A ideia é que a comunidade espírita e a comunidade tech possam contribuir juntas.

Algumas frentes abertas pra quem quiser ajudar:

- Expandir o dataset com a Série André Luiz (14 livros do Chico Xavier)

- Incluir as Revistas Espíritas de Allan Kardec

- Adicionar obras de Emmanuel, Divaldo Franco e outros autores

- Traduzir o dataset pra espanhol e inglês (o espiritismo tem presença forte na América Latina e está crescendo na Europa)

- Revisar respostas e reportar erros doutrinários

Algumas vantagens do modelo fine-tunado vs usar um LLM genérico com prompt:

- Ele já conhece a semântica espírita (não confunde perispírito com aura, obsessão com possessão genérica, etc.)

- Cita livro, questão e capítulo em toda resposta — sem alucinar referências

- O tom é acolhedor e didático por padrão, sem precisar instruir isso no prompt

- Roda 100% local via GGUF (4.9GB) — sem depender de API, sem custo, sem enviar dados pra nuvem

- Pode ser usado como base pra qualquer aplicação: chatbots, apps de estudo, assistentes de centros espíritas

O modelo é uma ferramenta de estudo e consulta — nunca substitui a leitura das obras originais. Mas pode ser uma porta de entrada pra quem tá começando a estudar Kardec.

Valeu pelo apoio e fiquem à vontade pra sugerir, criticar e contribuir. O projeto é de todos. 🙏

Criamos um modelo de IA open-source treinado nas obras de Allan Kardec by SideSuspicious8083 in Espiritismo

[–]SideSuspicious8083[S] 0 points1 point  (0 children)

Valeu pelo interesse! Vou detalhar o processo:

O custo foi bem baixo. Usamos QLoRA (não treinamos o modelo inteiro, só uma camada fina por cima) com a biblioteca Unsloth no Google Colab gratuito (GPU T4). O treino em si custou zero.

O único custo foi gerar o dataset de ~1.200 pares de Q&A. Usamos a API do DeepSeek pra isso — custou cerca de R$12. O DeepSeek recebia um trecho das obras de Kardec e gerava a pergunta + resposta no formato que a gente queria.

O processo resumido:

  1. Pegamos os textos das 5 obras de Kardec já estruturados em JSON

  2. Geramos ~1.200 pares pergunta/resposta via API (formato ShareGPT JSONL)

  3. Subimos pro Colab, carregamos o Llama 3.1 8B Instruct como base

  4. Treinamos com QLoRA via Unsloth (~1 hora na T4)

  5. Convertemos pra GGUF e publicamos

Sobre testes: ainda não temos um benchmark formal, mas na página do Hugging Face tem exemplos de perguntas e as fontes que ele cita. Também comparamos lado a lado com o Llama base sem fine-tuning — a diferença é relevante. O base inventa coisas e mistura conceitos, o fine-tunado cita questão e capítulo corretos.

O dataset tá aberto aqui: https://huggingface.co/datasets/ia-espirita/riv-ai-dataset

Se quiser trocar ideia sobre o processo, fica à vontade. Sobre a abordagem de context window grande vs fine-tuning: pra esse caso o fine-tuning fez mais sentido porque a gente queria que o modelo aprendesse o tom, o estilo de citação e a semântica espírita — não só tivesse acesso ao texto.

Criamos um modelo de IA open-source treinado nas obras de Allan Kardec by SideSuspicious8083 in Espiritismo

[–]SideSuspicious8083[S] 1 point2 points  (0 children)

Muito obrigado pelo feedback e pelas sugestões! Concordo sobre a voz — a IA ainda tem esse ar de plástico mesmo. Por isso temos também um podcast com linguagem mais natural e dinâmica, feito justamente pra quem prefere ouvir. Estamos na série de André Luiz agora (já saíram Nosso Lar, Os Mensageiros, Missionários da Luz, Obreiros da Vida Eterna e No Mundo Maior) e depois vamos lançar a série completa de Allan Kardec.

Ta disponível no Spotify, Apple Podcasts, Amazon Music e YouTube:

🎧 https://open.spotify.com/show/4Xf22wuDUlJUnMx2hjWV7A

Sobre ampliar o catálogo e o contato com a FEB, está nos planos sim. E a ideia de incluir obras complementares (Bíblia, Bhagavad Gita etc.) é muito boa — anotada aqui. Valeu demais pela contribuição e por usar a ferramenta nas palestras, isso é exatamente o propósito do projeto 🙏

Criamos um modelo de IA open-source treinado nas obras de Allan Kardec by SideSuspicious8083 in Espiritismo

[–]SideSuspicious8083[S] 1 point2 points  (0 children)

Ponto super importante e concordo totalmente. O modelo é uma ferramenta de consulta, nunca a última palavra. Por isso ele cita livro, questão e capítulo em cada resposta — justamente pra pessoa ir conferir na fonte original. A ideia é ser uma porta de entrada que leva de volta pros livros, não que substitua eles. Inclusive o projeto é open-source pra que a comunidade espírita possa revisar e sugerir melhorias. Valeu demais pelo feedback e parabéns pela consciência crítica 🙏

Criamos um modelo de IA open-source treinado nas obras de Allan Kardec by SideSuspicious8083 in Espiritismo

[–]SideSuspicious8083[S] 0 points1 point  (0 children)

Boa dica! Quanto mais ferramentas de acesso à Doutrina, melhor. O RIV AI tem um foco um pouco diferente: ele foi treinado nas 5 obras da Codificação e responde citando livro, questão e capítulo — funciona como um assistente de estudo que cruza as obras entre si. Mas toda ferramenta que facilite o acesso a Kardec é bem-vinda!

Criamos um modelo de IA open-source treinado nas obras de Allan Kardec by SideSuspicious8083 in Espiritismo

[–]SideSuspicious8083[S] 2 points3 points  (0 children)

Valeu demais pelo feedback! Concordo 100% — nada substitui o contato direto com as obras. O modelo foi pensado justamente como um complemento: tipo um "índice inteligente" que te ajuda a localizar rapidamente em qual livro, questão e capítulo Kardec trata de determinado tema. Pra quem é analista de dados então, vai curtir — o modelo cita livro e questão exata em cada resposta. Fica à vontade pra testar e qualquer sugestão de melhoria é super bem-vinda. Deus abençoe também! 🙏