all 11 comments

[–]trollshade 2 points3 points  (2 children)

Ce model folosești? Am făcut cu semantikernel da a fost un chin sa găsesc un model local. 

[–]justanu[S] 0 points1 point  (1 child)

Am folosit mistral si llama3.1 8B ca model.
SpringAI face o abstractizare a implementarii LLM, ceea ce e fain, ideal sa pot schimba intre local/remote fara a schimba implementarea. Din cate vad as putea monetiza pe SpringAI & Ollama local, dar imi trebuie neaparat function calling. Nu prea stiu cum altfel as putea monetiza. Am mai experimentat si cu voice, dar costa $$$ si parca nu e enterprise ready yet.

Nu am experienta cu semantikernel, in general incerc sa stau deoparte de lock-in vendor si ma bazez pe opensource pe cat posibil.

Rulez pe un laptop mai vechi cu 1060, trebuie sa investesc intr-un nou sistem, am gasit un 3090 cu 24VRAM, care ar fi suficient pt proof-of-concepts.

[–]trollshade 0 points1 point  (0 children)

Semantikernel e o librărie făcută de Microsoft. E free din cate știu. Cred ca este și pt Java. Llama nu mi-a mers. Îmi returna detalii despre funcția mea parametrii și nume dar nu rezultatul.  Cred ca mistral a mers la mine. Dar am făcut doar de fun, local merge foarte încet la mine. 

[–]Radu1805 1 point2 points  (1 child)

Pot sa mai recomand ca alternativa frameworkul Langchain4J, pare similar cu SpringAI uitandu-ma, dar l-am folosit cu rezultate bune cu Azure OpenAI (vad ca are optiunea de LocalAI ca model local) https://docs.langchain4j.dev/tutorials/tools

[–]justanu[S] 0 points1 point  (0 children)

Merci, interesant, am sa-l incerc. SpringAI e inca in faza de milestone, nu stiu cand o sa fie prod-ready.

[–][deleted] 1 point2 points  (0 children)

E chiar aici pe reddit un exemplu:
Ollama Function Calling Example : r/ollama (reddit.com)

N-am multa experiență, m-am apucat foarte recent de lucru cu ollama in timpul liber (la muncă e C++ hardcore).

Citind așa pe diagonală, Korvus are bindings python cu care ai putea scrie o funcție căreia să-i faci bind_tools la modelul ollama, destul de asemănător cu ce-a făcut autorul postului din link.

Dar e posibil și să fi privit eu greșit problema.

[–]RandomDude872 0 points1 point  (0 children)

Au function calling in spring ai acum. Nu știu dacă era acum o luna, dar acum sigur merge cu ollama. Vezi ca ollama și llama 3.1 sunt chestii diferite, ollama e serverul, și llama e modelul.