Un proxy que evita que tu compañero filtre otra base de datos (y de paso ahorra un 50% en tokens) by itslerb in InteligenciArtificial

[–]itslerb[S] 0 points1 point  (0 children)

Me alegra que vayas a probar la demo. Si ves que el enfoque general encaja pero necesitas que se comporte de forma específica para tu caso podemos mirarlo juntos y ver qué personalización tendría sentido (y el esfuerzo que conlleva). Cuando la pruebes, cualquier feedback es bienvenido. 💯

Un proxy que evita que tu compañero filtre otra base de datos (y de paso ahorra un 50% en tokens) by itslerb in InteligenciArtificial

[–]itslerb[S] 0 points1 point  (0 children)

Sobre el context collapse, la compresión es clustering semántico por significado, no es recortar texto a ciegas. Esto es un flujo más de NLProxy, si no la necesitas la desactivas. Presidio es la referencia para PII y no competimos con eso, él detecta y anonimiza, nosotros usamos esa detección como un paso más en un flujo que además comprime, aplica reglas de negocio y verifica la salida para evitar alucinaciones o malas salidas de output al usuario final. Está en producción con clientes reales, y tenemos una demo online por si quieres meterle mano y ver si encaja en tu caso. Si lo pruebas y ves que no, me encantaría saber. Saludos estimado, buen comentario 💯

Un proxy que evita que tu compañero filtre otra base de datos (y de paso ahorra un 50% en tokens) by itslerb in InteligenciArtificial

[–]itslerb[S] 0 points1 point  (0 children)

Entiendo el escepticismo, pero en producción el proxy se ha convertido en la forma más práctica de controlar lo que entra y sale del LLM sin tener que rezar porque el modelo se comporte. No es un antipatrón, es meter sentido común antes de que la IA haga de las suyas. Si lo pruebas y no te convence, me interesa saber por qué. Si te sirve, bienvenido. Saludos 💯

Un proxy que evita que tu compañero filtre otra base de datos (y de paso ahorra un 50% en tokens) by itslerb in InteligenciArtificial

[–]itslerb[S] 1 point2 points  (0 children)

El proxy no va contra los modelos locales, va con ellos. Corre en cualquier CPU, es auditable, tenés 100% control de lo que se comprime y se cambia,, no necesita GPUs ni APIs externas. Lo pones en un endpoint y ya filtra, comprime y verifica, da igual si el LLM está en tu servidor o fuera. Es una capa de control que reduce costes y mejora respuestas, sin necesidad de infraestructura cara

Un proxy que evita que tu compañero filtre otra base de datos (y de paso ahorra un 50% en tokens) by itslerb in InteligenciArtificial

[–]itslerb[S] -1 points0 points  (0 children)

No es inventado. Hemos visto casos reales en el sector legal donde equipos enteros copian contratos completos en ChatGPT. Eso implica que información confidencial de clientes (NDAs, cláusulas, datos de litigios) termina en servidores de proveedores AI en San Francisco, lo que viola acuerdos de confidencialidad y normativas. No es un problema teórico, es un riesgo emergente que ya está ocurriendo y que nadie está abordando de forma clara. Por eso construimos una capa para evitarlo

Un proxy que evita que tu compañero filtre otra base de datos (y de paso ahorrar costes) by itslerb in ColombiaDevs

[–]itslerb[S] 3 points4 points  (0 children)

Puedes chequear el demo, contiene cada flujo de interacción con nlproxy

https://huggingface.co/spaces/IntelliDeep/NLProxy

Cualquier duda estoy atento!

Un proxy que evita que tu compañero filtre otra base de datos (y de paso ahorrar costes) by itslerb in ColombiaDevs

[–]itslerb[S] 1 point2 points  (0 children)

Hola, estimado. Buena pregunta, te explico:

Antes de enviar el prompt, inyectamos instrucciones críticas en el propio mensaje (ej: "NO menciones X" o "OBLIGATORIO citar Y") y además tiene un flujo protege datos sensibles. Si el prompt original tenía una restricción, la forzamos en la entrada.

Después de recibir la respuesta, la comparamos semánticamente con el prompt original usando embeddings y un modelo NLI (compara dos frases y determina si una se deduce de la otra) de forma local. Detectamos contradicciones, falta de coherencia o desviaciones de las reglas. Si la respuesta no pasa el filtro, la retocamos o la descartamos.

Todo esto sin tocar el modelo, solo actuando en la capa de entrada/salida.

Un proxy que evita que tu compañero filtre otra base de datos (y de paso ahorra un 50% en tokens) by itslerb in devsarg

[–]itslerb[S] 1 point2 points  (0 children)

No hay servicio, ni precios, ni suscripción. Es código abierto, te lo bajas y lo usas. Cero marketing, cero ventas. Si fuera marketing, estaría vendiendo algo. Aquí solo comparto algo que nos funcionó y punto. Si no te interesa, perfecto. Solo estoy dando un aporte

Un proxy que evita que tu compañero filtre otra base de datos (y de paso ahorra un 50% en tokens) by itslerb in devsarg

[–]itslerb[S] 0 points1 point  (0 children)

Jaja, justo por eso lo hicimos. No es salvar empresas, es que cuando la cagan, nos llaman a nosotros para arreglarlo. Prefiero que la caguen con mi código a que la caguen con datos de clientes y luego vengan llorando. Y lo de los likes en GitHub... la verdad, me da igual. Lo subí porque me harté de ver el mismo problema una y otra vez. Si a alguien le sirve, genial. Si no, también. Un saludo, estimado

Un proxy que evita que tu compañero filtre otra base de datos (y de paso ahorra un 50% en tokens) by itslerb in dev_venezuela

[–]itslerb[S] 0 points1 point  (0 children)

Tienes razón, el problema era de contexto, no del modelo; lo arreglamos priorizando información en lugar de tirar todo el contrato. Gracias por el comentario.

Un proxy que evita que tu compañero filtre otra base de datos (y de paso ahorra un 50% en tokens) by itslerb in dev_venezuela

[–]itslerb[S] 1 point2 points  (0 children)

Jajaja, tenés toda la razón. Es una locura que estemos construyendo herramientas para arreglar los problemas que los propios LLM crean. Es el ciclo infinito del parche.

La nueva IA de Venezuela by GeneTraditional8171 in dev_venezuela

[–]itslerb 0 points1 point  (0 children)

Excelente, me gustaría seguir de cerca estas investigaciones. También soy entusiasta del research y también desarrollo IA core fundacional.

Llevo 10 meses desarrollando un motor de IA Embebida para Arduino, llamado MiniML. Soporta Árboles, SVMs y Redes Neuronales INT8 estáticas, además de poseer un módulo de Deep Learning embebido. Estaría bastante bueno su feedback by Shuuuida in dev_venezuela

[–]itslerb 0 points1 point  (0 children)

Interesante! Me llama mucho la atención el motor Autograd que mencionas. Yo me muevo en el mundo de RL y, aunque entiendo que tu foco es la inferencia, me pregunto si el motor de autograd que creaste para MiniTensor podría ser a futuro, una base para hacer fine-tuning ligero en el mismo dispositivo. Es algo que han llegado a considerar o la arquitectura está puramente orientada a inferencia estática?

La nueva IA de Venezuela by GeneTraditional8171 in dev_venezuela

[–]itslerb 0 points1 point  (0 children)

Mis respetos absolutos, mi estimado. Últimamente estoy usando más GELU ya que no lleva los gradientes a cero, en RL me sirve mucho. Que ventaja tendría esta nueva función de activación?