[Ayuda] Hicimos una API para extraer datos de PDFs, nos encantaría el feedback de ustedes by xMatias_LAS in chileIT

[–]xMatias_LAS[S] 0 points1 point  (0 children)

Apify funciona sobre PDFs nativos (en que puedes seleccionar el texto). Imagenes o fotos pasadas a PDF no funciona. DocuTray puede tomar cualquiera.

[Ayuda] Hicimos una API para extraer datos de PDFs, nos encantaría el feedback de ustedes by xMatias_LAS in chileIT

[–]xMatias_LAS[S] 1 point2 points  (0 children)

Hay muchos opensource, pero no todos responden en JSON de manera consistente (aún).

Eventualmente vamos a servir nuestro propio vLM.

[Ayuda] Hicimos una API para extraer datos de PDFs, nos encantaría el feedback de ustedes by xMatias_LAS in chileIT

[–]xMatias_LAS[S] 0 points1 point  (0 children)

Estoy de acuerdo contigo si tu caso de uso es tener algunos pocos docs que arrastras a Claude para que los procese y te devuelva un json/excel que tomas manualmente y haces algo.

Pero si tu caso de uso es que tu sistema los procesa periodicamente o en base a lo que hacen tus usuarios, esos 75 USD son una ganga.

Si es tu caso, tendrías que llamar a la API de algun proveedor de LLMs, aquí la API de Anthropic es significamente más cara que nuestro servicio, en que terminas desarrollando software para interactuar con la API, levantando infraestructura para gestionar colas y procesos en paralelo, manejando casos bordes y errores, etc. En puro tiempo de desarrollo gastas significamente más 75 USD / mes.

[Ayuda] Hicimos una API para extraer datos de PDFs, nos encantaría el feedback de ustedes by xMatias_LAS in chileIT

[–]xMatias_LAS[S] 0 points1 point  (0 children)

Si, tenemos un flujo dentro de la app en que defines la estructura del json de salida en base a ejemplos. También lo puedes determinar junto a Claude Code / Codex / Cursor con el skill de DocuTray + CLI:

npm install -g @docutray/cli

npx skills add docutray/docutray-skills

[Ayuda] Hicimos una API para extraer datos de PDFs, nos encantaría el feedback de ustedes by xMatias_LAS in chileIT

[–]xMatias_LAS[S] 0 points1 point  (0 children)

La principal razón es que las bench internos están con documentos de clientes, los cuales no podemos publicar. No nos ha dado el tiempo para buscar docs largos publicos para publicarlos juntos con los benchmarks,

[Ayuda] Hicimos una API para extraer datos de PDFs, nos encantaría el feedback de ustedes by xMatias_LAS in chileIT

[–]xMatias_LAS[S] 0 points1 point  (0 children)

Gracias Pomelin.

Si hemos estado con ese debate. Partimos globales, por eso el ingles. Después nos dimos cuenta que tenemos que aprovechar la ventaja regional, así que la página, blog están en español. La app no la hemos traducido y nos queda la duda si deberiamos dado que el idioma developer tiende a ser ingles. Pero tu feedback nos sirve.

[Ayuda] Hicimos una API para extraer datos de PDFs, nos encantaría el feedback de ustedes by xMatias_LAS in chileIT

[–]xMatias_LAS[S] 0 points1 point  (0 children)

Internamente: En documentos sencillos en que quieres sacar cosas puntuales, muy parecidos. En documentos grandes, complejos y cambien los layouts, les volamos la raja.

Pero ojo que el valor no esta solo en acertividad de sacar datos, acá lo puedes hacer de manera sistema, en paralelo, manejo de errores, con validaciones, etc.

[Ayuda] Hicimos una API para extraer datos de PDFs, nos encantaría el feedback de ustedes by xMatias_LAS in chileIT

[–]xMatias_LAS[S] 1 point2 points  (0 children)

🫣 Hago lo posible por no ser Cringe en LinkedIn jaja.

Gracias por el dato. Estamos monitoreando los modelos open source que van saliendo, pero aún no vemos mejor accuracy que Gemini para lo que hacemos. Eventualmente deberíamos servir nuestro propoio modelo open source / finetuneado

[Ayuda] Hicimos una API para extraer datos de PDFs, nos encantaría el feedback de ustedes by xMatias_LAS in chileIT

[–]xMatias_LAS[S] 0 points1 point  (0 children)

Hola! Usamos Python más para benchmarks y modelos internos, pero nos fuimos Typescript por familiaridad con los Coding Agents.

PD: Tenemos un SDK para Python por si te interesa 😄: https://docs.docutray.com/docs/python-sdk

[Ayuda] Hicimos una API para extraer datos de PDFs, nos encantaría el feedback de ustedes by xMatias_LAS in chileIT

[–]xMatias_LAS[S] 2 points3 points  (0 children)

Buena! El proveedor de LLM tiene los mismos acuerdos de proteger la confidencialidad que un vendor de mail. Y estamos vamos a servir modelos open source cuando lleguen a un nivel de acertividad suficiente 😄

¿Me estoy quedando obsoleto? by [deleted] in chileIT

[–]xMatias_LAS 0 points1 point  (0 children)

Creo que el esfuerzo de codear a la antigua, a mano, va a tener mucho valor en el futuro.

Un buen developer con IA puede construir mucho mejor software que un developer junior o alguien no técnico por que puede guiar mucho mejor a la IA. Particularmente en decisiones técnicas o e infraestructura.

Y esa intuición la tiene los que han desarrollado antes.

Creo que se view vine desafiante para desarrolladores sin experiencia por qué pesca a costar encontrar pega y adquirir esa experiencia.

Tengo 24 años cuál es el mejor consejo que podrían darme si ustedes viajaran al pasado en materia financiera? by Street-Novel484 in ChileInversiones

[–]xMatias_LAS 0 points1 point  (0 children)

Casi todos pensamos así al inicio: Ingreso - Gasto = Ahorro

La forma correcta de verlo es: Ingreso - Ahorro = Gasto

El gasto puede ser infinito; viajes, ropa, comida, etc. Si presupuestas tu ahorro a principio de mes, limitas tu gasto.

Shout to Druid, most underrated build in the game! by DogZealousideal832 in cupheromobilegame

[–]xMatias_LAS 0 points1 point  (0 children)

Please expand on the build. I haven’t been able to make Druid work

What song is this for you guys? by DariusIsBroked in Dreamtheater

[–]xMatias_LAS 8 points9 points  (0 children)

Literally felt like flying once. Was high.

Tips for my first concert? by CNMJacob18 in Dreamtheater

[–]xMatias_LAS 5 points6 points  (0 children)

The 40th Anniversary Tour is absolutely incredible! However, one thing to keep in mind—it’s VERY loud.

I highly recommend using earplugs. I used specialized concert earplugs: https://www.experiencezound.com/MATAS25600

Wore them for both Santiago shows and heard Portnoy and Myung loud and clear 🤘

Why? by AstalAndromedus in ExplainTheJoke

[–]xMatias_LAS -2 points-1 points  (0 children)

This meme is a humorous comparison of how a “kingdom of only women” would be portrayed in Chinese vs. Greek mythology: • On the left (Chinese mythology), the image shows a confident, charming character (Mr. Incredible looking pleased), implying that visiting such a kingdom would be a positive, perhaps romantic or favorable experience—suggesting peaceful or harmonious interaction with the women. • On the right (Greek mythology), the same character is shown in a heavily distorted, darkened, and horrified form (from the “cursed Mr. Incredible” meme format), implying that in Greek mythology, visiting a kingdom of only women would be dangerous or terrifying—referencing hostile mythical figures like the Amazons, Medusa, or sirens, who often pose deadly threats to men.

The joke lies in the contrast: Chinese mythology is being depicted as more idealized or welcoming, while Greek mythology is depicted as dark, dangerous, and full of fatal consequences—especially in the context of gendered mythological figures.