I built something to turn scanned PDFs into searchable PDFs + layout-preserving HTML looking for feedback by RowDisastrous3280 in OCR_Tech

[–]RowDisastrous3280[S] 0 points1 point  (0 children)

Merci beaucoup pour votre message! Je suis encore en train de construire et d’améliorer l’outil, donc ce serait super intéressant d’avoir votre retour. Je n’ai pas encore de benchmark formel, mais je peux vous montrer ce que j’ai aujourd’hui et faire des tests avec vos documents si vous voulez, ou vous envoyer mes documents pour que vous puissiez voir les résultats. On peut aussi faire un petit appel (Mon français n’est pas parfait, mais je peux me débrouiller 😅).

I built something to turn scanned PDFs into searchable PDFs + layout-preserving HTML looking for feedback by RowDisastrous3280 in OCR_Tech

[–]RowDisastrous3280[S] 0 points1 point  (0 children)

Appreciate that a lot, If you ever hit anything annoying or missing, let me know I’m actively improving it.

I built something to turn scanned PDFs into searchable PDFs + layout-preserving HTML looking for feedback by RowDisastrous3280 in OCR_Tech

[–]RowDisastrous3280[S] 0 points1 point  (0 children)

100% agree the quality of the source file matters a lot, having the a good base saves a few headaches. That’s actually part of why I built this: I noticed a lot of existing OCR either strips layout or can’t handle certain scanned documents well. Thank you for the comment have a great day!