J'ai essayé OCR de traiter un fichier PDF avec Java part2

Au début

Ceci est une suite de J'ai essayé le traitement OCR d'un fichier PDF avec Java. J'écris principalement sur tess4j 4.1

Objectif de cet article

Même si je cherche sur tess4j 4.1 sur Google, je n'obtiens pas beaucoup d'informations, je vais donc écrire comment le déplacer et le résultat de son déplacement Si vous n'utilisez que les informations sur le net, vous obtiendrez une erreur d'exécution.

Lieu de modification

Voici la partie modifiée de J'ai essayé le traitement OCR du fichier PDF avec Java.

fichier gradle

compile group: 'net.sourceforge.tess4j', name: 'tess4j', version: '4.1.1'

Je décrirai la dépendance du module avec un sentiment tessdata/configs/api_config

textord_tabfind_vertical_horizontal_mix T

Sera ajouté. Sans cette description, une erreur d'exécution se produira. jpn.traineddata Écraser avec les données d'apprentissage téléchargées depuis GitHub

Courir

Exécutez-le simplement depuis Gradle avec la commande run

Résultat d'exécution

vitesse de traitement

J'ai comparé les résultats d'exécution de 3 séries et 4 séries avec la mémoire Win10pro iCore5 2.2GH 16G par le processus de conversion de "2016 Spring Information Security Supporter Examination 14:00" 4 séries environ 2,5 minutes 3 séries environ 8 minutes La série 4 est extrêmement plus rapide

Reconnaissance des caractères

Dans la troisième série, le taux de conversion erronée était déraisonnablement élevé si les caractères japonais et anglais étaient mélangés, mais dans la quatrième série, cela a été considérablement amélioré. Par exemple, en 3 séries

Q-Quelles sont les caractéristiques du pus S?
Par le chef de la cloche,Le nombre d'étapes est décidé.

La pièce convertie en 4 séries

Q (1) Quelles sont les caractéristiques de l'AES?
Par la longueur de la clé,Le nombre d'étapes est décidé.

Il est conçu pour être correctement converti en caractères significatifs

Recommended Posts

J'ai essayé OCR de traiter un fichier PDF avec Java part2
J'ai essayé OCR de traiter un fichier PDF avec Java
Lire une chaîne dans un fichier PDF avec Java
J'ai essayé de casser le bloc avec java (1)
J'ai essayé de créer un environnement de développement java8 avec Chocolatey
J'ai essayé de moderniser une application Java EE avec OpenShift.
J'ai créé un PDF avec Java.
J'ai essayé d'interagir avec Java
J'ai essayé la communication UDP avec Java
Traitement serveur avec Java (Introduction partie 1)
J'ai essayé de jouer un peu avec BottomNavigationView ①
J'ai essayé d'utiliser OpenCV avec Java + Tomcat
J'ai essayé d'apprendre Java avec une série que les débutants peuvent comprendre clairement
[iOS] J'ai essayé de créer une application de traitement de type insta avec Swift
J'ai essayé de faire une authentification de base avec Java
java j'ai essayé de casser un simple bloc
J'ai essayé de frapper une méthode Java d'ABCL
J'ai essayé d'exécuter Java dans un terminal Mac
J'ai créé une application d'apprentissage automatique avec Dash (+ Docker) part3 ~ Practice ~
[Java] J'ai essayé de me connecter en utilisant le pool de connexion avec Servlet (tomcat) & MySQL & Java
J'ai essayé d'implémenter le téléchargement de fichiers avec Spring MVC
J'ai essayé d'implémenter TCP / IP + BIO avec JAVA
[Java 11] J'ai essayé d'exécuter Java sans compiler avec javac
Exporter le pdf avec un programme autonome (Java / Perl / VBA)
J'ai essayé de créer une compétence Clova en Java
J'ai essayé de créer une fonction de connexion avec Java
J'ai essayé d'utiliser Log4j2 sur un serveur Java EE
J'ai essayé d'implémenter Sterling Sort avec Java Collector
J'ai essayé de gratter un graphique boursier en utilisant Java (Jsoup)
J'ai essayé de créer une fonction / écran d'administrateur de site commercial avec Java et Spring
[Azure] J'ai essayé de créer une application Java gratuitement ~ Se connecter avec FTP ~ [Débutant]
J'ai écrit un test CRUD avec SpringBoot + MyBatis + DBUnit (Partie 1)
J'ai essayé DI avec Ruby
J'ai essayé d'augmenter la vitesse de traitement avec l'ingénierie spirituelle
[Rails] J'ai essayé de créer une mini application avec FullCalendar
Je veux faire une liste avec kotlin et java!
Je veux créer une fonction avec kotlin et java!
[Java] Créer un fichier temporaire
J'ai essayé Drools (Java, InputStream)
[Rails] J'ai essayé d'implémenter le traitement par lots avec la tâche Rake
Un mémo quand j'ai essayé "Parler d'écrire une application Java dans Eclipse et de la publier dans Kubernetes dans un conteneur Liberty (Partie 1)"
Même en Java, je veux afficher true avec un == 1 && a == 2 && a == 3
J'ai essayé de convertir une chaîne de caractères en un type LocalDate en Java
J'ai essayé d'utiliser Java REPL
J'ai essayé UPSERT avec PostgreSQL.
Facile à créer LINE BOT avec Java Servlet Partie 2: J'ai essayé des messages image et des modèles
J'ai essayé de toucher JavaScript Part.1 Système de code de traitement de base
À propos du comportement lors de la création d'un mappage de fichiers avec Java
J'ai créé un client RESAS-API en Java
J'ai essayé BIND avec Docker
J'ai essayé de créer un environnement de développement padrino avec Docker
J'ai essayé d'utiliser la bibliothèque CameraX avec Android Java Fragment
J'ai essayé la métaprogrammation avec Java
J'ai créé une application d'apprentissage automatique avec Dash (+ Docker) part2 ~ Façon basique d'écrire Dash ~
J'ai essayé d'imprimer un formulaire avec Spring MVC et Jasper Reports 1/3 (paramètres Jasper Reports)
Une histoire que j'ai eu du mal à défier le pro de la concurrence avec Java
J'ai essayé d'imprimer un formulaire avec Spring MVC et Jasper Reports 3/3 (contrôle Spring MVC)
J'ai essayé Tribuo édité par Oracle. Tribuo --Une bibliothèque de prédiction Java (v4.0)
J'ai essayé d'exécuter une application d'échange de cartes de crédit avec Corda 1
Je ne peux pas créer une classe Java avec un nom spécifique dans IntelliJ