Ich habe versucht, eine PDF-Datei mit Java part2 zu verarbeiten

Am Anfang

Dies ist eine Fortsetzung von Ich habe versucht, eine PDF-Datei mit Java über OCR zu verarbeiten. Ich schreibe hauptsächlich über tess4j 4.1

Zweck dieses Artikels

Selbst wenn ich über tess4j 4.1 google, erhalte ich nicht viele Informationen, daher werde ich schreiben, wie ich es verschiebe und das Ergebnis des Verschiebens Wenn Sie nur die Informationen im Internet verwenden, wird ein Laufzeitfehler angezeigt.

Änderungsort

Hier ist der geänderte Teil von Ich habe die OCR-Verarbeitung von PDF-Dateien mit Java versucht.

Gradle-Datei

compile group: 'net.sourceforge.tess4j', name: 'tess4j', version: '4.1.1'

Ich werde die Abhängigkeit des Moduls mit einem Gefühl beschreiben tessdata/configs/api_config

textord_tabfind_vertical_horizontal_mix T

Wird hinzugefügt werden. Ohne diese Beschreibung tritt ein Laufzeitfehler auf. jpn.traineddata Überschreiben mit Lerndaten, die von [GitHub] heruntergeladen wurden (https://github.com/tesseract-ocr/langdata/tree/master/jpn)

Lauf

Führen Sie es einfach mit dem Befehl run von Gradle aus

Ausführungsergebnis

Verarbeitungsgeschwindigkeit

Ich habe die Ausführungsergebnisse von 3 Serien und 4 Serien mit Win10pro iCore5 2.2GH Speicher 16G durch den Konvertierungsprozess von "2016 Spring Information Security Supporter Examination 2 pm" verglichen. 4 Serien ca. 2,5 Minuten 3 Serien ca. 8 Minuten 4er Serie ist überwältigend schneller

Zeichenerkennung

In der 3. Serie war die Fehlkonvertierungsrate unangemessen hoch, wenn japanische und englische Zeichen gemischt wurden. In der 4. Serie wurde dies jedoch dramatisch verbessert. Zum Beispiel in 3 Serien

Q-Was sind die Eigenschaften von Eiter S?
Beim Glockenchef,Die Anzahl der Stufen wird festgelegt.

Das Teil, das konvertiert wurde, ist 4 Serien

F (1) Was sind die Merkmale von AES?
Durch die Schlüssellänge,Die Anzahl der Stufen wird festgelegt.

Es ist so konzipiert, dass es ordnungsgemäß in aussagekräftige Zeichen umgewandelt werden kann

Recommended Posts

Ich habe versucht, eine PDF-Datei mit Java part2 zu verarbeiten
Ich habe versucht, mit OCR eine PDF-Datei mit Java zu verarbeiten
Lesen Sie eine Zeichenfolge in einer PDF-Datei mit Java
Ich habe versucht, den Block mit Java zu brechen (1)
Ich habe versucht, mit Chocolatey eine Java8-Entwicklungsumgebung zu erstellen
Ich habe versucht, eine Java EE-Anwendung mit OpenShift zu modernisieren.
Ich habe ein PDF mit Java erstellt.
Ich habe versucht, mit Java zu interagieren
Ich habe versucht, UDP mit Java zu kommunizieren
Serververarbeitung mit Java (Einführung Teil.1)
Ich habe versucht, ein wenig mit BottomNavigationView zu spielen ①
Ich habe versucht, OpenCV mit Java + Tomcat zu verwenden
Ich habe versucht, Java mit einer Reihe zu lernen, die Anfänger klar verstehen können
[iOS] Ich habe versucht, mit Swift eine insta-ähnliche Verarbeitungsanwendung zu erstellen
Ich habe versucht, eine Standardauthentifizierung mit Java durchzuführen
Java Ich habe versucht, einen einfachen Block zu brechen
Ich habe versucht, eine Java-Methode von ABCL zu verwenden
Ich habe versucht, Java in einem Mac-Terminal auszuführen
Ich habe eine App für maschinelles Lernen mit Dash (+ Docker) Teil 3 ~ Übung ~ erstellt
[Java] Ich habe versucht, über den Verbindungspool eine Verbindung mit Servlet (Tomcat) & MySQL & Java herzustellen
Ich habe versucht, das Hochladen von Dateien mit Spring MVC zu implementieren
Ich habe versucht, TCP / IP + BIO mit JAVA zu implementieren
[Java 11] Ich habe versucht, Java auszuführen, ohne mit Javac zu kompilieren
PDF mit einem eigenständigen Programm (Java / Perl / VBA) exportieren
Ich habe versucht, eine Clova-Fähigkeit in Java zu erstellen
Ich habe versucht, eine Anmeldefunktion mit Java zu erstellen
Ich habe versucht, Log4j2 auf einem Java EE-Server zu verwenden
Ich habe versucht, Sterling Sort mit Java Collector zu implementieren
Ich habe versucht, ein Aktienchart mit Java (Jsoup) zu kratzen.
Ich habe versucht, mit Java und Spring eine Funktion / einen Bildschirm für den Administrator einer Einkaufsseite zu erstellen
[Azure] Ich habe versucht, eine kostenlose Java-App zu erstellen ~ Mit FTP verbinden ~ [Anfänger]
Ich habe einen CRUD-Test mit SpringBoot + MyBatis + DBUnit geschrieben (Teil 1)
Ich habe DI mit Ruby versucht
Ich habe versucht, die Verarbeitungsgeschwindigkeit mit spiritueller Technik zu erhöhen
[Rails] Ich habe versucht, eine Mini-App mit FullCalendar zu erstellen
Ich möchte eine Liste mit Kotlin und Java erstellen!
Ich möchte eine Funktion mit Kotlin und Java erstellen!
[Java] Erstellen Sie eine temporäre Datei
Ich habe Drools (Java, InputStream) ausprobiert.
[Rails] Ich habe versucht, die Stapelverarbeitung mit der Rake-Task zu implementieren
Ein Memo, als ich versuchte, "über das Schreiben einer Java-Anwendung in Eclipse und das Veröffentlichen in Kubernetes in einem Liberty-Container (Teil 1) zu sprechen".
Selbst in Java möchte ich true mit == 1 && a == 2 && a == 3 ausgeben
Ich habe versucht, in Java von einer Zeichenfolge in einen LocalDate-Typ zu konvertieren
Ich habe versucht, Java REPL zu verwenden
Ich habe UPSERT mit PostgreSQL ausprobiert.
Einfacher LINE BOT mit Java Servlet Teil 2: Ich habe versucht, Bildnachrichten und Vorlagen zu erstellen
Ich habe versucht, JavaScript Part.1 Basic Processing Code System zu berühren
Informationen zum Verhalten beim Erstellen einer Dateizuordnung mit Java
Ich habe einen RESAS-API-Client in Java erstellt
Ich habe BIND mit Docker ausprobiert
Ich habe versucht, mit Docker eine Padrino-Entwicklungsumgebung zu erstellen
Ich habe versucht, die CameraX-Bibliothek mit Android Java Fragment zu verwenden
Ich habe versucht, Metaprogrammierung mit Java
Ich habe eine App für maschinelles Lernen mit Dash (+ Docker) Teil 2 ~ Grundlegende Schreibweise für Dash ~ erstellt
Ich habe versucht, ein Formular mit Spring MVC und Jasper Reports 1/3 (Jasper Reports-Einstellungen) zu drucken.
Eine Geschichte, die ich mit Java nur schwer herausfordern konnte
Ich habe versucht, ein Formular mit Spring MVC und Jasper Reports 3/3 (Spring MVC-Steuerung) zu drucken.
Ich habe Tribuo von Oracle ausprobiert. Tribuo - Eine Java-Vorhersagebibliothek (v4.0)
Ich habe versucht, eine Kreditkartenhandelsanwendung mit Corda 1 auszuführen
Ich kann in IntelliJ keine Java-Klasse mit einem bestimmten Namen erstellen