PC für OCR

Windle Poons

Cadet 1st Year
Registriert
März 2008
Beiträge
8
[Bitte fülle den folgenden Fragebogen vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :daumen:]


1. Was ist der Verwendungszweck?

OCR
Derzeit mit Acrobat Pro 9 und Toshiba Re-Rite.
Bei allem, was wir selber einscannen, läuft OCR automatisch mit Re-Rite.
Heute aber mal wieder von einer Behörde ca. 5.000 Seiten eingescannt erhalten (in Chunks in Größen von ca 200 Seiten bis 700 Seiten, halt was in einen normalen DINA4 Ordner an Seiten drin ist) - ohne OCR. Damit der Sachbearbeiter mit der Akte vernünftig mit Acrobat Pro arbeiten kann, muss als erstes OCR rüberlaufen. Das dauert mit Adobe sehr lange.
Meines Wissens ist Acrobat 9 Pro, aber auch die neueren Versionen X und DC, ein reines 32bit-Programm, das dazu auch nur einen Core nutzt. Also wäre dafür hohe Single-Core Leistung wichtig.

Ich habe keine Benchmark-Listen gefunden, aus denen hervorgeht, wie viel schneller ein Prozessor im Vergleich zu einem anderen im OCR ist. Mich würde halt erstmal interessieren, wie viel schneller wäre zB ein i9 9900K als ein Ryzen R9, R7, ... oder unser hauptsächlich dafür genutzter i5 2500, um abschätzen zu können, ob sich der Aufpreis lohnt.
Hat da jemand konkrete Erfahrungen? Wie lange dauern zB 500 Seiten OCR?
Auch falls jemand Erfahrungen mit Vergleichen zwischen Acrobat 9, X und Omnipage oder Abbyy Fine Reader hat, was Geschwindigkeit und Genauigkeit des OCR angeht, wäre ich dankbar für Informationsweitergabe.
Im Netz habe ich dazu nicht wirklich viel gefunden. Am aufschlussreichsten war noch ein direkter Vergleich zwischen Acrobat 9 und Abbyy, wobei da nur ein zweiseitiger Artikel gescannt und OCR-ed wurde. Da war Adobe viel schneller, die Genauigkeit mehr oder weniger identisch.

Wenn andere OCR-Software viel schneller bei gleicher Genauigkeit beim OCR wäre und von Multicore oder gar GPU profitierte, dann würden wir uns davon Lizenzen anschaffen und wenn es was bringt dann gerne auch Threadripper als Prozessoren oder 2070 super / 2080 nutzen (2080ti nur, wenn sie wirklich mehr bringt, die ist ja per se überteuert. Aber ich vermute, dass die GPU eh von keinem Programm sinnvoll genutzt wird und daher herzlich egal ist).

Letztlich geht es nur darum wo es das beste Preis-Leistungsverhältnis beim OCR gibt, sozusagen ppm (pages per minute). ;)

1.1 Falls Spiele: Welche Spiele genau? Welche Auflösung? Hohe/mittlere/niedrige Qualität? Wie viele FPS? (Bitte alle vier Fragen beantworten!)
-

1.2 Falls Bild-/Musik-/Videobearbeitung oder CAD: Als Hobby oder bist du Profi? Welche Software wirst du nutzen?
-

1.3 Hast du besondere Anforderungen oder Wünsche (Overclocking, ein besonders leiser PC, …)?

Kein OC, keine Wasserkühlung, kein Überschallknall oder Presslufthammer.

1.4 Wieviele und welche Monitore möchtest du nutzen? Anzahl, Modell, Auflösung, Bildwiederholfrequenz (Hertz)? Wird FreeSync (AMD) oder G-Sync (Nvidia) unterstützt?

Derzeit 1920x1200, zukünftig gerne auch 4k. Office, keine Spiele.

2. Ist noch ein alter PC vorhanden?

Nein.

3. Kosten

Grundsätzlich mal 1.000 € angesetzt, nur PC mit GPU, wenn die GPU nichts zum OCR beiträgt.
Wenn die GPU das OCR signifikant beschleunigen kann, dann muss ich neu kalkulieren.

4. In wie vielen Jahren möchtest du das System frühestens upgraden oder ersetzen müssen?

Fünf.

5. Wann soll gekauft werden?

Dezember 19

6. Möchtest du den PC selbst zusammenbauen oder zusammenbauen lassen?

Mache ich gerne selber.

Vielen lieben Dank im Voraus für Eure Tipps und Inputs.
 
Windle Poons schrieb:
Ich habe keine Benchmark-Listen gefunden, aus denen hervorgeht, wie viel schneller ein Prozessor im Vergleich zu einem anderen im OCR ist. Mich würde halt erstmal interessieren, wie viel schneller wäre zB ein i9 9900K als ein Ryzen R9, R7
Da OCR (in der Regel) nicht nur auf Single-Core läuft, wäre ein Intel momentan eine sehr schlechte Idee, auch ein 9900K. Wenn man dann noch berücksichtigt, dass Intel noch immer Preise aufruft, als würden sie die besseren CPUs bauen (also Intel absolut überteuert für die Leistung ist), wird Intel eine noch viel schlechtere Idee.

Oder kurz: AMD ist besser UND günstiger, gerade für sowas.


Edit (überlesen):
Windle Poons schrieb:
Meines Wissens ist Acrobat 9 Pro, aber auch die neueren Versionen X und DC, ein reines 32bit-Programm, das dazu auch nur einen Core nutzt. Also wäre dafür hohe Single-Core Leistung wichtig.
Wenn das stimmt, solltet ihr was anderes für OCR nehmen. Hab OCR bei mir mit Tesseract unter Linux automatisiert.
OpenCL kanns wohl auch:
https://github.com/tesseract-ocr/tesseract/wiki/TesseractOpenCL
 
Zuletzt bearbeitet:
Da sich OCR Engines in ihrer Funktionsweise signifikant unterscheiden können, ergibt ein CPU Vergleich auch nur anhand einer OCR-Engine Sinn. Daher wäre es vielleicht erstmal sinnvoll zu ergründen, welche OCR Engine für eure Zwecke die besten (und gleichzeitig schnellsten) Ergebnisse liefert, und sich dann danach überlegt, welche CPU dafür am geeignetsten wäre.
Teilweise hast du schon krasse Unterschiede zwischen 32 und 64 Bit, wie bei Tesseract z.B.
(Dass der Acrobat mit 32bit SingleCore läuft muss nicht zwangsläufig heißen, dass die OCR-Engine das auch tut, solange sie nicht ganz fest ins Programm gebacken wurde).

Daher wirst du für sowas nichts allgemein gültiges finden.

Ich finde es übrigens (da ich aus dem Berufsfeld komme) bis heute bedenklich, dass man Dokumente 1000-Seitenweise einscannt und OCR drüber laufen lässt, wobei man definitiv nicht davon ausgehen kann, immer 100% korrekte Ergebnisse zu bekommen. Gerade bei Zahlen kann das dann fatal werden, wenn die OCR mal wieder aus ner 6 eine 8 macht.
 
Zuletzt bearbeitet:
Grimba schrieb:
Ich finde es übrigens (da ich aus dem Berufsfeld komme) bis heute bedenklich, dass man Dokumente 1000-Seitenweise einscannt und OCR drüber laufen lässt, wobei man definitiv nicht davon ausgehen kann, immer 100% korrekte Ergebnisse zu bekommen. Gerade bei Zahlen kann das dann fatal werden, wenn die OCR mal wieder aus ner 6 eine 8 macht.
Man muss Zahlen nicht ungeprüft rauskopieren.
 
Zurück
Oben