@G.O.Tuhls
Es sollte aber sehr einfach sein, Paragraphen zu erkennen, da sie immer dieselbe Syntax haben.
Vielleicht braucht es RegEx, um vor der Ausgabe eine Zwischenprüfung durchlaufen zu lassen, ob es sich um ein Wort oder Paragraphen(kette) handelt.
Mit meinen sehr eingeschränkten Programmierkenntnissen stelle ich es mir sehr einfach vor, wie die Logik dahinter funktionieren sollte. Allerdings weiß ich weder, wie man eine App mit UI erstellt, wie OCR einzelne Zeichen erkennt oder wie man vor einer Ausgabe eine Zwischenprüfung mit RegEx einbaut.
Ich bin in der falschen Berufsgruppe.
Ich kann nur mit Python, SQL, etc. Daten analysieren, generieren und grafisch darstellen, wenn ich eine saubere Basis habe. Also ein Standard Format wie mdb, txt, json, csv, Microsoft Formate, etc.
Aber wie man mit OCR diese Standard Formate erstellt? Absolut keine Ahnung... und auch keine Lust es zu lernen.
Für einen entsprechenden Programmierer sollte es aber ein Kinderspiel sein, wenn er sich mit einem Juristen zusammensetzt, der alle zugelassenen Schreibweisen der üblichen Gesetze kennt.