Nabend allerseits,
ich bin auf der Suche nach einer KI, mit der ich gescannte Texte mittels OCR in formatierbaren Text umwandeln kann. Gemini ist hier bei der Erkennung zwar sehr gut, haut mir aber alle Texte in Blocksatz raus, sprich, reiht einen Satz an den anderen und achtet oftmals nicht auf Zeilenumbrüche, also wann im Text ein Satz in einer neuen Zeile anfängt. Damit geht die komplette Formatierung verloren, was sehr schade ist.
ChatGPT kann ich in der Hinsicht gar nicht gebrauchen, da die KI auch hier zu oft halluziniert und Dinge hinzuerfindet, die so nicht im Text stehen.
Kennt jemand zufällig eine KI, die dafür genutzt werden kann und die zuverlässig arbeitet? Auch gerne lokal, wenn keine Nvidia-Karte benötigt wird.
Besten dank schon mal
Michael
ich bin auf der Suche nach einer KI, mit der ich gescannte Texte mittels OCR in formatierbaren Text umwandeln kann. Gemini ist hier bei der Erkennung zwar sehr gut, haut mir aber alle Texte in Blocksatz raus, sprich, reiht einen Satz an den anderen und achtet oftmals nicht auf Zeilenumbrüche, also wann im Text ein Satz in einer neuen Zeile anfängt. Damit geht die komplette Formatierung verloren, was sehr schade ist.
ChatGPT kann ich in der Hinsicht gar nicht gebrauchen, da die KI auch hier zu oft halluziniert und Dinge hinzuerfindet, die so nicht im Text stehen.
Kennt jemand zufällig eine KI, die dafür genutzt werden kann und die zuverlässig arbeitet? Auch gerne lokal, wenn keine Nvidia-Karte benötigt wird.
Besten dank schon mal
Michael