Word Versionen Inkompatibel Rote Linien

StefanPahl

Cadet 1st Year
Registriert
Sep. 2017
Beiträge
10
Hallo zusammen,

Ich habe folgendes Problem. Ich habe ein Word Dokument erhalten, benutze selber word 2016. Wenn ich dieses Dokument öffne, sind die meisten, nicht alle, der Wörter rot unterstrichen und ganz oben steht "Compatibility Mode".

Wenn ich einen Text aus diesem Dokument übersetzen will, erhalte ich einen Buchstabensalat, das Dokument is also irgendwie korrupt?

Ich habe zwei Beispiele angefügt, Beispiel 1 zeigt wie der Text im Dokument aussieht. Beispiel 2 zeigt das Ergebnis der Übersetzung mit deepl.

Beispiel1.JPG
Beispiel2.JPG
 
Ist die Datei, die du erhalten hast, eine DOC oder eine DOCX? Lies die Hinweise von Microsoft zum Kompatibilitätsmodus von Word und seinen Versionen.

Die roten Unterstreichungen rühren von der Rechtschreibprüfung her – die steht bei dir wahrscheinlich auf Deutsch (Deutschland) und kennt deshalb die meisten englischen Wörter nicht. Ändere sie probehalber.

Gibt es keinen bestimmten Grund, dir die Datei als Word-Dokument zukommen zu lassen, soll der Verfasser sie dir als TXT oder ODF schicken.
 
Auf den ersten Blick sieht das nach eingeschalteter Rechtschreibprüfung aus und dass der Text mit einer englischen/amerikanischen Word-Version erstellt wurde und deine deutsche Version rebelliert.

interessant was das vielgepriesene deepl so übersetzt
 
dr_lupus_ schrieb:
interessant was das vielgepriesene deepl so übersetzt
Wenn die Eingabe schon Quatsch ist, was sollte deiner Meinung nach dann bei der Übersetzung rauskommen? Du siehst doch schon alleine anhand der Rechtschreibprüfung im Browser (oder was dieses deepl ist), dass dort irgendwelche unsichtbaren Zeichen zwischen den Buchstaben stehen.

Du kannst mal versuchen, was passiert, wenn du den Text aus Word in einen Text-Editor (z. B. Notepad++) kopierst. Oder mal direkt in die Word-Datei reingucken (wenn es ein docx ist).
 
Danke schon mal.

Habe das Dokument als Docx erhalten.

Die default Sprache meiner Rechtschreibprüfung ist auf Englisch gesetzt. Komischer Weise erkennt diese keine englischen Wörter.

"sie dir als TXT oder ODF schicken". Macht es einen Unterschied ob mir der Verfasser das Dokument in txt/odf schickt oder ich es in diese formate umformatiere? Habe das eben ohne Erfolg versucht.

DeepL ist schon gut, das Problem liegt an meinem Dokument, an der Codierung der Worte. Mit anderen Texten funktioniert DeepL normal. Gibt es deswegen eine Möglichkeit mein Dokument durch eine Umwandlungs-Umformatierung passend zu formatieren?
Ergänzung ()

Nase schrieb:
Du kannst mal versuchen, was passiert, wenn du den Text aus Word in einen Text-Editor (z. B. Notepad++) kopierst. Oder mal direkt in die Word-Datei reingucken (wenn es ein docx ist).

Wenn ich den Text bei Notepad reinkopiere, wird dieser ganz normal angezeigt.
 
Zuletzt bearbeitet:
Wenn die Eingabe schon Quatsch ist

genau das sollte ein gutes Übersetzungsprogramm erkennen. Ein Übersetzer erkennt ja auch, wenn ihm Quatsch vorgelegt wird.
 
Du erkennst an den ganzen Fragezeichen im Übersetzungstext, dass dort eben nicht die Eingabe gemacht wird, die man links lesen kann, sondern dass irgendwelche unsichtbaren Zeichen in dem Text drinstehen, die das Programm verständlicherweise nicht übersetzen kann.

Lade die Datei mal bitte irgendwo hoch. Ich würde da mal gerne reinschauen.
 
Das passiert, wenn man seine Texte per Cut'n'Paste erstellt und als Quelle formatierten Text und Text mit anderen Attributen nimmt. Das ist nie eine gute Idee, wenn man es in einem Word Dokument einfügen will.
 
StefanPahl schrieb:
Habe das Dokument als Docx erhalten.

Okay, dann sollte dein Word 2016 auch vernünftig damit umgehen können. Wurde das Dokument denn von jemandem mit englischem Windows + Word erstellt?

StefanPahl schrieb:
Die default Sprache meiner Rechtschreibprüfung ist auf Englisch gesetzt. Komischer Weise erkennt diese keine englischen Wörter.

Reagiert sie normal, wenn du selbst englische Wörter in Word tippst?

StefanPahl schrieb:
Macht es einen Unterschied ob mir der Verfasser das Dokument in txt/odf schickt oder ich es in diese formate umformatiere? Habe das eben ohne Erfolg versucht.

Ja, macht es, denn bei ihm liegt das Quellmaterial, das ihm unverkorkst dargestellt wird. Deshalb die Bitte, es dir in einem Format zu schicken, das einen internationalen Austausch ermöglicht. Meist einigt man sich dann auf den kleinsten gemeinsamen Nenner: 7-Bit ASCII als TXT. Das kann jede südkoreanische Waschmaschine, jeder australische PC, jedes Smartphone aus Brasilien, jedes Tablet aus Nigeria und jeder Blu-ray-Spieler aus Russland.

StefanPahl schrieb:
DeepL ist schon gut, das Problem liegt an meinem Dokument, an der Codierung der Worte. Mit anderen Texten funktioniert DeepL normal. Gibt es deswegen eine Möglichkeit mein Dokument durch eine Umwandlungs-Umformatierung passend zu formatieren?

Wenn man wüßte, mit welchem Encoding der Autor das ganze erstellt hat, kann man’s auch in etwas für unsere Breiten Passendes wandeln.

Du kannst auf gut Glück mal den ganzen Text in ein neu mit Notepad++ erstelltes TXT kopieren und die TXT mit einem gängigen Encoding speichern:

arG1Lzc.png


Anschließend den Text aus dieser TXT markieren, kopieren und bei DeepL einfügen.
 
Das Encoding der Datei ist nicht stimmig, siehe Screenshot. Daher kommt es auch, wenn du den Text irgendwo in ein Eingabefeld auf einer Webseite einfügst, dass der nicht richtig übersetzt wird.
 

Anhänge

  • word.png
    word.png
    24,2 KB · Aufrufe: 533
DeusoftheWired schrieb:
Wurde das Dokument denn von jemandem mit englischem Windows + Word erstellt?
Mit US amerikanischem.

DeusoftheWired schrieb:
Reagiert sie normal, wenn du selbst englische Wörter in Word tippst?
Ja. Wenn ich in das oben angefügte Dokument auf Englisch schreibe, wird das nicht rot unterstrichen und auch von der Rechtschreibkorrektur als Englisch erkannt.

DeusoftheWired schrieb:
Wenn man wüßte, mit welchem Encoding der Autor das ganze erstellt hat, kann man’s auch in etwas für unsere Breiten Passendes wandeln.
Reicht es hier zu wissen, dass er ein US amerikanisches System benutzt?


DeusoftheWired schrieb:
Du kannst auf gut Glück mal den ganzen Text in ein neu mit Notepad++ erstelltes TXT kopieren und die TXT mit einem gängigen Encoding speichern:

arG1Lzc.png


Anschließend den Text aus dieser TXT markieren, kopieren und bei DeepL einfügen.

Wenn ich die Kodierung auf OEM-US stelle, erhalte ich den gleichen Buchstaben-Fragezeichensalat welchen deepL erstellt. Wähle ich andere Kodierungen erhalte ich nichts lesbares.
 
Ergänzung ()

Nase schrieb:
Das Encoding der Datei ist nicht stimmig, siehe Screenshot. Daher kommt es auch, wenn du den Text irgendwo in ein Eingabefeld auf einer Webseite einfügst, dass der nicht richtig übersetzt wird.

Und lässt sich das beheben oder umformatieren?
 
Zuletzt bearbeitet:
Ohne die Ausgangskodierung wird das vermutlich sehr schwer. Wenn der Verfasser des Dokumentes dir eine korrigierte Version davon schicken kann, wäre das am Einfachsten. Wenn das nicht geht, kannst du alle Fehler über Suchen und Ersetzen beheben. Welche Zeichen "kaputt" sind, kannst du in Word recht einfach erkennen, indem du die Schriftart änderst (bisschen ausprobieren, bis du eine findest, wo das deutlich wird).
 
Nase schrieb:
Wenn der Verfasser des Dokumentes dir eine korrigierte Version davon schicken kann, wäre das am Einfachsten.

Welche Anweisungen (welche auch ein unkundiger versteht) soll ich dem Verfasser also jetzt geben? Notepad++ runterzuladen den Text darin einzufügen, zu speichern und mir die .txt senden?

7-Bit ASCII, stellt man wie, wo ein?
 
Wie soll ich also nun konkret vorgehen um einen übersetzbaren Text zu erhalten?

Soll ich nach der Ausgangskodierung fragen? Wie ermittelt er das? Würde mir das dann weiterhelfen?
 
Einfach aus Word raus kopieren, in Notepad++ hinein kopieren und als .txt speichern. Dann kann man es wieder aus der .txt raus kopieren und als Reintext in Word einfügen.
 

Anhänge

Sorry, ich bin immer von der Kodierung ausgegangen, aber der gesamte Text ist schon gültiges UTF-8.

Wie gesagt: Die Zeichen, die nicht funktionieren, sind keine Zeichen in "unserem" Alphabet, sondern kommen aus anderen Sprachen und sehen nur so aus. Daher kannst du das zwar in Word lesen, aber die Rechtschreibkorrektur kann damit nichts anfangen und auch dein Übersetzungstool nicht.

Schnellste Möglichkeit, ohne groß noch weiter zu diskutieren: Eben alle Buchstaben über "Suchen und Ersetzen" austauschen. Wenn du eine andere Schriftart wählst als Times New Roman, siehst du, dass diese falschen Schriftzeichen die neue Schriftart nicht annehmen (bisschen Durchprobieren, wo man das am Besten sieht). Daran erkennst du, welche du austauschen musst.

Die Idee von BlubbsDE geht natürlich nur, wenn es wirklich ein Problem des Encodings wäre.
 
Das ist es. Siehe mein fertiges .docx. Sieht man auch einfach. Einfach den Text kopieren, und mit Wordpad als txt speichern. Dann kommt der Hinweis zur Codierung.
 
Zurück
Oben