Word- Anzahl der Wörter nach Absatz

Gasmado

Lt. Junior Grade
Registriert
Apr. 2015
Beiträge
383
Guten Abend,

habe gerade ein kleines Word-Problem, für welches ich bisher keine Lösung finden konnte. Ich habe ein Textdokument vorliegen, welches in hundert Absätze unterteilt ist (was die manuelle Methode ausschließt). Ich benötige die Anzahl der Wörter pro Absatz. Die Absätze beginnen je mit einer Zahl in einer Klammer.
Die Wörter-Zählen Funktion bringt nichts, da ich wissen muss, welche der Textstellen mehr als 180 Wörter haben.
Habt ihr da Lösungsansätze?

Darstellung ist im Screenshot. Die Absätze innerhalb eines Kapitels würde ich sonst manuell entfernen. Screenshot 2021-03-14 194846.png
Danke im Voraus für jede Hilfe!
MfG
 
Ich würde einfach die Absätze markieren und dann unten links gucken ob es mehr als 180 Wörter sind bevor ich endlos im Internet nach ner Lösung suche.
 
  • Gefällt mir
Reaktionen: Bonanca und mTw Raptor
Gasmado schrieb:
welches in hundert Absätze unterteilt ist (was die manuelle Methode ausschließt).
Wären es 100 Seiten aber so...
Gasmado schrieb:
ich wissen muss, welche der Textstellen mehr als 180 Wörter haben
Was denn nun?

Denn du schreibst:
Gasmado schrieb:
Ich benötige die Anzahl der Wörter pro Absatz.

Bei solchen Fragen fehlt mir die Erklärung, wofür das notwendig ist. Hausaufgabe?

Mit der Methode:
chb@ schrieb:
Ich würde einfach die Absätze markieren und dann unten links gucken
bist du in 10 Min. damit fertig, wenn du nur die Absätze mit mehr als 180 Wörten finden musst, denn man kann schon von vornherein abschätzen welche Absätze das sein könnten bzw. die mit weniger Wörten ausschließen. Sieht man doch fast, bei den zwei Seiten von dir könnten auf der 1. Seite die Absätze 1+3 und auf der 2. Seite die Absätze 4+5 mehr als 180 Wörter haben.
 
Python gerade parat?

1615755537168.png



1615755505254.png


1615755058099.png


Python:
import docx2txt
result = docx2txt.process("test.docx")
paragraphs = result.split("\n\n")
paragraph_number = 0
bracket_content = ""
for paragraph in paragraphs:
    paragraph_number += 1
    word_counter_for_paragraph = 0
    # Entferne Leerzeichen -> erhalte Liste von Zeichenketten, welche zwischen den
    # Leerzeichen liegen
    strings = paragraph.split(" ")
    for string in strings:
        if "[" in string:
            bracket_content = string
            continue # Überspring String "[xyz]"
        #print("Werte Zeichenkette als Wort:", string)
        word_counter_for_paragraph +=1 # Zaehl eins hoch
    print("Absatz", bracket_content, "Nummer", paragraph_number, "Anzahl Wörter", word_counter_for_paragraph)
Ergänzung ()

1615755164211.png


Falls es dich interessiert und du weitere Fragen hast, dann nur zu (falls du nicht weißt, wie du mit Python dies erledigst. Du hast ja erst einmal nur ein Script von mir).
Ergänzung ()

Ergänzung.

[1] Ein Absatz . mit fehlerhafter Interpunktion.

Hier würden 6 Wörter gezählt werden,

[2] Ein Absatz. Ohne fehlerhafte Interpunktion.

Hier wiederum korrekterweise 5.

Du müsstest den Algorithmus anpassen, wenn bei dir Fehler in der Zeichensetzung vorkommen..
 

Anhänge

  • 1615754999582.png
    1615754999582.png
    62,1 KB · Aufrufe: 137
  • 1615755028378.png
    1615755028378.png
    28,3 KB · Aufrufe: 143
Zuletzt bearbeitet: (Edit: paragraph_number + =1 hinzugefügt. Glatt vergessen auf die Schnelle. Dient nur zur Ausgabe des Absatzes (deswegen steht dort überall die 1 auf den Screenshots).)
An Nr. 1 und 2. Ihr habt recht, effizienter wäre es es einfach per Hand zu machen.
An Xonical: Vielen Dank, da ich eh versuche Python zu lernen (habe aber gerade erst angefangen) werde ich das wohl mal so versuchen, und danach eventuell modifizieren, ausweiten. Ist echt hilfreich
 
Zurück
Oben