Hallo,
ich muss aus einem Text, der aus ca. 20 000 Zeichen besteht, bestimmte Passagen herausfiltern.
Mein Code lautet wie folgt:
Der Code funktioniert zwar, jedoch dauert die Abfrage mindestens 10 Sekunden!
Daher eine Frage an die Experten: gibt es einen anderen Weg, Rechnenleistung einzusparen?
Wenn die oben genannte Bedingung aus "regulärerAusdruck1", "regulärerAusdruck2" und "regulärerAusdruck3" erfüllt ist, kann die Abfrage eigentlich abgebrochen werden, da ich nur die erste Übereinstimmung auswerten muss.
Ich hab schon versucht die letzten 10 000 Zeichen "abzuschneiden", da die Bedingung im ersten Teil des Textes vorkommt, doch an der Performance hat sich NICHTS verbessert.
Wer kann mir ein paar Tipps geben?
ich muss aus einem Text, der aus ca. 20 000 Zeichen besteht, bestimmte Passagen herausfiltern.
Mein Code lautet wie folgt:
Python:
re.findall("<htmlCode>(regulärerAusdruck1)</htmlCode>.*<htmlCode>(regulärerAusdruck2)</htmlCode>.*<htmlCode>(regulärerAusdruck3)</htmlCode>",meineVariable)
Der Code funktioniert zwar, jedoch dauert die Abfrage mindestens 10 Sekunden!
Daher eine Frage an die Experten: gibt es einen anderen Weg, Rechnenleistung einzusparen?
Wenn die oben genannte Bedingung aus "regulärerAusdruck1", "regulärerAusdruck2" und "regulärerAusdruck3" erfüllt ist, kann die Abfrage eigentlich abgebrochen werden, da ich nur die erste Übereinstimmung auswerten muss.
Ich hab schon versucht die letzten 10 000 Zeichen "abzuschneiden", da die Bedingung im ersten Teil des Textes vorkommt, doch an der Performance hat sich NICHTS verbessert.
Wer kann mir ein paar Tipps geben?