Ich möchte eine Textdatei auslesen. Dazu habe ich auch das Beispiel angehängt. Meine Dateien sehen genauso aus nur das sie bis zu 10 MB groß sind.
Diese möchte ich entweder in eine DB oder in eine xml-Datei schreiben. Das entscheide ich wenn ich die Performance getestet habe. Das einfügen der einzelnen Werte in eine xml oder DB stellt auch kein Problem dar.
Aber wie lese ich möglichst schnell die einzelnen Werte aus der txt aus?
Bisher nehme ich einen Textreader.
Zunächst suche ich nach dem ersten Wert der POS enthält, zerlege den String bis zur Stelle 10 und schreibe diesen Wert in den ersten Tag der xml.
Das mache ich bis **Name kommt. Jetzt würde ich anfangen und den Wert "POS1_21561" in den bisherigen Tags zu suchen und die entsprechenden Tags darunter zu hängen. Das Ganze nochmal für Inhalt.
Nur leider ist diese Methode extrem langsam.
Geht es schneller?
PS: Die Textdatei ist wirklich repräsentativ. Es ist also gewollt dass POS teilweise eine 1 vor dem _ oder ein- statt einem _ enthält. Es kann auch vorkommen, dass Buchstaben enthalten sind.
Das D vor dem Namen ist auch immer vorhanden.
Die Nummern bei Inhalt stellen die Zeilennummern dar.
Diese möchte ich entweder in eine DB oder in eine xml-Datei schreiben. Das entscheide ich wenn ich die Performance getestet habe. Das einfügen der einzelnen Werte in eine xml oder DB stellt auch kein Problem dar.
Aber wie lese ich möglichst schnell die einzelnen Werte aus der txt aus?
Bisher nehme ich einen Textreader.
Zunächst suche ich nach dem ersten Wert der POS enthält, zerlege den String bis zur Stelle 10 und schreibe diesen Wert in den ersten Tag der xml.
Das mache ich bis **Name kommt. Jetzt würde ich anfangen und den Wert "POS1_21561" in den bisherigen Tags zu suchen und die entsprechenden Tags darunter zu hängen. Das Ganze nochmal für Inhalt.
Nur leider ist diese Methode extrem langsam.
Geht es schneller?
PS: Die Textdatei ist wirklich repräsentativ. Es ist also gewollt dass POS teilweise eine 1 vor dem _ oder ein- statt einem _ enthält. Es kann auch vorkommen, dass Buchstaben enthalten sind.
Das D vor dem Namen ist auch immer vorhanden.
Die Nummern bei Inhalt stellen die Zeilennummern dar.