Daten im richtigen Format in Excel

~liquid~

Ensign
Registriert
Juli 2013
Beiträge
154
Hallo cb,

habe folgende Situation:

Habe ca. 2000 Datensätze in einer txt-Datei in folgendem Format: (vereinfacht)

Name
Adresse
Notiz


Name
Adresse
Notiz


Und das so weiter für die 2000 verschiedenen Datensätze.

Meine Frage ist, wie ich diese in Excel richtig reinbekomme und zwar

Code:
Spalte A   Spalte B     Spalte C
Name       Adresse      Notiz

Er soll quasi aus meinen aus mehreren Zeilen bestehenden Datensatz Spalten machen.

Beim Import der txt Datei gibt es ja solche Optionen, leider nur für Tabstopps oder mit festern Breite.
Will jetzt auch nicht überall ein Komma einfügen oder dergleichen.

Wüsste jemand einen Weg dafür?


Code:
Worthmann Maschinenbau GmbH
D-26676 Barßel
ISO 9001:2008



Metallbau Schreiber GmbH
D-72649 Wolfschlugen
DIN 18800 Teil 7DIN EN ISO 3834-2






seitz engineering GmbH
D-77948 Friesenheim
Entwicklung, Prototypenbau und Serienfertigung für Montagetechnik, Prüftechnik, Handhabungstechnik,
Schweißtechnik, Laser- und Robotertechnik, Transport- und Montagewerkstückträger u. Palettenwechsler
DIN EN ISO 9001:2008





Friedrich Dierssen GmbH & Co KG
D-31848 Bad Münder

Wie hier in dem Beispiel zu sehen, jede Spalte (außer langer Text) ist mit einer neuen Zeile abgegrenz und jeder neue Datensatz mit einem oder mehreren Leerzeilen.

mfg
liq
 
Geht meiner Ansicht nach nicht ohne "programmieren".

Zusätzliche Schwierrigkeit ist, daß "Adresse" offenbar aus mehreren Zeilen bestehen kann.
Sollte das bei z.B. der Notiz auch der Fall sein, geht es nur noch manuell.
 
Schwierig, aber vielleicht möglich. Muss man aber Sehen und dran rumfummeln.

Wenn ich so ein Problem hatte, habe ich meist viel mit "Suchen und Ersetzen" gearbeitet.
Will jetzt auch nicht überall ein Komma einfügen oder dergleichen.
Doch, genau so, nur eben kein Komma sondern etwas einmaliges.
Du kannst auch reguläre Ausdrücke verwenden. Ich hab nur Libre Office, aber dort ist \n zum Beispiel das Enter am Ende des Absatzes.

Zum Importieren musst du irgendwie de Datei so hinbekommen, dassein ENTER einen neuen Datensatz angibt, und die einzelnen Spalten durch ein einmaliges Trennzeichen getrennt sind. das kann ein Tabulator sein, oder auch etwas, was garantiert in der Datei sonst nicht vorkommen, "üüüüüüü" zum Beispiel, denn das kannst du beim Importieren ja als Spaltentrenner angeben.

Bei deiner Datei komme ich aber auch nicht wirklich weiter. Besser wäre es, die datei (woher sie auch stammt) anders zu exportieren, als csv oder so.
 
Die Ausgangsdatei ist eine .pdf Datei, die ich mithilfe von pdf Grabber in txt. format gebracht habe.

Ausgangsdatei

Habe sie mit pdf Grabber in txt exportiert, die Fuszeilen usw gelöscht und will diese in einer Spaltengetrennten csv Datei gern haben.
 
Zuletzt bearbeitet:
Ich sehe da keine Hoffnung.

Als TXT ausgeworfen würde ich das Zeilenweise einlesen und mich mit etwas Intelligenz durchwurschteln. Wenn aber in Datensätzen noch dann und wann die DIN-Zeile fehlt kann nur der Mensch effizient eingreifen und Notfalls Dummywerte einbauen um Text/Text…|Postleitzahl|DIN als Gruppe abarbeiten und in Spalten setzen zu können.

Wenn die Quelle nicht besser ist als das Beispiel dann verzichte auf die Ideen (etwa mit dem Umbenenntrick) das alles wild daruflos in Spalten zu gießen. Ich habe da meine Erfahrungen; verschobene Spalten zu reparieren ist lästiger als einen ebenso manuellen Vorlauf vor so ein Konvertieren zu spannen.

CN8
 
Hi,

wenn es statt txt als word-doc vorliegen würde,
wären die mehreren aufeinanderfolgende Absatzendmarken (also z.B. Zeile 5 und 6) vor und nach dem Text ein Anhaltspunkt um einen Datensatz einzugrenzen.
Einen String solange erweitern bis erneut mind. 2 Absatzendmarken auftauchen (Zeile 10+11 bzw. später 21+22)

den string eingrenzen das er aus Zeile 7 mit 9 bestünde.
string splitten an absatzendmarken -> ergibt hier 3 Splits.
Der 1.Split -sofern es immer so ist wie im gezeigten Beispiel- wäre der Name.
der 2.Split die Adresse -anscheinend immer lediglich PLZ und Ort
und der 3.Split die Notiz
 
Zurück
Oben