oc-factory
Cadet 3rd Year
- Registriert
- Aug. 2004
- Beiträge
- 45
Hallo zusammen,
ich sitze gerade vor der Flimmerkiste und bekommen die Knoten nicht mehr aus meinen Hirnzellen heraus

Folgendes Szenario:
Unterschiedliche Zeichenkombinationen aus einer Datei, sollen mit anderen unterschiedlichen Zeichenkombinationen aus einer zweiten Datei verglichen werden. Dabei unterscheiden sich beide Dateien vom Inhalt nur durch wenige Zeichenkombinationen. Die Zeichenkombinationen lese ich aus der Datei paarweise ein und vergleiche sie miteinander. Wenn es Unterschiede gibt, wird die betreffende Zeichenkombination, als Hinweis auf den Unterschied, ausgegeben.
Jetzt zum eigentlichen Problem:
Ich möchte die Ausgabe der Unterschiede optimieren, da sich einige Unterschiede bei genauerer Betrachtung stark vereinfachen lassen. Und genau da komme ich nicht weiter und möchte am folgenden Beispiel erklären, was das Problem ist.
UPDATE
Zeichenkombinationen in Datei 1:
AD2 GD2 GV8 SQ1 NPL UBY QSX XBT ZZ4
Zeichenkombinationen in Datei 2:
AD2 DWA GD2 GV8 SQ1 NPL UBY QDR QSX XBT ZZ4
Wenn ich mit meiner aktuellen Methode den Vergleich fahre bekomme ich als Ausgabe:
GD2 GV8 SQ1 NPL UBY QSX XBT ZZ4
DWA GD2 GV8 SQ1 NPL UBY QDR QSX XBT ZZ4
(jeweils mit Positionsangaben)
Der eigentliche Unterschied besteht jedoch darin, dass sich die Zeichenkombinationen "DWA" und "QDR" in Datei 2 befinden, welche aber nicht in Datei 1 sind und daher die nachfolgenden Zeichenkombinationen in Datei 2 nach rechts verschieben.
Das hätte ich gerne als Ausgabe:
___ DWA
___ QDR
___ = Symbolische Kennzeichnung, dass diese Kombination in Datei 1 nicht vorhanden ist)
Die Unterschiede von oben reduzieren sich damit und es verbleiben die beiden eigentlichen Unterschiede.
Hinweis: Die "eingeschobenen" Zeichenkombinationen befinden sich auch nur in Datei 2. Im Beispiel sind es zwei, aber es können auch drei oder noch mehr "eingeschobene" Zeichenkombinationen in einer Zeile sein.
Bitte melden, falls etwas unklar sein sollte
ich sitze gerade vor der Flimmerkiste und bekommen die Knoten nicht mehr aus meinen Hirnzellen heraus
Folgendes Szenario:
Unterschiedliche Zeichenkombinationen aus einer Datei, sollen mit anderen unterschiedlichen Zeichenkombinationen aus einer zweiten Datei verglichen werden. Dabei unterscheiden sich beide Dateien vom Inhalt nur durch wenige Zeichenkombinationen. Die Zeichenkombinationen lese ich aus der Datei paarweise ein und vergleiche sie miteinander. Wenn es Unterschiede gibt, wird die betreffende Zeichenkombination, als Hinweis auf den Unterschied, ausgegeben.
Jetzt zum eigentlichen Problem:
Ich möchte die Ausgabe der Unterschiede optimieren, da sich einige Unterschiede bei genauerer Betrachtung stark vereinfachen lassen. Und genau da komme ich nicht weiter und möchte am folgenden Beispiel erklären, was das Problem ist.
UPDATE
Zeichenkombinationen in Datei 1:
AD2 GD2 GV8 SQ1 NPL UBY QSX XBT ZZ4
Zeichenkombinationen in Datei 2:
AD2 DWA GD2 GV8 SQ1 NPL UBY QDR QSX XBT ZZ4
Wenn ich mit meiner aktuellen Methode den Vergleich fahre bekomme ich als Ausgabe:
GD2 GV8 SQ1 NPL UBY QSX XBT ZZ4
DWA GD2 GV8 SQ1 NPL UBY QDR QSX XBT ZZ4
(jeweils mit Positionsangaben)
Der eigentliche Unterschied besteht jedoch darin, dass sich die Zeichenkombinationen "DWA" und "QDR" in Datei 2 befinden, welche aber nicht in Datei 1 sind und daher die nachfolgenden Zeichenkombinationen in Datei 2 nach rechts verschieben.
Das hätte ich gerne als Ausgabe:
___ DWA
___ QDR
___ = Symbolische Kennzeichnung, dass diese Kombination in Datei 1 nicht vorhanden ist)
Die Unterschiede von oben reduzieren sich damit und es verbleiben die beiden eigentlichen Unterschiede.
Hinweis: Die "eingeschobenen" Zeichenkombinationen befinden sich auch nur in Datei 2. Im Beispiel sind es zwei, aber es können auch drei oder noch mehr "eingeschobene" Zeichenkombinationen in einer Zeile sein.
Bitte melden, falls etwas unklar sein sollte
Zuletzt bearbeitet: