Excel: 2 Versionen großer XLSX abgleichen/konsolidieren

Quox

Lt. Junior Grade
Registriert
Jan. 2005
Beiträge
281
Hallo zusammen,

wie auch immer mir das passieren konnte - ich habe nun 2 Dateiversionen - je knapp 2GB und > 20 Tabs/Blätter

Und muss im Grunde auch stetig weiter dran arbeiten.

Jede Version wird Daten enthalten (und keineswegs nur unten oder linear bearbeitet oder simpel sortierbar), die in der anderen fehlen werden.

Wie würdet ihr das machen?
Gibt es dazu irgendwelche internen Funktionen oder externe Tools?
 
Erste Frage wäre vermutlich: Kamen immer nur Zeilen/Spalten/Zellen hinzu oder geht es um einen Abgleich auch hinsichtlich Änderungen und Löschungen?
 
Ja, man haut alles in eine Datenbank.

Sorry, aber bei knapp 2GB und > 20 Tabs/Blätter befindet man sich weit außerhalb dem, wofür Excel gedacht und ausgelegt ist. Geh zu deinem Chef und sag ihm, dass Excel das nicht mehr packt und alles in eine DB muss.
 
  • Gefällt mir
Reaktionen: nutrix, sikarr, midwed und 2 andere
Krik schrieb:
Geh zu deinem Chef und sag ihm, dass Excel das nicht mehr packt und alles in eine DB muss.
... damit man es dann aus der Datenbank wieder in Excel importiert. :)
 
  • Gefällt mir
Reaktionen: sikarr
Nein, damit man alle Operationen dort machen lässt. Excel wird dann nur noch für die konsolidierte Ansicht verwendet.
 
  • Gefällt mir
Reaktionen: nutrix, sikarr, midwed und eine weitere Person
Auch wenn ne Datenbank ne sinnvollere Basis wäre, mit PowerBI sollte man das Problem aber recht einfach lösen lassen. Die Transformationen dürften auch in Excel inzwischen gehen.

Ansonsten ein Python-Skript schreiben oder sonst irgendwas verwenden, was Excel-Sheets auslesen kann.
 
  • Gefällt mir
Reaktionen: Malaskir
Ich würde das Ganze auf einzelne, jeweils per VBA programmierbare Aufgabenstellungen zurechtstutzen und die sich ergebenden Skripte von ChatGPT erstellen lassen.
 
tomgit schrieb:
nsonsten ein Python-Skript schreiben oder sonst irgendwas verwenden, was Excel-Sheets auslesen kann.
Da rennst du auch schon im Probleme bei der Größe, selbst MS eigene Bibliotheken für OpenXML Document mögen das nicht, benutzen ja intern die eigenen XML parser und Zip Bibliotheken und wenn die XLSX Datei schon 2GiB ist, kannst dir ja ausrechnen wie groß eine einzelne XML Datei mit Werten ist oder gar die SharedString Datei.
 
  • Gefällt mir
Reaktionen: sikarr
au weia... erstmal herzlichen Dank für eure Mühe Tipps!
kingduevel schrieb:
Erste Frage wäre vermutlich: Kamen immer nur Zeilen/Spalten/Zellen hinzu oder geht es um einen Abgleich auch hinsichtlich Änderungen und Löschungen?
GUTE Frage: Ersteres wäre mir klar wichtiger - es sollte halt nichts Zugefügtes fehlen
  • würde etwas bereits gelöschtes dagegen nun umsonst da sein: Weniger dramatisch
  • Editierungen irgendwo dazwischen

Bitte nicht missverstehen oder "undankbar":
Ich habe seit Jahren keinen Chef mehr u. keine Kollegen - ich habe NULL Datenbankerfahrung - null Programmier-, Phyton or ChatGPT -Kenntnisse - sorry!

Ob es sinnig ist damit nun anzufangen u womöglich nur für diesen einen Fehltritt? Ich würde mal angesichts meines äh ALTERS sagen: Eher nicht.
"PowerBl" also wohl "Power Bl" klingt zunächst einfacher... aber auch nix was 2h Einarbeitung + dann go klingt.

Hatte zB gehofft, es gäb vielleicht ne Art Prüfsumme für einzelne Tabs - denn vermutlich sind nur 3 oder 4 betroffen.

Hab jetzt Termin - nicht wundern...
 
Quox schrieb:
Hatte zB gehofft, es gäb vielleicht ne Art Prüfsumme für einzelne Tabs - denn vermutlich sind nur 3 oder 4 betroffen.
Du kannst wirklich eins probieren:
1. Mit 7-Zip die XLSX entpacken, jeweils in eigenes Verzeichnis
2. Für jede Datei mit 7-Zip die SHA256 hashes berechnen und die dann Datei für Datei vergleichen.

Dir muss aber bewusst sein, dass eine Änderung in Excel mehr als nur eine Datei anfasst
 
Einfache dummblöde Lösung wäre, jedes Blatt als CSV exportieren, und die beiden korrespondieren Blätter per Textvergleich wie diff vergleichen. Ansonsten könnte mal sowas auch prima per Powershell oder VB automatisieren.
 
Quox schrieb:
Ob es sinnig ist damit nun anzufangen u womöglich nur für diesen einen Fehltritt? Ich würde mal angesichts meines äh ALTERS sagen: Eher nicht.
Naja bei so großen Datenmengen kann selbst ein kleiner Fehler große Aufwände verursachen von daher kann das schon lohnen sich gewisse Sachen anzueignen
Quox schrieb:
Hatte zB gehofft, es gäb vielleicht ne Art Prüfsumme für einzelne Tabs - denn vermutlich sind nur 3 oder 4 betroffen.
das schonmal versucht? https://support.microsoft.com/de-de...abgleich-0e1627fd-ce14-4c33-9ab1-8ea82c6a5a7e
oder das
https://excelhero.de/formeln/zwei-tabellen-vergleichen/
 
  • Gefällt mir
Reaktionen: nutrix
Quox schrieb:
Ob es sinnig ist damit nun anzufangen u womöglich nur für diesen einen Fehltritt? Ich würde mal angesichts meines äh ALTERS sagen: Eher nicht.
Hast du Microsoft Access in Betracht gezogen? Man kann sich da einiges zusammenklicken.
 
Quox schrieb:
je knapp 2GB und > 20 Tabs/Blätter
Die Bedingten, und allgemein Formatierungen blähen die Excel Files im übrigen auch sehr gut auf evtl. ist der Datensatz gar nicht so groß wenn man eine Version ohne Formatierungen zum Vergleichen benutzt?
Ergänzung ()

umask007 schrieb:
Hast du Microsoft Access in Betracht gezogen? Man kann sich da einiges zusammenklicken.
Bitte nicht, bei 2GB großen Files dauert alles ewig.
 
sikarr schrieb:
Bitte nicht, bei 2GB großen Files dauert alles ewig.
Man kann auch eine Datenbank als Datenquelle benutzen, es muss nicht umbedingt eine Access Datei sein.
 
Mit dem Tool WinMerge kann man mit entsprechenden Einstellungen auch .xlsx Files vergleichen.
Wie gut (und ob überhaupt) das mit Dateien im 2GB-Bereich funktioniert, kann ich aber nicht sagen, hatte das bisher nur im zweistelligen MB-Bereich im Einsatz.
 
Zurück
Oben