Best practices/Pattern für Mapper von domainspezifischem Objekt => z. B. XML?

g0l3m

Lt. Junior Grade
Registriert
Jan. 2002
Beiträge
495
Hallo,

ich muss mich in Kürze mit dem Mappen/Transformieren von Objekten einer Domäne auf eine andere Struktur beschäftigen. Konkret geht es um Objekte, die per XML zu einem anderen Endpunkt im Netz geschickt und dort weiterverarbeitet werden.

Ich hatte damit schon immer mal zu tun, würde mich aber nun gerne mal grundsätzlich mit dem Thema beschäftigen, sprich mir die notwendigen Grundlagen anlesen.

Kann mir jemand einen Tip geben, nach welchen Pattern/Architekturmusstern/Best practices ich suchen muss?

Danke!
 
Danke! Das ist ganz schön weit oben (oder unten?) in der Abstraktionsebene.

Würde mich gerne noch in etwas konkretere Lösungsansätze einarbeiten, sprich in die Schemaintegration. Also wie konkret so ein Mapping der Attribute aussieht, bzw. wer das übernimmt und wo die Zuordnungsmatrix herkommt.
 
Das ist ganz weit oben in der Abstraktionsebene. Du willst was Konkretes, hm?

Schau dir mal COMA an. Damit habe ich im Studium Schema Matching betrieben. Als Quelle und Ziel werden, soweit ich mich erinnern kann, Datenbankschemata verwendet. XML müsste eigentlich auch gehen, aber ich bin mir aber jetzt nicht sicher. Es gibt in dem Programm eine Reihe von Algorithmen, die alle das automatisierte Matching etwas anders angehen. Die Bedienung ist allerdings... "gewöhnungsbedürftig".

Für dieses Thema wichtige Stichworte sind: Schema Mapping, Schema Matching, Precision & Recall (Bewertung der Match-Ergebnisse), Globales Matching, Pattern Matching (das ist es doch, was du suchst oder?), Data Warehouse, ETL (ich habe CloverETL verwendet - extrem mächtiges Tool, da bekommt man große Augen!).

Im Grunde geht es immer nur darum, wie man (möglichst automatisiert) Attribute eines Schemas (zB deine XML) auf ein anderes Schema mappt. Wichtig ist dabei, wie man erkennt, welche Quell- und Zielattribute zusammengehören. Die Frage, ob man diese dann mappt (kann zu Datenverlust führen) oder einfach nur zusätzlich hinzufügt (vollständige Datenintegration, oftmals aber redundante Daten), muss auch beantwortet werden.

Was du mit den gemappten Daten dann anfängst, ist hinterher deine Sache bzw. die Sache deines Programms.
 
Zuletzt bearbeitet:
Zurück
Oben