Hallo zusammen,
heute kam ich in Verbindung mit Talend (ETL-Tool) bei der Verarbeitung von Daten für ein Data Warehouse, an meine Grenzen.
DB-System: MS SQL Server 2014
Die Fehlermeldung war die folgende:
Bulk load data conversion error (type mismatch or invalid character for the specified codepage) for row X, column Y.
Die Column war tatsächlich meine ID, welche inkrementell bei jedem Insert hinzugefügt & nicht NULL sein kann.
Laut Google kommt dieser Fehler sau oft zustande, wie zum Beispiel wenn man falsche Field oder Row-Seperatoren nimmt.. oooder die "letzte Zeile mal spackt".
Ich habe:
- den Job auf eine Row begrenzt und mir die Bulkfile angesehen, um eventuell einen Korrupten Datensatz zu identifizieren.. sah alles einwandfrei aus.
- Den Bulk Import händisch per SQL-Befehl auf alle Datensätze abgefeuert.. Hier kam diese Fehlermeldung 10x und brach dann ab, da er's 10x versucht hatte
- Den SQL-Profiler angemacht und versucht "genau zu sehen, was passiert" - Kam nicht wirklich was bei raus..
- Die Datentypen von Quell und Ziel-DB verglichen
- Innerlich geweint
Nun zu meiner Hauptfrage:
Gibt es eine Möglichkeit, wenn ich einen Bulk Import händisch im MS SQL Studio Management abfeuer, diesen bis auf den Kern zu debuggen und genau zu sehen, was denn sein Problem ist? Ja..... das Problem ist: Type mismatch =)..
Anscheinend gibt es so ein "SSIS" Tool.. Damit kam ich aber einfach nicht klar .
Anderes Thema, die Chance ist zwar sehr gering - jedoch versuche ich's mal!
Gibts es hier zufällig Menschen, die generell mit Data-Warehouse Themen und vielleicht sogar Talend zu tun haben?
Ich frage hier, da Talend ein Java basiertes suuuuper ETL-Tool ist und man teilweise tief in die Trickkiste greifen muss.
Vielleicht könnte man sich per pn's bei Gelegenheit austauschen!
heute kam ich in Verbindung mit Talend (ETL-Tool) bei der Verarbeitung von Daten für ein Data Warehouse, an meine Grenzen.
DB-System: MS SQL Server 2014
Die Fehlermeldung war die folgende:
Bulk load data conversion error (type mismatch or invalid character for the specified codepage) for row X, column Y.
Die Column war tatsächlich meine ID, welche inkrementell bei jedem Insert hinzugefügt & nicht NULL sein kann.
Laut Google kommt dieser Fehler sau oft zustande, wie zum Beispiel wenn man falsche Field oder Row-Seperatoren nimmt.. oooder die "letzte Zeile mal spackt".
Ich habe:
- den Job auf eine Row begrenzt und mir die Bulkfile angesehen, um eventuell einen Korrupten Datensatz zu identifizieren.. sah alles einwandfrei aus.
- Den Bulk Import händisch per SQL-Befehl auf alle Datensätze abgefeuert.. Hier kam diese Fehlermeldung 10x und brach dann ab, da er's 10x versucht hatte
- Den SQL-Profiler angemacht und versucht "genau zu sehen, was passiert" - Kam nicht wirklich was bei raus..
- Die Datentypen von Quell und Ziel-DB verglichen
- Innerlich geweint
Nun zu meiner Hauptfrage:
Gibt es eine Möglichkeit, wenn ich einen Bulk Import händisch im MS SQL Studio Management abfeuer, diesen bis auf den Kern zu debuggen und genau zu sehen, was denn sein Problem ist? Ja..... das Problem ist: Type mismatch =)..
Anscheinend gibt es so ein "SSIS" Tool.. Damit kam ich aber einfach nicht klar .
Anderes Thema, die Chance ist zwar sehr gering - jedoch versuche ich's mal!
Gibts es hier zufällig Menschen, die generell mit Data-Warehouse Themen und vielleicht sogar Talend zu tun haben?
Ich frage hier, da Talend ein Java basiertes suuuuper ETL-Tool ist und man teilweise tief in die Trickkiste greifen muss.
Vielleicht könnte man sich per pn's bei Gelegenheit austauschen!