CSV-Datei in SQL Server importieren
Ich bin auf der Suche nach Hilfe beim Importieren einer .csv-Datei in SQL Server unter Verwendung von "BULK INSERT" und habe einige grundlegende Fragen.
Probleme:
-
Die Daten der CSV-Datei können
,
(Komma) dazwischen haben (z.B. Beschreibung), wie kann ich also den Import mit diesen Daten durchführen? -
Wenn der Kunde die CSV-Datei mit Excel erstellt, werden die Daten mit Kommas in Anführungszeichen gesetzt (wie im folgenden Beispiel). Wie kann der Import damit umgehen?
-
Wie können wir feststellen, ob einige Zeilen fehlerhafte Daten enthalten, die der Import überspringt? (überspringt der Import Zeilen, die nicht importierbar sind)
Hier ist die Beispiel-CSV mit Kopfzeile:
Name,Class,Subject,ExamDate,Mark,Description
Prabhat,4,Math,2/10/2013,25,Test data for prabhat.
Murari,5,Science,2/11/2013,24,"Test data for his's test, where we can test 2nd ROW, Test."
sanjay,4,Science,,25,Test Only.
Und SQL-Anweisung zum Importieren:
BULK INSERT SchoolsTemp
FROM 'C:\CSVData\Schools.csv'
WITH
(
FIRSTROW = 2,
FIELDTERMINATOR = ',', --CSV field delimiter
ROWTERMINATOR = '\n', --Use to shift the control to next row
TABLOCK
)
168
3
Basierend auf SQL Server CSV-Import
,
(Komma) dazwischen haben (Bsp:Lösung
Wenn Sie
,
(Komma) als Trennzeichen verwenden, gibt es keine Möglichkeit, zwischen einem Komma als Feldbegrenzer und einem Komma in Ihren Daten zu unterscheiden. Ich würde einen anderenFIELDTERMINATOR
wie||
verwenden. Der Code würde dann so aussehen, dass er Komma und einfachen Schrägstrich perfekt behandelt.Lösung
Wenn Sie BULK insert verwenden, gibt es keine Möglichkeit, doppelte Anführungszeichen zu behandeln, die Daten werden Daten mit doppelten Anführungszeichen in die Zeilen eingefügt. Nach dem Einfügen der Daten in die Tabelle können Sie diese doppelten Anführungszeichen durch '` `' ersetzen.
Lösung
Um Zeilen zu behandeln, die nicht in die Tabelle geladen werden, weil sie ungültige Daten oder ein ungültiges Format haben, könnte man mit der ERRORFILE-Eigenschaft behandeln, den Namen der Fehlerdatei angeben und die fehlerhaften Zeilen in die Fehlerdatei schreiben. Zeilen, die einen Fehler haben, in die Fehlerdatei schreiben. Der Code sollte wie folgt aussehen.
Der beste, schnellste und einfachste Weg, um das Problem mit dem Komma in den Daten zu lösen, ist die Verwendung von Excel, um eine kommagetrennte Datei zu speichern, nachdem Sie die Windows-Einstellung für das Listentrennzeichen auf etwas anderes als ein Komma (z. B. eine Pipe) gesetzt haben. Dadurch wird eine durch Pipe (oder was auch immer) getrennte Datei erzeugt, die Sie dann importieren können. Dies ist hier beschrieben.
Zunächst müssen Sie die CSV-Datei in die Datentabelle importieren
Dann können Sie mit SQLBulkCopy Massenzeilen einfügen