Das Dateiformat CSV beschreibt den Aufbau einer Textdatei zur Speicherung oder zum Austausch einfach strukturierter Daten. Die Dateiendung CSV ist eine Abkürzung für Comma-Separated Values (seltener Character Separated Values oder Colon Separated Values). Ein allgemeiner Standard für das Dateiformat CSV existiert nicht. Jedoch wird im RFC 4180 das CSV-Format grundlegend beschrieben. Die zu verwendende Zeichenkodierung ist ebenso wenig festgelegt; 7-bit ASCII gilt weithin als der kleinste gemeinsame Nenner.
In CSV-Dateien können Tabellen oder eine Liste unterschiedlich langer Listen abgebildet werden. Kompliziertere, beispielsweise geschachtelte Datenstrukturen können durch zusätzliche Regeln oder in verketteten CSV-Dateien gespeichert werden. Um sie in einer Datei abzuspeichern, eignen sich jedoch andere Formate wie XML oder EDIFACT besser.
Inhaltsverzeichnis |
Innerhalb der Textdatei haben einige Zeichen eine Sonderfunktion zur Strukturierung der Daten.
Der erste Datensatz kann ein Kopfdatensatz sein, der die Spaltennamen definiert.
Jeder Datensatz sollte laut RFC 4180, Absatz 2, Punkt 4 die gleiche Anzahl Spalten enthalten – dies wird aber nicht immer eingehalten.
Die Formatierung der Daten selbst ist nicht festgelegt. Das bedeutet, dass die verwendeten Formate zwischen den beteiligten Benutzern abgesprochen werden müssen. Betroffen sind hiervon insbesondere:
Beispiele: Ist 04/03/02 der 4. März 1902, der 3. April 2002, der 2. März 2004 oder ein ganz anderer Wert? Entspricht 8:09 „morgens neun Minuten nach acht“, „20 Uhr 09“ oder ist es eine „Dauer von 8 Minuten und 9 Sekunden“?
Das CSV-Format beschreibt zeilenweise miteinander verknüpfte Datensätze. Berechnungen sind nicht vorgesehen, dennoch akzeptieren viele Anwendungen wie Excel und Gnumeric entsprechende Rechenausdrücke. Diese orientieren sich an der jeweiligen Anwendung. Für die beiden genannten Anwendungen funktioniert beispielsweise folgende (erste) Zeile:
100;200;=A1+B1
Je nach Sprachumgebung können auch benannte Funktionen verwendet werden.
Die CSV-Datei mit dem Trennzeichen ";" und Spaltenüberschriften in der ersten Zeile
Stunde;Montag;Dienstag;Mittwoch;Donnerstag;Freitag 1;Mathe;Deutsch;Englisch;Mathe;Kunst 2;Sport;Französisch;Geschichte;Sport;Geschichte 3;Sport;"Religion ev;kath";Kunst;Deutsch;Kunst
repräsentiert diese Tabelle:
| Stunde | Montag | Dienstag | Mittwoch | Donnerstag | Freitag |
|---|---|---|---|---|---|
| 1 | Mathe | Deutsch | Englisch | Mathe | Kunst |
| 2 | Sport | Französisch | Geschichte | Sport | Geschichte |
| 3 | Sport | Religion ev;kath | Kunst | Deutsch | Kunst |
In diesem Beispiel werden die Anführungszeichen verwendet, um das Semikolon zwischen ev und kath in der letzten Zeile als Text zu kennzeichnen. Das dritte Element dieser Zeile lautet also Religion ev;kath.