Daten sind logisch gruppierte Informationseinheiten (engl., aber auch in der Informationstheorie Datum), die zwischen Systemen übertragen werden oder auf Systemen gespeichert sind.
Inhaltsverzeichnis |
Diese Pluralform folgt damit anderen Wörtern lateinischen Ursprungs wie Faktum/Fakten und Skriptum/Skripten. In der deutschen Sprache hat sich jedoch die Bedeutung von „Datum“ im allgemeinem Sprachgebrauch auf „Kalenderdatum“ eingeengt. Deshalb wird das Wort „Daten“ als Plural von „Datum“ selten verwendet. „Datum“ wird manchmal behandelt, als ob es ein Singularetantum (Wort ohne Plural) wäre; „Daten“ wird häufig behandelt, als ob es ein Pluraletantum (Wort ohne Singular) wäre. Falsche, scherzhafte Pluralia von „Datum“ sind Datümmer und Datumse; eine beliebte Methode, das Wort „Daten" zu vermeiden, ist die Umschreibung mit „Termine“. Um dagegen das Wort „Datum“ als Singular zu „Daten“ zu vermeiden, werden Wörter wie „Datenelement“, „Angabe“ oder „Wert“ verwendet.
Dennoch ist beispielsweise der Satz „An folgenden Daten der Geschichte gab es große Erdbeben“ vollkommen korrekt. Aus dem Satzzusammenhang geht hier auch klar hervor, dass mit „Daten“ in diesem Fall der Plural von Kalenderdatum gemeint ist.
Das Recht verwendet an verschiedenen Stellen den Datenbegriff. Dennoch gibt es keine Definition des Datenbegriffs im Recht. Verwendet wird der Begriff etwa im Datenschutz (Bundesdatenschutzgesetz), dem Ausspähen von Daten (§ 202a StGB) etc. Eine Definition findet sich nicht in § 202a Abs. 2 StGB, auch wenn dieser teils so verstanden wird. § 202a Abs. 2 StGB geht von einem Datenbegriff aus und schränkt ihn weiter ein. ("Daten im Sinne des Absatzes 1 (!) sind solche, die ...").
Nach der technischen Norm DIN 44300 Nr. 19 sind Daten Informationen, die durch Zeichen oder kontinuierliche Funktionen aufgrund bekannter oder unterstellter Abmachungen zum Zweck der Verarbeitung dargestellt werden.
Informatik und Datenverarbeitung versteht man Daten als (Maschinen-) lesbare und bearbeitbare in der Regel digitale Repräsentation von Information. Die Information wird dazu meist zunächst in Zeichen (bzw. Zeichenketten) kodiert, deren Aufbau strengen Regeln folgt, der so genannten Syntax. Um aus Daten Informationen zu gewinnen, müssen sie in einem Bedeutungskontext interpretiert werden. So kann die Zahlenfolge „12345678“ zum Beispiel in Abhängigkeit vom Kontext für eine Telefonnummer, eine Kontonummer oder die Anzahl von Kfz-Neuzulassungen in einem bestimmten Zeitraum stehen. Als reiner Datensatz betrachtet handelt es sich bei „12345678“ nur um eine Aneinanderreihung von Zahlen oder Symbolen. Die Bedeutung wird erst im jeweiligen Kontext sichtbar.
Die Speicherung von Daten in datenverarbeitenden Maschinen erfolgt in der Regel in binärer Form. Daten werden als Datenmenge auf der Grundlage von Bits als kleinste Speichereinheit dargestellt. Andere Codierungen wären denkbar (z. B. analog oder oktal), finden aber aus technischen Gründen keine Anwendung:
Man unterscheidet:
Strukturierte Daten beinhalten Nutzdaten und zusätzlich Metadaten, das sind andere Elemente, die für eine zuverlässige sich strukturierte Daten relativ einfach maschinell weiterverarbeiten lassen, ist dies bei unstrukturierten Daten nur schwer oder ungenau möglich.
Das Synchronisieren von Daten wird als Datenabgleich bezeichnet.
Neartime-Daten sind Kopien von aktuellen Daten mit etwas geringerer Aktualität als die Originaldaten.
Die Semiotik definiert Daten als potenzielle Information. In der Semiotik werden Daten heute in die Sigmatik-Ebene eingeordnet.