Man unterscheidet bei Daten nicht zwischen Text und Zahlen, sondern zwischen
Warum diese Unterscheidung? Text enthält meist auch irgendwelche Zahlen, nur Berechnungen werden damit keine durchgeführt. Diese sind nur mit reinen Zahlen - also numerischen Daten - möglich.
Dann gibt es noch die multimedialen Daten:
Jede Datei verfügt über eine Dateinamenerweiterung (Dateiendung). Diese ist 3 oder 4 Buchstabem lang und wird - nach einem Punkt an den Dateinamen angehängt. Die Dateinamenerweiterung verrät dem Programm, das die Datei öffnet, um was für einen Dateityp es sich handelt. So kann das Programm die Folgen aus Bites und Bytes richtig interpretieren.
Das gleiche Muster von Bits kann unterschiedliche Bedeutungen haben. Stellen wir uns eine beliebige Folge von drei Byte vor:
10010011 01101111 00101001
In der Datei | könnte sie bedeuten: |
---|---|
dateiname.txt | das Wort: "wer" |
dateiname.doc | Teil des Befehls: "Einzug links um 1,75cm" |
dateiname.gif | 3 Bildpunkte: blau hellblau weinrot (.gif kennt nur 256 Farben => 1 Byte pro Pixel) |
dateiname.jpg | 1 Bildpunkt: orange (16,7 Mio. Farben => 3 Byte pro Pixel) |
Aber auch innerhalb einer Datei kann ein identisches Bit-Muster unterschiedliche Bedeutungen haben. Eine Powerpoint Präsentation kann schließlich Text, Bilder, Grafiken und Sounds enthalten. Also muss eine bestimmte Folge von Bits/Bytes dem Programm immer wieder sagen, wie die folgenden Nullen und Einsen zu interpretieren sind.
Die bisherigen Informationen trugen zwar (hoffentlich) zum Verständnis bei, hatten aber noch keine praktische Bedeutung.
Beim Erstellen einer Datenbank kommt man direkt mit dem Thema Datentypen in Berührung: für die Felder einer Tabelle muss man den jeweils optimalen Felddatentyp auswählen!
Ein paar Beispiele:
Datentyp | Größe | Erklärung |
---|---|---|
Logischer Wert (Ja/Nein, Boolscher Wert ,...) | 1Bit | Wozu Speicherplatz verschwenden, wenn nur eine "Entweder-Oder-Information" gespeichert werden soll? |
"Byte" | 1Byte | Zahl zwischen 0 und 255 |
Char (Character), Text | 1 oder 2 Byte pro Zeichen | Je nach Zeichencode verlangt ein Zeichen 1 (z.B. ASCII-Code) oder 2 Byte (Unicode UTF-16). |
Integer | 2 Byte | Ganzzahl zwischen -32.768 bis 32.767 |
Integer unsigned | 2 Byte | Ganzzahl zwischen 0 und 65535 |
Long Integer | 4 Byte | Ganzzahl zwischen -2.147.483.648 bis 2.147.483.647 |
Single | 4 Byte | Gleitkommazahl zwischen 1,5·10−45 und 3,4·1038 |
... (u.v.m.) | ... |