Redis

Einführung

Redis ist ein sogenannter Key-Value-Store, der Werte (Values) unter eindeutigen Schlüsseln (Keys) abspeichert. Der Name “Redis” ist eine Abkürzung für Remote Dictionary Service: Bei Redis handelt es sich also um einen Dienst, den man als (entferntes) “Wörterbuch” verwenden kann. Dies soll heissen, dass man in diesem Service Werte anhand eines Schlüssels ablegen und nachschlagen kann. Redis ist somit als eine grosse Map zu verstehen.

Note

Redis ist eine OpenSource-Software, die unter der BSD-Lizenz entwickelt worden ist. 2024 ist das Projekt jedoch auf eine andere Lizenz umgestiegen, womit Redis Status als OpenSource-Software umstritten ist. Mit Valkey (BSD-Lizenz) und Redict (LGPL-Lizenz) gibt es zwei Forks (d.h. Abspaltungen) von Redis, die aktiv unter einer OpenSource-Lizenz weiterentwickelt werden. Da derzeit (Stand: Oktober 2024) einzig Redis unter den Standardpaketquellen von Debian zur Verfügung steht, soll in diesem Modul bis auf Weiteres Redis zum Einsatz kommen. Längerfristig dürfte sich jedoch Valkey als OpenSource-Variante durchsetzen, da dieses Projekt von der Linux Foundation getragen wird.

Redis als Nachschlagewerk

In Redis müssen die Schlüssel eindeutig sein, damit man sie zum Nachschlagen von Werten verwenden kann. Werte dürfen hingegen mehrmals die gleichen vorkommen. Hierzu einige Beispiele:

Schlüssel	Wert
`balance`	`25471.93`
`127.0.0.1`	`localhost`
`ipv4`	`195.347.52.9`
`Joe Doe`	`+019425287164`
`started`	`2021-12-29T19:35:12.15.632+00:00`

Es gibt verschiedene Systeme, die wie ein solches Nachschlagewerk funktionieren, beispielsweise:

das Domain Name System (DNS) zum Nachschlagen von IP-Adressen (Values) anhand von Domainnamen (Keys)
eine ARP-Tabelle zum Nachschlagen von MAC-Adressen (Values) anhand von IPv4-Adressen (Keys)
ein Telefonbuch zum Nachschlagen von Telefonnummern (Values) anhand von Namen (Keys)
ein Lexikon zum Nachschlagen von Bedeutungen (Values) anhand von Begriffen (Keys)
ein Dateisystem zum Ablegen von Dateien (Values) unter bestimmten Pfaden (Keys)

Datentypen

Redis ist ein Datenspeicher für abstrakte Datentypen, d.h. die darin gespeicherten Daten folgen keinem strengen Schema wie bei relationalen Datenbanken, aber weisen gewisse Strukturen auf. Es werden u.a. die folgenden Datentypen unterstützt, welche entprechende Gegenstücke in Programmiersprachen haben:

Programmiersprachen	Redis
Primitive Datentypen	String
Zeichenketten	String
Arrays, Listen	List
Maps, Dictionaries, Hashes	Hash
Mengen	Set

Redis ist also ein Datenspeicher für Datenstrukturen und funktioniert selber wie eine grosse Map mit (eindeutigen) Schlüsseln und dazu zugeordneten Werten.

Persistente Datenspeicherung

Redis kann Daten auf verschiedene Arten speichern:

Das RDB-Format (“Redis Database”) speichert die Datenbank als Zustand in einer Datei ab. Dieses Format ist sehr kompakt, schnell im Zugriff und eignet sich sehr gut für Datensicherungen (Backups). Änderungen werden nicht in Echtzeit geschrieben, sondern nur periodisch, wodurch Datenverluste auftreten können.
- Analogie: Das aktuelle Saldo eines Bankkontos, wovon man aber nicht weiss, welche Zahlungsein- und -ausgänge zu diesem Saldo geführt haben.
Das AOF-Format (“Append-only File”) speichert die Datenbank als Transaktionslog in einer Datei ab. Dabei wird jede einzelne Operation abgespeichert, sodass es nachvollziehbar ist, was mit der Datenbank passiert ist. Dieses Format bietet Nachvollziehbarkeit und Sicherheit, benötigt aber viel Platz und ist langsam, da der aktuelle Zustand anhand der abgespeicherten Transaktionen berechnet werden muss.
- Analogie: Die Zahlungsein- und -ausgänge eines Bankkontos, die aufsummiert werden müssen, damit man das Saldo zu einem bestimmten Zeitpunkt herausfinden kann.

Es ist auch möglich, beide Formate zu aktivieren. Dadurch hat man die Vorteile beider Formate, benötigt aber auch mehr Speicherplatz und opfert zusätzlich Performance, da einerseits jede Transaktion (AOF) und andererseits der aktuelle Zustand periodisch (RDB) gesichert werden muss.

Möchte man Redis als schnellen Zwischenspeicher (Cache) einsetzen, ist es auch möglich, keines der beiden Formate zu verwenden. Wird Redis neu gestartet, sind die Daten unwiderruflich verloren. (In solchen Einsatzszenarien lassen sich aber die Daten einfach neu berechnen.)

Standardmässig ist Redis so konfiguriert, dass es das RDB-Format verwendet. Bei der Auswahl der Speicherart kann man sich folgendes überlegen:

Möchte man den aktuellen Zustand kennen, sollte man das RDB-Format verwenden.
Möchte man wissen, wie es zum aktuellen Zustand gekommen ist, sollte man das AOF-Format verwenden.
Möchte man beides wissen, sollte man das RDB- und das AOF-Format verwenden.
Möchte man Redis nur als Cache ohne Persistenz einsetzen, kann man Redis ohne RDB/AOF betreiben.

Der Abschnitt Persistenz der Redis-Dokumentation enthält weiterführende Informationen zu diesen Formaten, deren Vor- und Nachteilen sowie zur Konfiguration.

Verwendung: Beispielsession

Der Redis-Server kann über verschiedene Sprachanbindungen aus einer Programmiersprache heraus angesprochen werden. Für den interaktiven Gebrauch steht das Kommandozeilenwerkzeug redis-cli zur Verfügung. Eine solche Session kann folgendermassen aussehen:

$ redis-cli
127.0.0.1:6379> PING
PONG
127.0.0.1:6379> SET name John
OK
127.0.0.1:6379> KEYS *
1) "name"
127.0.0.1:6379> GET name
"John"
127.0.0.1:6379> DEL name
(integer) 1
127.0.0.1:6379> EXISTS name
(integer) 0

Die Session wird mit dem Befehl redis-cli geöffnet.
Mit PING wird geprüft, ob die Verbindung zum Server funktioniert. (Es kommt PONG zurück.)
Mit SET wird ein Eintrag (key: name, value: John) geschrieben.
Mit KEYS * werden alle vorhandenen Schlüssel aufgelistet (aktuell nur name).
Mit DEL wird der Schlüssel name gelöscht.
Mit EXISTS kann man das Vorhandensein eines Schlüssels überprüfen (0 heisst “negativ”, d.h. der Schlüssel name existiert nicht (mehr)).

Befehlstruktur

Redis kennt über 400 Befehle. Diese muss man nicht auswendig kennen. Es ist aber hlfreich, sich mit folgenden Regeln durch die Befehlsstruktur orientieren zu können:

Befehle haben ein Präfix. Dieses richtet sich nach der Datenstruktur, auf welcher der Befehl operiert:
- List: L bzw. R für Operationen am linken bzw. rechten Listenende
- Sets: S
- Hashes: H
- Sorted Sets: Z
Die Befehle haben keine, einen oder mehrere (teils optionale) Parameter:
- FLUSHALL: keine Parameter
- GET key: ein Parameter
- SET key value: zwei Parameter
- HGET key field1 value1 [field2 value2 …]: beliebig viele Parameter

Grundlegende Befehle

Die folgenden Befehle werden im interaktiven Umgang mit Redis sehr häufig verwendet. Ihren Gebrauch sollte man beherrschen:

PING: Verbindung testen (gibt PONG aus, wenn die Verbindung steht)
HELP: Hilfe ausgeben, z.B. zu einem Befehl
- Beispiel: HELP PING
AUTH: Interaktive Authentifizierung mit Passwort
FLUSHALL: Löscht alle Einträge
KEYS: Schlüssel gemäss Muster anzeigen
- KEYS *: listet alle Schlüssel auf
EXISTS: Prüft, ob ein Schlüssel existiert
TYPE: Gibt den Datentyp des Werts von einem Schlüssel aus
SAVE: Persistente Speicherung forcieren

Befehle für einfache Werte

Der einfachste Einsatz von Redis ist das Verwalten einfacher Werte, d.h. von Schlüssel-Wert-Paaren.

SET: Ein Schlüssel/Wert-Paar definieren
- MSET: Mehrere Schlüssel/Wert-Paare gleichzeitig definieren
GET: Wert anhand eines Schlüssels auslesen
DEL: Eintrag entfernen
RENAME: Schlüssel umbenennen

Strukturierte Schlüsselnamen

Schlüsselnamen können gemäss einer selbst gewählten Konvention strukturiert werden. Hierbei werden Teile des Schlüssels durch einem Punkt oder durch einen Doppelpunkt voneinander getrennt. (Diese Zeichen haben keine besonderen Bedeutungen, sondern dienen einfach zur optischen Strukturierung der Schlüssel.)

Beispiele:

SET lucerne.name Luzern
SET lucerne.population 81592

SET employee:1234:name Dilbert
SET employee:1234:position Engineer

Mithilfe der *-Wildcard können verschiedene Schlüssel anhand eines Musters ausgelesen werden, z.B. die Namen aller Angestellter:

KEYS employee:*:name

Möchte man alle Schlüssel zu einem bestimmten Angestellten in Erfahrung bringen, kann man die *-Wildcard an der entsprechenden Stelle verwenden:

KEYS employee:1234:*

Befehle für Hashes

Ein Hash speichert Schlüssel/Wert-Paare ab und ist mit dem Map- bzw. Hash-Datentyp verschiedener Programmiersprachen vergleichbar, erlaubt aber keine Verschachtelung. (Alle Schlüssel und Werte sind Strings.)

Die wichtigsten Befehle für Hashes sind:

HSET: Definiert einen Hash mit Schlüssel/Wert-Paaren
HGET: Gibt ein Feld zu einem Hash aus
HGETALL: Gibt alle Feldnamen und -Werte zu einem Hash aus
HKEYS: Gibt die Feldnamen zu einem Hash aus
HVALS: Gibt die Werte zu einem Hash aus
HDEL: Löscht ein Feld von einem Hash (aber nicht den Hash selber)
HSETNX: Setzt ein Feld von einem Hash, sofern es noch nicht definiert ist

Die Struktur von einem zusammengesetzten Objekt muss nicht über den Namen codiert werden, sondern kann über einen Hash gelöst werden:

HSET employee.dilbert id 715 name Dilbert position Engineer salary 125000 hired 1992

HGET employee.dilbert position
"Engineer"

KEYS employee.*
1) "employee.dilbert"

Hashes kennen kein Schema, wie es bei Tabellen relationaler Datenbanken zum Einsatz kommt. Man kann sich also nicht darauf verlassen, dass ein Hash bestimmte Felder enthält!

Export im CSV- und JSON-Format

Redis erlaubt den Export von Daten ins CSV-Format:

$ redis-cli --csv HGETALL employee.dilbert

Ausgabe:

"id","715","name","Dilbert","position","Engineer","salary","125000","hired","1992"

Ab Redis-Version 7, die auf den VMs vorinstalliert ist, lassen sich auch JSON-Datenstrukturen in Redis verwalten und daraus exportieren:

$ redis-cli --json HGETALL employee.dilbert

Ausgabe:

{
  "id": "715",
  "name": "Dilbert",
  "position": "Engineer",
  "salary": "125000",
  "hired": "1992"
}

Über diese Austauschformate liessen sich die teilweise strukturierten Daten aus Redis als strukturierte Daten in DuckDB einlesen und dort analysieren.

Übungen

Dokumentieren Sie Ihre eingegebenen Befehle und deren Ausgaben! Verwenden Sie das Präfix > für Befehlszeilen, um diese von den Ausgaben unterscheidbar zu machen.

Übung 0: Mit Redis verbinden

Bei dieser Übung brauchen Sie nichts zu dokumentieren.

Verbinden Sie sich mittels redis-cli mit der Datenbank:

$ redis-cli
127.0.0.1:6379>

Es sollte nun die Eingabeaufforderung 127.0.0.1:6379> erscheinen.

Setzen Sie den Befehl PING ab, der PONG zurückgeben sollte:

127.0.0.1:6379> PING
PONG

Hilfe zu einem Befehl bekommen Sie mit dem HELP-Befehl:

> HELP PING

  PING [message]
  summary: Ping the server
  …

Mit [Ctrl]-[D] oder [Ctrl]-[C] können Sie die Sitzung beenden.

Achten Sie bei der Eingabe eines Befehls darauf, ob die Redis-Eingabeaufforderung (> ) oder die System-Shell ($ ) aktiv ist!

Übung 1: Steckbrief abspeichern

Verwenden Sie den SET-Befehl, um Ihren persönlichen Steckbrief abzuspeichern. Speichern Sie die folgenden Angaben ab:

Vorname
Nachname
Alter (in ganzen Jahren)
Wohnort
Lieblingsessen

Überlegen Sie sich vorher eine geeignete Namensstruktur für die Schlüssel.

Verwenden Sie anschliessend den MSET-Befehl, um den persönlichen Steckbrief einer weiteren Person, die sie kennen, in einem einzigen Befehl abzuspeichern.

Erhöhen Sie anschliessend mit dem INCR-Befehl Ihr Alter beider Personen um ein Jahr.

Verwenden Sie den KEYS-Befehl, um alle Schlüssel anzuzeigen. Geben Sie anschliessend alle Werte mithilfe des GET-Befehls aus.

Übung 2: TODO-Liste

Erstellen Sie eine TODO-Liste mithilfe des LPUSH-Befehls. Definieren Sie mindestens drei Aufgaben, die Sie erledigen müssen. (Falls die Aufgaben Leerzeichen enthalten, umschliessen Sie den Text mit Anführungs- und Schlusszeichen ("…").

Geben Sie nun die komplette Liste mithilfe des LRANGE-Befehls aus. (Tipp: Der Index ist 0-basierend, und -1 bezeichnet das letzte Listenelement.)

Angenommen, Sie hätten nun eine dieser TODO-Aufgaben erledigt: Entfernen Sie das Element mithilfe des LREM-Befehls aus der Liste. Erstellen Sie nun eine zweite Liste mit erledigten Aufgaben, und fügen Sie die erledigte Aufgabe dieser neuen Liste hinzu.

Verschieben Sie eine weitere erledigte Aufgabe mit dem RPOPLPUSH-Befehl von der einen in die andere Liste. Geben Sie anschliessend beide Listen noch einmal aus.

Übung 3: Mengenoperationen

Erstellen Sie ein Set (d.h. eine Menge) mithilfe des SADD-Befehls mit dem Namen mammals (Säugetiere) und den folgenden Einträgen:

Mensch
Fledermaus
Pferd
Gorilla
Meerschweinchen
Kuh

Erstellen Sie nun ein weiteres Set mit dem Namen fourlegged (Vierbeiner) und den folgenden Einträgen:

Pferd
Krokodil
Meerschweinchen
Kuh
Eidechse
Leguan

Verwenden Sie nun die Befehle SINTER, SUNION und SDIFF, um die folgenden Mengen zu erstellen:

Säugetiere, die nicht vier Beine haben
Vierbeiner, die keine Säugetiere sind
Vierbeinige Säugetiere
Tiere, die vier Beine haben und/oder Säugetiere sind

Übung 4: Endpunkte als Hashes abspeichern

Betrachten Sie die Datei config.csv, die bereits auf der VM vorhanden sein sollte.

m346,https://m346.frickelbude.ch/,GET,200,5m0s,3
duckdb,https://duckdb.org/,GET,200,2m30s,3
redis,https://libvirt.org/,GET,200,1m0s,5

Diese enthält folgende Spalten:

Name (z.B. m346)
URL (z.B. https://m346.frickelbude.ch/)
HTTP-Methode (z.B. GET)
HTTP-Status (z.B. 200)
Frequenz (z.B. 2m30s)
Versuche (z.B. 3)

Hierbei handelt es sich um die Konfiguration zu einem Monitoring-System, womit eine URL periodisch mithilfe von HTTP auf ihre Erreichbarkeit überprüft wird.

Erstellen Sie pro Zeile der Datei config.csv einen Hash, der alle Angaben aus dieser Datei enthält. Verwenden Sie hierzu den HSET-Befehl. Verwenden Sie Schlüssel der Form endpoint:[identifier], also z.B. endpoint:m346.

Stoppen Sie nun die Redis-Sitzung mit [Ctrl]-[D]. Exportieren Sie nun alle Ihre Endpoints als JSON-Dateien (endpoint-[identifier].json), indem Sie den Redis-Client mit dem Parameter --json und dem Aufruf des HGETALL kombinieren:

$ redis-cli --json HGETALL endpoint:… > endpoint-[identifier].json

Zusatzübung A: Weitere Befehle kennenlernen

Recherchieren Sie selbständig zu den folgenden Redis-Befehlen und überlegen Sie sich, wozu diese sinnvoll sein könnten. (Die Befehle sind in Gruppen aufgelistet, weil sie zusammenarbeiten.) Machen Sie konkrete Anwendungsbeispiele und dokumentieren Sie diese.

SELECT, MOVE, FLUSHDB
EXPIRE, EXPIREAT, SETEX, TTL, PERSIST
MULTI, EXEC, DISCARD
BRPOP, BLPOP, LPUSH, RPUSH

Zusatzübung B: Passwort vergeben

Finden Sie heraus, wie man in der Konfigurationsdatei /etc/redis/redis.conf ein Passwort definiert. Bearbeiten Sie die Datei dazu mit einem Texteditor wie z.B. nano:

sudo nano /etc/redis/redis.conf

Tipp: Suchen Sie nach der Einstellung requirepass!

Setzen Sie ein Passwort, und starten Sie Redis neu:

sudo systemctl restart redis.service

Anschliessend funktioniert Redis nicht mehr ohne Authentifizierung:

$ redis-cli
127.0.0.1:6379> PING
(error) NOAUTH Authentication required.

Finden Sie drei Wege um sich zu authentifizieren:

mit einem interaktiven Redis-Befehl
mit einem Kommandozeilenparameter
mit einer Umgebungsvariable

Testen Sie die Authentifizierung jeweils mit dem PING-Befehl.

Tipp: Verwenden Sie redis-cli --help für Hilfestellungen.

Dokumentieren Sie alle Schritte.

Zusatzübung C: Redis in der Cloud

Folgen Sie der Videoanleitung, um eine kostenlose Redis-Datenbank in der Cloud zu bekommen. Verbinden Sie sich per redis-cli mit dieser Datenbank. (Sie brauchen hier nichts zu dokumentieren.)

Auf diese Cloud-Redis-Instanz lässt sich mit der Software Redis Insight zugreifen, die auch unter Windows verfügbar ist.