Observability
Die Fähigkeit, den internen Zustand eines Systems anhand seiner externen Ausgaben — Logs, Metriken, Traces — zu verstehen.
Observability beschreibt, wie gut der interne Zustand eines Systems von außen beobachtet und verstanden werden kann. Die drei Säulen sind: Logs (textuelle Ereignisaufzeichnungen), Metriken (numerische Messwerte) und Distributed Traces (Nachverfolgung von Anfragen durch verteilte Systeme).
Was ist der Unterschied zu klassischem Monitoring?
Klassisches Monitoring prüft, ob bekannte Zustände eintreten (»Ist die CPU über 90 %?«). Observability ermöglicht es, unbekannte Probleme zu diagnostizieren — auch solche, für die man noch keine Metrik definiert hatte. In komplexen, verteilten Systemen ist das entscheidend: Wenn eine Anfrage 20 Dienste durchläuft und irgendwo langsam wird, muss man wissen, wo.
Für Unternehmen ist Observability gleichbedeutend mit Kontrollierbarkeit: Wer seine Systeme nicht beobachten kann, kann sie nicht zuverlässig betreiben. Das wird besonders relevant, wenn SLAs gegenüber Kunden einzuhalten sind.