Observability
Metriken, Logs, Alerts, der Stack, mit dem wir wissen, dass etwas schief läuft, bevor es Ihre Kunden tun. Setup, Betrieb und Tuning aus produktiver Erfahrung mit Multi-Tenant-Setups.
Time-Series-Datenbank, Alerting-Rules, Federation für Multi-DC-Setups. Retention-Tuning auf SSD-Storage, Recording-Rules für teure Aggregationen.
Custom-Dashboards pro Mandat, Alert-Workflows mit OpsGenie-Integration, Multi-Tenant-Sichten via Folder-Scoping. Provisioning via IaC.
Log-Aggregation in K3s und VM-Stacks, Retention-Policies pro Compliance-Anforderung, Label-Cardinality-Tuning für skalierbare Storage-Kosten.
Klassisches Monitoring für Long-Runs und Legacy-Stacks. Auto-Discovery via SNMP, Template-Inheritance, History-Storage auf PostgreSQL.
Applikations-Monitoring mit Auto-Discovery für hybride VM/K8s-Stacks. Custom-Plugins in Python, Notifications mit Eskalations-Pfad.
Vendor-neutrale Tracing-Pipeline, Instrumentierung in Node/Python/Go-Apps, Collector als Sidecar oder DaemonSet.
Error-Tracking für Web- und API-Stacks, Source-Map-Upload, Release-Tagging und Per-User-Issue-Aggregation.
Lightweight Statuspages für KMU-Mandate mit Alert-Eskalation.
Per-Host High-Resolution-Metrics mit ML-Anomaly-Detection.
Netzwerk-Geräte (Cisco/Fortinet/Aruba) über Zabbix/Checkmk eingebunden.