Danke an Maximilian Kamenicky von JIT
processpitch Episode 59: IT-Notfallmanagement – Vom Fehlerfall zum automatisierten Ticket
In dieser Episode tauchen Mirko und Maximilian tief in die Welt des IT-Notfallmanagements ein. Sie zerlegen den Prozess, der greift, wenn in einer Software etwas schief läuft – vom ersten Fehler bis zur finalen Lösung.
Der Prozess: Vom Incident zum Resolution
Alles beginnt mit einem Vorfall, einem „Incident“. Ein Kunde meldet per E-Mail, dass etwas nicht funktioniert, zum Beispiel eine Funktion in Camunda. Der erste entscheidende Schritt ist die Verifikation: Ist das überhaupt ein echtes Problem unseres Systems oder liegt die Ursache beim Kunden selbst, etwa eine fehlerhafte Konfiguration? Eine klare Entscheidungslogik im Prozessmodell ist hier unerlässlich.
Ist der Incident bestätigt, folgt die Klassifizierung und Priorisierung. Handelt es sich um ein leicht behebbares Problem („recoverable“), das vielleicht durch einen einfachen Neustart behoben werden kann? Oder ist es komplexer? Hier kommt der First-Level-Support ins Spiel, der nach bekannten Mustern und Lösungen sucht.
Die Eskalation: Vom Ticket zur Lösung
Kann der First-Level-Support das Problem nicht lösen, wird ein Ticket erstellt und es geht an die Experten. Maximilian stellt einen Prozess vor, der diesen Weg automatisiert. Ein „Routing Agent“ – eine Art intelligenter Bot – analysiert das Ticket anhand einer Checkliste. Er entscheidet: Kann der „IT Support Agent“ das Problem mit seinen vorhandenen Skills lösen, oder muss es als Feature Request an die Entwicklung eskaliert werden?
Der IT Support Agent selbst arbeitet dann im sogenannten „Ad-hoc-Subprozess“. Dies ist eine mächtige Werkzeugkiste (Skillset) mit verschiedenen Fähigkeiten: Dokumente identifizieren, Legacy-Systeme abfragen, Entwickler via Slack anpingen oder den Kunden um weitere Screenshots bitten. Der Agent durchläuft diese Möglichkeiten so lange, bis eine Lösung gefunden ist, die der Kunde bestätigt.
Die Kehrseite der Automatisierung: Kontext ist King
Die Diskussion wird kritisch: Je mächtiger und vielseitiger solch ein AI-Agent ist, desto größer ist auch das Risiko, dass er falsche Entscheidungen trifft. Der Grund? Fehlender oder mehrdeutiger Kontext. Ein Agent ist nur so gut wie die Rahmenbedingungen und klaren Anweisungen, die er erhält. Ohne sie halluziniert er – ähnlich wie generative KI – Lösungen, die nicht passen. Maximilian warnt vor dem „Hammer-und-Nagel-Prinzip“: Nur weil man ein neues, mächtiges Tool hat, ist nicht jedes Problem auch ein Nagel. Manchmal ist der traditionelle, deterministische Prozessablauf die bessere Wahl.
Fazit & Bewertung
Das Prozessmodell erhält in der Bewertung solide 34 Punkte. Die Lesbarkeit ist gut, trotz kleiner Fehler wie fehlender Gateway-Beschriftungen. Die Korrektheit leidet etwas unter semantischen Unschärfen. Das Automatisierungspotenzial ist bereits hoch, aber durch die Aufteilung in verschiedene Incident-Level (Minor, Major, Critical) noch erweiterbar. Der ROI ist aufgrund eingesparter Supportstunden und höherer Kundenzufriedenheit klar gegeben. Die Wiederverwendbarkeit des Prozesses across different projects is mittelmäßig.
Die Episode macht klar: Automatisierung im Support ist mächtig, aber ihr Erfolg lebt von präzisen Definitionen und dem Wissen, wann man den Automatismen einen menschlichen Checkpoint vorschalten muss.
ITNotfallmanagement #IncidentManagement #ProcessAutomation #KI #Camunda #AdHocProcess #BPMN #ITSupport

