Artificial Intelligence for IT Operations (AIOps) Die „Cognition Engine“ als Denkhilfe für Admins

Autor Dr. Stefan Riedl

Die AIOps-Plattform der Cisco-Tochter AppDynamics wird in den Datacenter-Optimierungs-Werkzeugkasten „Application Centric Infrastructure“ (ACI) der Mutter eingebunden. Dieser Satz ist nicht unbedingt selbsterklärend. Fangen wir beim Trendbegriff „AIOps“ an.

Anbieter zum Thema

Eine „Cognition Engine“ soll Admins den Rücken frei halten.
Eine „Cognition Engine“ soll Admins den Rücken frei halten.
(Bild: © lynea - stock.adobe.com)

IT-Betriebsanalysen und Application Performance Management (APM) bilden das Kerngeschäft von AppDynamics. Aber der Spruch „das Gute ist des Besseren Feind“ gilt auch für Begriffe und weil Künstlicher Intelligenz eine wachsende ­Bedeutung zukommt, ist viel die Rede von „AIOps“ (Artificial Intelligence for IT Operations). Etabliert haben den Begriff mehr oder weniger die Marktforscher von Gartner. Gregor Keller, Sales Engineering Manager bei AppDynamics, beschreibt: „Im Grunde genommen geht es darum, in den komplexen IT-Systemen von heute, also häufig in heterogenen Umgebungen mit Multicloud-Ansatz in Kombination mit einem lokalen Rechenzentrum die volle Visibilität herzustellen.“ Im AIOps-Umfeld dreht sich viel um automatisierte Problemlösungen im IT-Umfeld durch Monitoring und Analyse. Gearbeitet wird dabei mit Datenmetriken, Events und Logfile-Einträgen.

Datenmetriken, Events und Logfile-Analysen

Gregor Keller, Sales Engineering Manager, AppDynamics
Gregor Keller, Sales Engineering Manager, AppDynamics
(Bild: AppDynamics)

Keller erläutert: „In den Bereich ‚Datenmetrik‘ fällt beispielsweise die Frage, wie lange es braucht, einen Code auszuführen. Konkretes Beispiel: Ein CRM-System wird in der Cloud betrieben und anhand von Kennzahlen wird geprüft, wie performant es läuft. Oder es geht um Infos über Code, der im Rahmen des Dienstes AWS Lambda via Cloud ausgeführt wird.“

Für das Segment „Events“ im AIOps-Kontext nennt Keller folgendes Beispiel: „Nehmen wir an, eine Warenwirtschaft wird gestartet, die dann erkennbar langsam läuft, das System also ein Problem hat. Eine AIOps-Plattform analysiert in diesem Fall verschiedene Infos, die damit zusammenhängen können und triggert automatisiert Events an, die Abhilfe schaffen können, beispielsweise eine Instanz neu zu starten oder Work­loads auf ein redundantes System umzuleiten.“ Logfile-Eintragungen spielen in der Analyse durch eine AIOps-Plattform ­dahingehend eine Rolle, wenn Fehler gesucht werden, also beispielsweise nicht ­offensichtliche Zusammenhänge wie nicht kompatible Software oder Schnittstellenprobleme vorliegen.

Die Metapher vom zentralen Nervensystem

Mit einer Metapher lasse sich die AIOps-Strategie am besten beschreiben: „Bei AppDynamics erklären wir die Problematik gerne mit dem ‚Central Nervous System‘, also dem zentralen Nervensystem für die IT.“ Der menschliche Organismus liefert dem Gehirn – bei AIOps die „Cognition Engine“ – verschiedene Signale und Zustandsberichte, wie Schmerz, Hunger, Durst, Kälte oder Wärme. „Liefert mir meine Hand das Signal ‚Schmerz‘, stößt die Cognition Engine das Ereignis an, hinzuschauen, was da los ist – und erkennt beispielsweise, dass sich die Hand auf einer heißen Herdplatte befindet“, beschreibt der AppDynamics-Manager. Zur Abhilfe wird im Beispiel das Event angetriggert, kaltes Wasser über die verletzte Hand fließen zu lassen.

Explosion der IT-Komplexität

Auch in der IT geht es darum, unterschiedliche Perspektiven einzunehmen beziehungsweise weitere Informationen einzuholen.

AI, beziehungsweise maschinelles Lernen kommt im AIOps-Umfeld vor allem bei der Problemlösung ins Spiel. „Denn wir sammeln anonymisiert Daten und Fehlerberichte, um für die Gesamtheit der Nutzer bessere Lösungen offerieren zu können sowie im Laufe der Zeit immer besser zu werden“, sagt Keller. Die dahinterstehende „AppDynamics AIOps Plattform“ ist bereits seit 2010 auf dem Markt. Seither gab es laut Keller regelrecht eine Explosion der Komplexität der IT-Systeme, die zunehmend global aufgestellt und multicloud-basiert wurden sowie mit immer mehr angeflanschten Systemen operieren. AppDynamics reagierte auf diese Herausforderungen mit neuen Funktionen rund um Machine Learning und darauf aufbauender automatisierter Problemlösung.

Oder einfach automatisch „einen Case aufmachen“...

Die AIOps-Plattform fungiert dabei als systemübergreifende Klammer. „Inzwischen arbeiten wir mit über 200 Technologiepartnern zusammen. Das spielt beispielsweise dann eine Rolle, wenn bei einem auftretenden Fehler nicht technische Lösungen – wie die Umleitung auf ein redundantes System automatisiert und Event-gesteuert angetriggert werden – sondern erst mal in einem Support-Ticket-System erfasst werden. Beispielsweise wenn aufgrund von vorher definierten Fehler-Events Cases über Support-Software wie die von ServiceNow aufgemacht werden.

(ID:45762139)