AIOps – Analyseplattform der Zukunft im IT-Betrieb

Leistungsstarke Algorithmen für die Überwachung von hybriden, dynamischen, verteilten und komponentenbasierten IT-Umgebungen

 AIOps - Geöffnete Programme und eine Vielzahl an Daten

Die zunehmende Komplexität der IT zeigt der herkömmlichen, domänenzentrierten Überwachung und ihrem IT-Betriebsmanagement seine Grenzen auf. Die Flut von Daten, die von verschiedenen IT-Domänen erzeugt wird, kann auf herkömmliche Weise kaum korreliert werden und liefert demzufolge auch nicht die notwendigen Erkenntnisse, die IT-Betriebsteams für ein proaktives Management ihrer Umgebungen benötigen.

Die zunehmende Komplexität der IT zeigt der herkömmlichen, domänenzentrierten Überwachung und ihrem IT-Betriebsmanagement seine Grenzen auf. Die Flut von Daten, die von verschiedenen IT-Domänen erzeugt wird, kann auf herkömmliche Weise kaum korreliert werden und liefert demzufolge auch nicht die notwendigen Erkenntnisse, die IT-Betriebsteams für ein proaktives Management ihrer Umgebungen benötigen.

Komplexität hybrider IT-Umgebungen

Viele Unternehmen arbeiten mit einer hybriden IT-Infrastruktur, die aus einer Vielzahl von Entitäten in den Bereichen Netzwerk, Computer und Storage besteht, die von verschiedenen Technologieanbietern bereitgestellt werden. Die Anbieter, die diese Technologien liefern, haben ihre eigene Kultur, Syntax und Sprache für die Verwaltung und Interaktion mit anderen Einheiten in der IT-Umgebung. Eine der größten Herausforderungen für IT-Organisationen ist die Komplexität, die mit dem Erkennen und Verstehen dieser unterschiedlichen Einheiten in einer hybriden IT-Umgebung verbunden ist. IT-Umgebungen ändern sich schnell, da digitale Service-Implementierungen neuere Technologien wie Virtualisierung, Hybrid-Cloud, Container und Microservices mit sich bringen. Die traditionellen Erkennungs-Tools und -Mechanismen, die von älteren ITOA-Anbietern zur Verfügung gestellt werden, sind nicht flexibel, zuverlässig und vollständig genug, um mit den Änderungen Schritt zu halten, die in einer Umgebung mit mehreren Anbietern, mehreren Domänen und mehreren Technologien stattfinden. Dies ist aber für den heutigen IT-Betrieb unabdingbar. Denn Fehlersuche, Kapazitätsplanung, Wartung und effektives Management sind davon abhängig.

AIOps – der nächste Schritt in der IT Analytic

Eine neue Klasse von Technologien kann das Manko an ungenauen IT-Betriebsdaten und fehlender anwendungszentrierter Sicht auf den gesamten Stack beseitigen, indem sie leistungsstarke Algorithmen für Machine Learning (ML) oder Künstlicher Intelligenz (KI) nutzt, um automatisch relevante Muster, die auf potenziell störenden Betriebsereignisse hinweisen, zu erkennen. Sie ist für die Überwachung und Verwaltung moderner IT-Umgebungen, die hybrid, dynamisch, verteilt und komponentenbasiert sind, unerlässlich geworden. Die Rede ist von Artificial Intelligence for IT Operations (AIOps), der nächsten Generation der IT Operation Analytic (ITOA). Ihr Wert liegt in der Unterstützung von Organisationen bei der Bewältigung von IT-Herausforderungen an einer Reihe von Fronten, beispielsweise wenn es darum geht,

  • Daten von unterschiedlichen IT-Einheiten und siloartigen Systemen zu sammeln,
  • die Datenflut aus verschiedenen Quellen zu korrelieren und zu analysieren,
  • diese Informationen so zu präsentieren, dass sie für Unternehmen schnell und einfach zu verstehen sind und einen Mehrwert bieten,

um die zunehmende Komplexität und Dynamik von IT-Architekturen in den Griff zu bekommen und das exponentielle Datenwachstum zu meistern.

Wie unterscheiden sich AIOps von ITOA?

Als Vorläufer von AIOps konzentriert sich ITOA auf die Sammlung und Vereinheitlichung von Daten für die Analyse historischer Daten über Domänen hinweg und löst Probleme mit Beobachtungsdaten. ITOA-Lösungen und domänenzentrierte Tools reichen aber nicht mehr aus, um dem IT-Betrieb tiefe Einblicke in seine verteilte Multi-Vendor-, Multi-Domänen- und Multi-Technologie-IT-Infrastruktur zu verschaffen, um die anspruchsvollen Geschäftsziele zu erreichen. AIOps ist ein Softwaresystem, das Big Data und KI sowie ML kombiniert, um eine breite Palette von IT-Betriebsprozessen und -aufgaben zu verbessern und teilweise zu ersetzen, einschließlich Verfügbarkeits- und Leistungsüberwachung, Ereigniskorrelation und -analyse, IT-Service-Management und Automatisierung. AIOps nutzt Big Data und maschinelle Lerntechniken, um proaktive und prädiktive Einblicke in Probleme zu liefern und empfiehlt - automatisiert - Abhilfemaßnahmen. AIOps hilft Unternehmen bei der proaktiven Planung und Identifizierung von geschäftsrelevanten Problemen, bevor sie auftreten.

Funktionsblöcke einer AIOps-Architektur

AIOps ermöglicht dem IT-Betrieb, traditionelle IT-Operations-Analytics (ITOA)-Strategien zu überwinden, alte, reaktive Prozesse aufzugeben und proaktiv zu reagieren, indem Probleme vorhergesagt und Ausfälle verhindert werden. Eine AIOps-Plattform hilft Unternehmen, ihren IT-Betrieb zu verbessern, indem sie ihre Anwendungs- und IT-Infrastrukturressourcen verstehen.

Dazu ist aber die Entwicklung einer klaren AIOps-Referenzarchitektur und -Strategie, die die besten Tools nutzt, ein Muss. Die in die Referenzarchitektur integrierten Tools bilden die Schlüsselkomponenten von AIOps für die Bereitstellung von AI-gesteuerten Operationen. Eine AIOps-Lösung umfasst die folgenden Funktionsblöcke:

Open Data Ingestion

Eine AIOps-Plattform sammelt Daten aller Art aus verschiedenen Quellen. Dazu können betriebliche Erkenntnisse wie Fehler, Protokolle, Leistungsmetriken, Protokollwarnungen, Tickets und mehr gehören. Die Fähigkeit, Daten aus den unterschiedlichsten Datenquellen aufzunehmen, ist entscheidend, denn sie ermöglicht eine genaue Echtzeit-Ansicht aller beweglichen Teile in hybriden IT-Umgebungen.

Auto-Discovery

Angesichts der sehr dynamischen Natur moderner IT-Umgebungen benötigen Unternehmen einen Auto-Discovery-Prozess, der automatisch Daten über alle Infrastruktur- und Anwendungsdomänen hinweg sammelt. Auto-Discovery identifiziert auch alle Infrastrukturgeräte, die laufenden Anwendungen und die daraus resultierenden Geschäftstransaktionen. AIOps ist dazu in der Lage, weil es weiß, wie es mit den verschiedenen Infrastruktur- und Anwendungseinheiten kommunizieren kann. Daten werden von allen Arten von Entitäten gesammelt - Switches, Router, Load Balancer, Firewalls, Server, Speichergeräte, Hypervisoren, virtuelle Maschinen, Anwendungsentitäten und mehr - ob physisch, virtuell oder logisch. Anschließend speist die automatische Erkennung von AIOps die entdeckten Entitäten und Beziehungen in die ITSM-Tools ein, um den Wert der ITSM-Funktionen weiter zu erhöhen, was die Geschäftsprozesse optimiert und die Betriebskosten und den Overhead reduziert.

Correlation

Als nächstes korreliert die AIOps-Plattform diese Daten in einer kontextuellen Form. Über die automatische Erkennung hinaus identifiziert AIOps die Beziehungen zwischen allen Entitäten in einer hybriden IT-Umgebung zwischen den Infrastrukturelementen, zwischen einer Anwendung und ihrer Infrastruktur sowie zwischen den Geschäftstransaktionen und den Anwendungen und findet schnell die Ursache komplexer Probleme, die sich auf das Geschäft auswirken.

Weissenberg Intelligence – Ihr kompetenter Partner in allen Fragen der digitalen Transformation Anmeldung

Weissenberg Intelligence – Ihr kompetenter Partner in allen Fragen der digitalen Transformation

Möchten auch Sie die Wettbewerbsfähigkeit Ihres Unternehmens im digitalen Zeitalter stärken? Wir beraten Sie gern zur digitalen Transformation Ihres Unternehmens.

Visualization

Wenn der End-to-End-Korrelationsprozess abgeschlossen ist, müssen die Daten in einem einfach zu verwendenden Format präsentiert werden. Und genau das ist die Aufgabe der Visualisierung. Die Visualisierung ist wichtig, weil sie es dem IT-Betrieb ermöglicht, Probleme schnell zu erkennen und korrigierende Maßnahmen zu ergreifen. AIOps bietet eine neue Generation der Visualisierung, die Daten verwertbar macht.

Dependency Mapping

AIOps nutzt automatisiertes Dependency Mapping, um dynamische, mehrschichtige Beziehungen zwischen hybriden Infrastrukturentitäten aufzubauen und zu verfolgen und so Service- und Anwendungstopologien über Technologiedomänen und über Rechenzentrums- und Cloud-Umgebungen hinweg zu erstellen. Mit Dependency Mapping können IT-Teams die Reaktion auf Vorfälle beschleunigen, die geschäftlichen Auswirkungen von Ausfällen schnell quantifizieren, um sicherzustellen, dass Stakeholder informiert und Probleme richtig priorisiert werden und die Betriebszeit geschäftskritischer Anwendungen verbessern, was zur Kundenzufriedenheit beiträgt.

Machine Learning

Die Ursache eines Problems zu finden, ist entscheidend. Aber noch wichtiger ist es, wiederkehrende Muster zu erkennen und wahrscheinliche zukünftige Ereignisse vorherzusagen. ML kann Daten aus verschiedenen Unternehmensanwendungs- und Infrastrukturbereichen korrelieren und analysieren und dabei das Volumen, die Geschwindigkeit und die Vielfalt der generierten Daten bewältigen. Es kann Beziehungen zwischen Entitäten erkennen, Millionen von Ereignissen verarbeiten und Muster von Ereignissen in einer Zeitreihe aufdecken, um zu zeigen, was passiert ist, um die Ursachenanalyse zu unterstützen. Es kann aktuelle Bedingungen und Erlerntes nutzen, um Probleme auf Geschäftsebene zu identifizieren, Anomalien von erwarteten Verhaltensweisen und Schwellenwerten zu erkennen und Ausfälle und Leistungsprobleme voraussagen. ML kann sogar Vorschläge unterbreiten, was in verschiedenen Szenarien zu tun ist.

Automation

Die Automatisierung ist eine Schlüsselkomponente von AIOps, da sie am Ende den Return on Investment (ROI) für den Kunden liefert. AIOps automatisiert den IT-Betrieb und kann Betriebsteams über potenzielle Geschäftsausfälle informieren, bevor diese eintreten. IT-Teams können dann Systeme so einstellen, dass sie Aktionen zur Behebung des Problems auslösen. Das Ausführen von Abhilfeskripten oder die Integration mit anderen Orchestrierungs- und Automatisierungstools zur Durchführung von Aktionen minimiert manuelle Arbeitsschritte.

Herausforderung: Geschäftsanwendungen

Da hybride IT-Umgebungen extrem dynamisch und heterogen sind mit dynamischen Workloads, die über private Rechenzentren und öffentliche Clouds verteilt sind, ist AIOps durch die Einbindung von ML und KI die einzige Lösung, die die täglichen IT-Betriebsaktivitäten in den Griff bekommen kann. So stellt beispielsweise die Verwaltung von Geschäftsanwendungen in virtualisierten oder containerisierten hybriden IT-Umgebungen für die IT-Betriebsteams eine Herausforderung dar:

  • Auf welchen virtuellen Einheiten laufen diese Anwendungen?
  • Können die Anwendungsflüsse über eine hybride Cloud-Topologie hinweg verfolgt werden?
  • Kann schnell festgestellt werden, ob das Problem bei der Anwendung oder in der unterstützenden Infrastruktur liegt?

Dies sind Schlüsselfragen, die Mitarbeiter des Anwendungs- und Geschäftsbetriebs beantworten müssen, um die Betriebszeit und Leistung von geschäftskritischen Anwendungen und Prozessen effektiv zu gewährleisten. Dazu müssen sich diese Teams auf intelligente Funktionen zur Anwendungserkennung verlassen können, die mit der sehr dynamischen Natur der hybriden IT Schritt halten können.

Analyse von Geschäftstransaktionen

Um die Key Performance Indicators (KPIs) von Geschäftstransaktionen zu verwalten und die Service-Level-Agreements (SLAs) von Geschäftsprozessen zu garantieren, benötigen Unternehmen außerdem leistungsstarke Full-Stack-Analysen. Diese Analysen müssen Geschäftstransaktionen (z. B. Bestellungen, Rechnungen usw.) automatisch ihren Anwendungsdiensten (Webserver, Anwendungsserver, Datenbanken) und der unterstützenden Infrastruktur (Rechenleistung, Netzwerk und Speicher) zuordnen.

Dynamisches Thresholding

Ein dynamischer Schwellenwert ist die Grundlage des Algorithmus zur Erkennung von Anomalien, weil er hilft, Muster zu verstehen, die von Geschäftstrends gesteuert werden. Bestimmte Geschäftsereignisse zu bestimmten Tageszeiten, Wochentagen oder Wochen des Jahres, wie z. B. Ferienzeiten, führen zu bestimmten Mustern in der Infrastrukturauslastung. Daher kann das Festlegen statischer Schwellenwerte zur Generierung von Alarmen für die Infrastrukturnutzung zu Fehlalarmen führen. Dynamisches Thresholding setzt dynamische Schwellenwerte, die zeitabhängig sind, voraus. So kann es beispielsweise normal sein, dass die Prozessor-(CPU) Auslastung einer virtuellen Maschine an einem geschäftigen Montagmorgen 90 Prozent erreicht, am Sonntagabend jedoch nie mehr als 30 Prozent. Der Algorithmus zur Erkennung von Anomalien berücksichtigt also diese Beobachtungen und Empfehlungen für Schwellenwerte, während er bestimmte Ereignisse anhand von oberen und unteren Abweichungen als Anomalien kennzeichnet.

Dies sind nur einige wenige Beispiele für Anwendungsfälle, in denen AIOps, durch die Nutzung von Algorithmen für ML, KI-Funktionen zur Automatisierung von Betriebsaktivitäten bereitstellen kann. Ohne KI und ML werden sich Geschäftsinnovationen und die digitale Transformation verlangsamen und sich negativ auf das Geschäft auswirken.

Fazit

Obwohl AIOps sich steigender Akzeptanz in den Unternehmen erfreut, gibt es immer noch Unternehmen, die durch den Hype um AIOps verunsichert sind und sich fragen, ob es wirklich klug ist, den Weg von AIOps zu gehen. AIOps ist jedoch vielleicht der einzige Weg, um das volle Potenzial auszuschöpfen. Denn die Auswertungen von Daten aus verteilten, hybriden IT-Umgebungen müssen in Echtzeit erfolgen. Nur wenn Daten und Ereignisse über den gesamten hybriden Stack hinweg vollständig korreliert und abgebildet werden, können Anwendungs- und Business-Operations-Teams die Leistung geschäftskritischer Prozesse effektiv verwalten und garantieren. Andernfalls sind sie gezwungen, umfangreiche und komplexe Fehlersuchübungen durchzuführen, um Hunderttausende, wenn nicht gar Millionen von Datenpunkten zu triangulieren. Der dafür erforderliche Zeitaufwand kann sich negativ auf die Betriebszeit und die Leistung von Schlüsselprozessen aus.

AI Camp Wolfsburg - Wir halten Sie auf dem Laufenden Ai Camp Wolfsburg

AI Camp Wolfsburg - Wir halten Sie auf dem Laufenden

Das AI Camp Wolfsburg unter der Federführung der Weissenberg Group & der IHK Lüneburg-Wolfsburg bietet eine Mischung aus Impulsvorträgen, Panel & Diskussionen zum Thema Künstliche Intelligenz (KI) und findet jährlich in Wolfsburg statt. Die Teilnahme ist kostenlos.

Beitrag weiterempfehlen