Hochskalierbares Monitoring, Regression und Compliance Tests

Aufgabe des Arbeitspaketes ist, eine Komponente zur Sammlung von DAten und Metriken über den Zustand des gesamten Rechnersystems bereitzustellen. Die Monitoring-Komponente muss hochskalierbar sein, möglichst keine zusätzliche Lasti m System erzeugen und sowohl robust, als auch hochverfügbar sein, da andere Komponenten automatisierte Reaktionen auf Grund der Monitoring-Daten ausführen. Im Rahmen des Arbeitspaketes werden in der Konzeptionphase bis PM6 verschiedne WErkzeuge getestet, um deren Verwendbarkeit für TIMaCS zu ermitteln. Diese Tests umfassen existierende Monitoring-Lösungen Dritter (z.B. Ganglia  und Nagios) sowie auch Eigenentwicklungen der Partner, wie die von ZIH und HLRs entwickelten Werkzeuge und Verfahren, welche Hardware auf bestimmte Mindestanforderungen prüfen.

Die Komponenten umfassen sowohl hocheffiziente (hierarchisch aufbauende und aggregierende Metriken) und ausfallsichere (z.B: Robin-Round Datenbanken) Monitoring Lösungen, die am laufenden System operieren, als auch Werkzuege, die automatisierte Wartungsarbeiten durchführen können und auch präventiv potentielle Probleme mit Systemen erkennbar machen. Auch Konzepte zur Verwaltung von historischen DAten, die die Grundlage von regelmäßigen Regressiontests - insbesondere nach Systemänderungen (Hard- oder Software Updates) - bildern, werden dabei integriert.