Neuigkeiten:

still alive...

Hauptmenü

pCheck - Tester gesucht

Begonnen von Powie, 09. März 2011, 20:35:20

Vorheriges Thema - Nächstes Thema

Powie

Ja ich hatte auch 1-2 mal einen falschen Alarm. Wobei an der Stelle nicht nachvollziehbar war wieso das genau so ist. Bei diesen Fällen war die folgende Prüfung immer wieder OK. das war mir schon früher oft aufgefallen.
Früher: Fand der Checker einen Status mit NOTOK, hat der Checker 5 Sekunden Pause gemacht und dann die Prüfung noch einmal wiederholt. Der Statuswechsel erfolgte nur wenn beide Prüfungen das selbe Ergebnis lieferten.
Aus Erfahrung muss ich sagen, das diese \"Mini\" Aussetzer in real existieren. Ich habe anfangs an ein Problem mit den Prüfungen gedacht, wurde aber eines besseren belehrt als ich mal eine Prüfung aufgesetzt hab die alle 10 Sekunden prüft und loggt. Dort war ersichtlich das das nicht einzelne Ticks waren die zwischen drin fehlten, sondern wirklich immer eine Reihe Prüfungen mit NOTOK zwischen drin waren. Beleg dafür ist auch das ich andere Dienste in der Prüfung habe welche diese Problematik nicht so in der Art haben.
Gestern Abend hatte ich so eine Störung \"Live\", die SSH auf der Maschine blieb auch über eine Minute stecken, und passend dazu kam die Notification vom pcheck. Da am Server selber nichts los war muss es ein Problem mit Routing, Netzlast, was auch immer gewesen sein, also eine echte kurze Outtime.
Daher macht der neue Checker Algorithmus das jetzt anders. Findet er ein NOTOK, so stellt er dieses erst nur einmal fest. Die Prüfung wird hinten angestellt. Nach einer Minute wird die Prüfung wiederholt. Erst wenn auch diese wieder NOTOK ist wird die Notification ausgelöst. Hat der Checker ein 10 Minuten Interval so werden die nächsten Prüfungen trotzdem mit verkürztem Interval ausgeführt. Das Interval steigt erst nach mehreren gleichbleibenden Status wieder auf das eingestellte 10 Min Interval an.
Damit fallen diese Mini Blackouts nicht mehr ins Gewicht.

mahe

Super Lösung!
Ich hätte da noch eine Idee /uploads/emoticons/icon_e_biggrin.gif.40dcc5d69f84e2cf29e77d8e1e9a84e2.gif\" alt=\":D\" />
Es wäre doch sicher praktisch wenn man die Checks kaskadieren könnte.
zB:
-) Gateway online? (ping)
--) Server online? (ping)
---) Dienst online? (zB MySQL)
---) Dienst online? (zB Webserver)
---) Dienst online? (zB FTP)
---) ...
--) Server online? (ping)
---) Dienst online? (zB MySQL)
---) Dienst online? (zB Webserver)
---) Dienst online? (zB FTP)
---) ...
Ist der Gateway nicht online brauchen die anderen Checks garnicht zu laufen.
Ist der Server offline braucht man die Dienste auch nicht checken.
Ich denke dadurch hat man einen Haufen neuer Möglichkeiten /uploads/emoticons/icon_e_smile.gif.4a0acefcb917340d2c82e5239c009e6e.gif\" alt=\":)\" />

http://blog.mahe.at\" rel=\"external nofollow\">http://blog.mahe.at/wp-content/uploads/2007/06/88x31_1.jpg\" alt=\"88x31_1.jpg\">


Ja, diese Signatur dient zur Werbung!


Und dass ich meine Posts wiederfinde ...


Powie

Very Interesting  /uploads/emoticons/icon_e_biggrin.gif.40dcc5d69f84e2cf29e77d8e1e9a84e2.gif\" alt=\":D\" />

mahe

ich überleg mal weiter, ev. fällt mir ja noch was ein /uploads/emoticons/icon_e_biggrin.gif.40dcc5d69f84e2cf29e77d8e1e9a84e2.gif\" alt=\":D\" />

http://blog.mahe.at\" rel=\"external nofollow\">http://blog.mahe.at/wp-content/uploads/2007/06/88x31_1.jpg\" alt=\"88x31_1.jpg\">


Ja, diese Signatur dient zur Werbung!


Und dass ich meine Posts wiederfinde ...


all your base are belong to us