Jump to content
powie.de Tech Forum
Sign in to follow this  
Powie

pCheck - Tester gesucht

Recommended Posts

hrhrhrhrhrrrrr....


Ich hab am Prüf Algo noch bissel gefeilt und die Interval Einstellung scharf geschaltet.


:)

Share this post


Link to post
Share on other sites

Der Ablauf ist nun noch bissel umgebaut den der Checker im Prüfdurchlauf macht, vor allem um performanter zu sein und sicherer auf Fehlmessungen reagieren zu können. Somit ist dieser Teil erstmal soweit wie ichs mir vorgestellt hatte.

Share this post


Link to post
Share on other sites

schön zu hören, bis jetzt hatte ich einmal falschen Alarm, aber da wirst wohl grad umgebaut haben :D

Share this post


Link to post
Share on other sites

Ja ich hatte auch 1-2 mal einen falschen Alarm. Wobei an der Stelle nicht nachvollziehbar war wieso das genau so ist. Bei diesen Fällen war die folgende Prüfung immer wieder OK. das war mir schon früher oft aufgefallen.


Früher: Fand der Checker einen Status mit NOTOK, hat der Checker 5 Sekunden Pause gemacht und dann die Prüfung noch einmal wiederholt. Der Statuswechsel erfolgte nur wenn beide Prüfungen das selbe Ergebnis lieferten.


Aus Erfahrung muss ich sagen, das diese "Mini" Aussetzer in real existieren. Ich habe anfangs an ein Problem mit den Prüfungen gedacht, wurde aber eines besseren belehrt als ich mal eine Prüfung aufgesetzt hab die alle 10 Sekunden prüft und loggt. Dort war ersichtlich das das nicht einzelne Ticks waren die zwischen drin fehlten, sondern wirklich immer eine Reihe Prüfungen mit NOTOK zwischen drin waren. Beleg dafür ist auch das ich andere Dienste in der Prüfung habe welche diese Problematik nicht so in der Art haben.

Gestern Abend hatte ich so eine Störung "Live", die SSH auf der Maschine blieb auch über eine Minute stecken, und passend dazu kam die Notification vom pcheck. Da am Server selber nichts los war muss es ein Problem mit Routing, Netzlast, was auch immer gewesen sein, also eine echte kurze Outtime.


Daher macht der neue Checker Algorithmus das jetzt anders. Findet er ein NOTOK, so stellt er dieses erst nur einmal fest. Die Prüfung wird hinten angestellt. Nach einer Minute wird die Prüfung wiederholt. Erst wenn auch diese wieder NOTOK ist wird die Notification ausgelöst. Hat der Checker ein 10 Minuten Interval so werden die nächsten Prüfungen trotzdem mit verkürztem Interval ausgeführt. Das Interval steigt erst nach mehreren gleichbleibenden Status wieder auf das eingestellte 10 Min Interval an.

Damit fallen diese Mini Blackouts nicht mehr ins Gewicht.

Share this post


Link to post
Share on other sites

Super Lösung!


Ich hätte da noch eine Idee :D

Es wäre doch sicher praktisch wenn man die Checks kaskadieren könnte.

zB:

-) Gateway online? (ping)

--) Server online? (ping)

---) Dienst online? (zB MySQL)

---) Dienst online? (zB Webserver)

---) Dienst online? (zB FTP)

---) ...

--) Server online? (ping)

---) Dienst online? (zB MySQL)

---) Dienst online? (zB Webserver)

---) Dienst online? (zB FTP)

---) ...


Ist der Gateway nicht online brauchen die anderen Checks garnicht zu laufen.

Ist der Server offline braucht man die Dienste auch nicht checken.


Ich denke dadurch hat man einen Haufen neuer Möglichkeiten :)

Share this post


Link to post
Share on other sites
Guest
You are commenting as a guest. If you have an account, please sign in.
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Sign in to follow this  

×