mahe 0 Posted March 21, 2011 Share Posted March 21, 2011 uff, das weiß ich jetzt nicht und nachschaun geht nichtmehr -.- Quote Link to post Share on other sites
Powie 1 Posted March 21, 2011 Author Share Posted March 21, 2011 hrhrhrhrhrrrrr.... Ich hab am Prüf Algo noch bissel gefeilt und die Interval Einstellung scharf geschaltet. Quote Link to post Share on other sites
Powie 1 Posted March 22, 2011 Author Share Posted March 22, 2011 Der Ablauf ist nun noch bissel umgebaut den der Checker im Prüfdurchlauf macht, vor allem um performanter zu sein und sicherer auf Fehlmessungen reagieren zu können. Somit ist dieser Teil erstmal soweit wie ichs mir vorgestellt hatte. Quote Link to post Share on other sites
mahe 0 Posted March 23, 2011 Share Posted March 23, 2011 schön zu hören, bis jetzt hatte ich einmal falschen Alarm, aber da wirst wohl grad umgebaut haben Quote Link to post Share on other sites
Powie 1 Posted March 24, 2011 Author Share Posted March 24, 2011 Ja ich hatte auch 1-2 mal einen falschen Alarm. Wobei an der Stelle nicht nachvollziehbar war wieso das genau so ist. Bei diesen Fällen war die folgende Prüfung immer wieder OK. das war mir schon früher oft aufgefallen. Früher: Fand der Checker einen Status mit NOTOK, hat der Checker 5 Sekunden Pause gemacht und dann die Prüfung noch einmal wiederholt. Der Statuswechsel erfolgte nur wenn beide Prüfungen das selbe Ergebnis lieferten. Aus Erfahrung muss ich sagen, das diese "Mini" Aussetzer in real existieren. Ich habe anfangs an ein Problem mit den Prüfungen gedacht, wurde aber eines besseren belehrt als ich mal eine Prüfung aufgesetzt hab die alle 10 Sekunden prüft und loggt. Dort war ersichtlich das das nicht einzelne Ticks waren die zwischen drin fehlten, sondern wirklich immer eine Reihe Prüfungen mit NOTOK zwischen drin waren. Beleg dafür ist auch das ich andere Dienste in der Prüfung habe welche diese Problematik nicht so in der Art haben. Gestern Abend hatte ich so eine Störung "Live", die SSH auf der Maschine blieb auch über eine Minute stecken, und passend dazu kam die Notification vom pcheck. Da am Server selber nichts los war muss es ein Problem mit Routing, Netzlast, was auch immer gewesen sein, also eine echte kurze Outtime. Daher macht der neue Checker Algorithmus das jetzt anders. Findet er ein NOTOK, so stellt er dieses erst nur einmal fest. Die Prüfung wird hinten angestellt. Nach einer Minute wird die Prüfung wiederholt. Erst wenn auch diese wieder NOTOK ist wird die Notification ausgelöst. Hat der Checker ein 10 Minuten Interval so werden die nächsten Prüfungen trotzdem mit verkürztem Interval ausgeführt. Das Interval steigt erst nach mehreren gleichbleibenden Status wieder auf das eingestellte 10 Min Interval an. Damit fallen diese Mini Blackouts nicht mehr ins Gewicht. Quote Link to post Share on other sites
mahe 0 Posted March 24, 2011 Share Posted March 24, 2011 Super Lösung! Ich hätte da noch eine Idee Es wäre doch sicher praktisch wenn man die Checks kaskadieren könnte. zB: -) Gateway online? (ping) --) Server online? (ping) ---) Dienst online? (zB MySQL) ---) Dienst online? (zB Webserver) ---) Dienst online? (zB FTP) ---) ... --) Server online? (ping) ---) Dienst online? (zB MySQL) ---) Dienst online? (zB Webserver) ---) Dienst online? (zB FTP) ---) ... Ist der Gateway nicht online brauchen die anderen Checks garnicht zu laufen. Ist der Server offline braucht man die Dienste auch nicht checken. Ich denke dadurch hat man einen Haufen neuer Möglichkeiten Quote Link to post Share on other sites
Powie 1 Posted March 24, 2011 Author Share Posted March 24, 2011 Very Interesting Quote Link to post Share on other sites
mahe 0 Posted March 24, 2011 Share Posted March 24, 2011 ich überleg mal weiter, ev. fällt mir ja noch was ein Quote Link to post Share on other sites
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.