it-swarm-eu.dev

Strategie monitorování infrastruktury

V poslední době jsem čelil určitým prostojům na některých z Drupal webů, které jsem nasadil.) Chtěl bych se k problému chovat aktivně, spíše než reagovat na tyto prostoje restartováním služeb nebo serveru Četl jsem o monitorovacích nástrojích, jako jsou nagios, munin, kaktusy atd., které sledují zdraví vašeho serveru/infrastruktury, ale ve skutečnosti jsem žádný nezkoušel ve výrobě. Zabývám se Drupal téměř 99% časů, a rád bych našel návrhy jak pro monitorování na úrovni serveru, tak pro sledování úrovně Drupal (kód aplikace)).

Chtěl bych být v podstatě upozorněn, když je zatížení serveru vysoké, možná že budu upozorňován na vinníka (nebo oběť), abych mohl činit informovaná rozhodnutí. Chtěl bych také vědět, co lidé používají pro monitorování úrovně Drupal úroveň monitorování (například e-mailem), když dojde k chybě/varování PHP = chyba/varování. (Co se stane, když samotný e-mailový server nefunguje?)

12
Dipen

Pokud chcete sledovat několik Drupal webů ze stejného místa s upozorněním atd. ... mohu říci, že nejste jediný. Začíná to být obchodní výklenek, nyní vyplněný:

Oba jsou komerční SaaS), s bezplatnými omezenými možnostmi vyzkoušet službu.

Existuje také Open Source Zabbix možnost sledování s jeho Drupal modul http://drupal.org/project/zabbix , ale pak měli byste nakonfigurovat a sestavit si server.

Všechny tyto možnosti mají své moduly Drupal) pro odesílání informací o serveru a drupalu na monitorovací server.

AKTUALIZACE. Munin má také specifický Drupal Modul , s větví 2.x založenou na Drush.

6
corbacho

Bez ohledu na to, co používáte, jedna věc, kterou bych určitě navrhl, je - pokud nemáte IT zaměstnance na plný úvazek -, neudržujte si vlastní monitorování: spoléhejte na službu, která je zcela nezávislá na vašich serverech. Je to jedna věc mít veřejně orientovaný server dolů, je to další mít to dole a neví o tom, protože váš monitorovací server je také dole. Většina monitorovacích služeb bude zahrnovat všechny požadavky, které jste vyjmenovali.

Ale na riziko, že se z toho stane otázka doporučení ohledně nakupování, služba, kterou používám pro požadavky, které jste uvedli, je Pingdom :

  • Řekne vám, zda jsou stránky nahoře (samozřejmě)
  • Měří, jak dlouho trvá odpověď
  • Měří odezvu a dostupnost na libovolném vlastním portu TCP/UDP
  • Kontrola dostupnosti e-mailu
  • Umožňuje vlastní požadavky HTTP a umožňuje vyzkoušet různé aspekty vaší aplikace
  • Rozsáhlé zprávy
  • Celosvětové monitorování a každých několik měsíců přidávají asi tucet dalších monitorovacích webů
5
user7

Toto jsou některé Drupal-agnostické návrhy:

  • Jsou moje stránky nahoře bude pravidelně pingovat váš server (y) a bude vám e-mailem (nebo SMS, pokud dostanete balíček zdarma), pokud je váš web offline nebo nereaguje.
  • Load Impact je další skvělý bezplatný nástroj, který dokáže váš web otestovat, takže můžete zjistit, kdy přesně selhává.

Pokud jde o samotnou aplikaci Drupal), doporučuji použít profil Xdebug + Webgrind nebo XHProf kód a sledujte tuto otázku: Nejlepší způsob, jak benchmark Drupal výkon zásobník

2
Alex Weber

Líbí se mi pingdom pro malé/střední weby, protože je to užitečné: říká vám, že něco je špatné z pohledu zákazníka, což je proveditelné. Věci jako průměr zatížení opravdu nic neznamenají, pokud nemáte příliš špatně nakonfigurovaný zásobník (což byste neměli) nebo pokud vás kladivo z Digg/Reddit (v tom případě není nic, co byste stejně mohli udělat, měli byste mít připravený).

Z blog Teda Dziuba:

Tyto typy upozornění nazývám Cool Story, Bro zkrátka. Jedná se o kousky informací, které nenaznačují žádný problémový stav a nevyzývají žádnou akci. Cool Stories jsou věci, na které byste neměli mít ani upozornění. Ztrácí čas a způsobí vás paranoidní. Upozornění Cool Story Bro jsou věci jako:

  • Průměrná zátěž na serveru je nad 20.
  • Fronta úloh obsahuje více než X pracovních jednotek. Gratuluji, zatraceně, vaše fronta dělá přesně to, co má dělat.
  • Některá metrika je větší než empiricky určený průměr. Osobně mě to sračky takhle uráží.

Přečtěte si blogový příspěvek, je to veselé.

1
Entendu

Používám check_drupal ke sledování různých drupal webů. Toto je plugin pro nagios, který nevyžaduje žádné změny kódu na drupal) samotný web. Pouze požadavek je, že drush musí být na serveru.

0
lockdoc