V úterý ráno 28.března jsme byli svědky prakticky kompletně nedostupných všech věřejných aplikací serveru Jobs.cz. Pojďme se podívat jak to celé vypadalo a co to mělo za následek.
Nejprve jednotlivé grafy:
Proč jsou grafy prakticky stejné?
Říkáte si proč proboha nám ukazují tři prakticky totožné grafy? Ano, to je dobrá otázka. Není to jeden graf 3×, ale pokaždé se jedná o naměřené hodnoty pro jinou službu Jobs.cz.
Většina z Vás si řekne, tak proč teda jsou ty grafy stejné? Na toto je otázka prostá a je zaviněna technologickým řešením které www.jobs.cz a jejich služby používají, kdy v případě problému jedné části systému má problém celá aplikace, což všichni dozajista pochopí, že není vůbec optimální.
PS: Mohli bychom Vám tady ukázat další grafy jako například pro brigády.jobs.cz, práce.cz a další, ale to by již bylo opravdu plýtvání místem jelikož grafy jsou prakticky stejné jako ve zde uvedených přápadech.
Proč byl výpadek tak dlouhý?
To je poslední otázka kterou si položíme. Proč admini jobs.cz problem neopravili ihned jak se toto stalo? Na to je opět velmi jednoduchá odpověd, protože spali a nápravu věci provedli až po příchodu do práce tesně před osmou hodinou ranní.
U tohoto bodu bych se rád zastavil. Není to poprvé co výpadek služby Jobs.cz byl tak neuvěřitelně dlouhý (např: 23.února od 17:47 do 22:17 prakticky nešel personální systém Jobs.cz) a určitě to není naposled. V ostatních případech říkáme, že se to stane víceméně každému dříve či později a snažíme si všímat těd pozitivních věci na problémech a způsobu jak toto různí admini různě řeší. V tomto případě je však velmi tristní, že nejspíše nebyla žádná noční služba, která celou aplikaci na kterou má provozovatel jobs.cz postaven svůj byznys vůbec nehlídá.
Závěr:
A také na toto jsme chtěli upozornit. Pokud uděláte maximum proto aby se Vám výpadky vyhli, tak i když čas od času přijdou nebudou nidky trvat kolem sedmi hodin jako v námi zde citovaném případu. Proto používejte monitoring, mějte službu 24×7×365 a oči otevřené.
Profesionální monitoring serverů: 14 měřících bodů, varování pomocí e-mailu, SMS či ICQ, měření na různých typech i rychlostech připojení, manažerský i administrátorský přehled, 24×7×365 dohled
Přečteno 6 271×
Přečteno 6 144×
Přečteno 5 603×
Přečteno 5 579×
Přečteno 5 558×