Včera jsme byli svědky nedostupnosti oblíbeného serveru Lupa.cz. , na kterém beží i tento blog. Pojdmě se podívat jak k tomu došlo a co se ve skutečnosti stalo.
Na začátku se podívejme na holá data v jaké minutě se chyby staly.
Stav |
Časy kontrol (zaokrouhleny na celé minuty) |
Connect error (Timeout) |
1:50, 1:55, 6:35, 6:45–6:46, 7:43, 7:45–8:03, 8:05–8:09, 8:11–8:13, 8:44–8:45, 08:47–8:48, 9:28, 9:31, 9:46, 9:47–9:49, 10:00, 10:02, 10:06–10:08, 10:10–10:12, 10:18, 10:20–10:21, 10:23, 10:25 |
Read error (Timeout) |
1:45–1:45, 2:10, 6:05, 6:45, 6:47, 7:42, 7:44–7:45, 7:55, 8:04, 8:10, 8:16, 8:18, 8:42–8:43, 8:45–08:46, 8:49–8:50, 9:25–9:27, 9:29–9:30 , 09:32–09:33, 9:40, 9:50, 9:58–10:01, 10:03–10:05, 10:09, 10:13–10:15, 10:17, 10:19, 10:22, 10:24, 10:26, 10:32 |
A teď přehlednější tabulka kde jsou nedostupnosti delší než dvě minuty:
Nedostupnost |
Počet minut |
6:45–6:47 |
2 minuty |
7:42–8:13 |
31 minut |
8:42–8:45 |
3 minuty |
8:47–8:50 |
3 minuty |
9:25–9:33 |
8 minut |
9:46–9:50 |
4 minuty |
9:58–10:15 |
17 minut |
10:17–10:26 |
9 minut |
Chybový log od 10:00 do 10:10:
10:00:20 – Connect error (Timeout)
10:00:25 – Connect error (Timeout)
10:00:35 – Read error (Timeout)
10:00:55 – Read error (Timeout)
10:01:25 – Read error (Timeout)
10:01:50 – Read error (Timeout)
10:02:30 – Connect error (Timeout)
10:02:35 – Connect error (Timeout)
10:03:35 – Read error (Timeout)
10:04:05 – Read error (Timeout)
10:04:40 – Read error (Timeout)
10:05:20 – Read error (Timeout)
10:05:45 – Read error (Timeout)
10:06:20 – Connect error (Timeout)
10:06:50 – Connect error (Timeout)
10:07:25 – Connect error (Timeout)
10:07:55 – Connect error (Timeout)
10:08:00 – Connect error (Timeout)
10:08:30 – Connect error (Timeout)
10:09:05 – Read error (Timeout)
10:09:25 – Read error (Timeout)
10:10:10 – Connect error (Timeout)
Co se skutečně stalo:
Získali jsme vyjádření od provozovatele serveru Lupa.cz společnosti Internet Info. Tomáš Krause ke zmíněnému problému uvedl:
„Lupa jede po havárii HW na databázovém serveru na provizorním záložním serveru, který není tak výkonný jako standardní server. Pokud nedojde ke komplikacím, bude během dneška původní server vrácen ze servisu a asi během noci vše vráceno do normálu.“
Ranní UPDATE:
Dnes ráno od 5:30 do 6:15 byl výpadek, přesneji řečeno chyba Connect error (Timeout), který byl s největší pravděpodobností způsoben vracením stavu do normálu.
Profesionální monitoring serverů: 14 měřících bodů, varování pomocí e-mailu, SMS či ICQ, měření na různých typech i rychlostech připojení, manažerský i administrátorský přehled, 24×7×365 dohled
Přečteno 6 200×
Přečteno 6 059×
Přečteno 5 545×
Přečteno 5 539×
Přečteno 5 453×