Desktop_chmura_cover.png
Wiedza dla biznesu

Disaster Recovery Center, czyli biznes gotowy na wszystko

29 lutego 2024 6 minut czytania

W erze cyfrowej transformacji nieprzerwany dostęp do danych, a także zabezpieczenie przed ich ewentualną utratą, stają się jednym z najbardziej strategicznych wyzwań dla wielu przedsiębiorstw. Dotyczy to zarówno dużych jak i małych firm, jak i praktycznie każdej branży.

Spis treści:

Outsourcing jako strategiczne rozwiązanie

Nowoczesne trendy w rozwiązaniach Disaster Recovery

Wykorzystanie replikowanego środowiska w testach i utrzymanie DRC

Plan ciągłości działania [BCP] na podstawie analizy BIA

Alternatywy dla zapasowego centrum danych: usługi Veeam Cloud Connect

 

Outsouring IT jako strategiczne rozwiązanie

Jeszcze kilka lat temu większość firm budując swoje systemy informatyczne inwestowała we własną infrastrukturę IT, co wiązało się z adaptacją pomieszczeń, zapewnieniem odpowiedniej klimatyzacji oraz niezawodnego zasilania, zakupem serwerów, macierzy dyskowych, budowie sieci SAN, LAN. Ponadto należało zapewnić na tyle wykwalifikowany personel, który będzie znać nie tylko wewnętrzne aplikacje, ale również wspierać całą tę infrastrukturę. Wielu właścicieli firm uświadamiało sobie wtedy, że utrzymanie tego wszystkiego jest sporym wyzwaniem, szczególnie biorąc pod uwagę fakt rotacji pracowników branży IT oraz niezbędnych kompetencji, jakie powinni oni posiadać.

To był moment, kiedy rozpoczął się trend przenoszenia systemów do centrów danych, które rozwiązują problemy z infrastrukturą oraz ludźmi do jej obsługi. W takim modelu przedsiębiorca wraz z wewnętrznym działem IT może się skupić na swoich innych zadaniach oraz przede wszystkim na priorytetach biznesowych. Należy jednak pamiętać, że nie ma na świecie niezniszczalnych obiektów, którym nie grozi absolutnie żadne ryzyko. Awarie sprzętu czy po prostu zniszczenia będące efektem trudno przewidywalnych zdarzeń losowych, mogą pojawić się w najlepszych DC na świecie. Dlatego każda firma powinna zastanowić się nad zasadnością posiadania DRC (Disaster Recovery Center).

Nowoczesne trendy w rozwiązaniach Disaster Recovery

Obecnie najczęściej spotykanymi trendami w budowie wysoko dostępnych środowisk wykorzystywanych w rozwiązaniach disaster recovery są:

  • Klaster wysokiej dostępności (HA), zapewniający dostęp do danych w przypadku niewielkich awarii sprzętowych. Dodatkowo dane zabezpieczone są serwerem backup’u wraz z repozytorium wyniesionym gdzieś do osobnej, oddalonej geograficznie lokalizacji. Przedsiębiorca jest w takim przypadku chroniony przed awarią nawet całego serwera fizycznego, ale już w sytuacjach związanymi z uszkodzeniem maszyn wirtualnych (np. celowe usunięcie danych, zainfekowanie ransomware) czy awarii całego centrum danych nie ma pewności szybkiego odzyskania dostępu do danych. W takich przypadkach pozostaje odtwarzanie z backupu co w zależności od wolumenu, może wiązać się z długim czasem odzyskiwania. Należy wziąć również pod uwagę fakt, że w przypadku zniszczenia centrum danych będzie trzeba poszukać miejsca, gdzie można się odtworzyć. Czas na wykonanie całego planu awaryjnego (DRP – Disaster Recovery Plan) może być liczony w dniach lub nawet tygodniach. Oczywiście to jest scenariusz wręcz apokaliptyczny, jednak możliwy.
  • Klaster wysokiej dostępności (High Availability) rozciągnięty na dwie lokalizacje geograficzne (Active-Active). Dzięki replikacji synchronicznej na poziomie macierzy dyskowych, często nazywanej MetroCluster’em, posiadamy te same dane w tym samym momencie w jednym i drugim centrum danych. Dodatkowo całość zabezpiecza backup w oddzielnej lokalizacji. W tym przypadku oznacza to ochronę przed awarią całej serwerowni. Ograniczeniem tutaj jest odległość pomiędzy lokalizacjami centów danych. W zależności od rozwiązania 5 lub 10ms RTT (Round Trip Time). Klaster Active-Active ma też swoje wady – nie chroni przed uszkodzeniami na poziomie systemu plików czy np. atakami ransomware (problem w jednym ośrodku w ułamku sekundy dotyczy również drugiego) – pozostaje nam wtedy odtwarzanie awaryjne z backupu (Disatser Recovery).

Jako opcja możliwa do wdrożenia w jednym i drugim rozwiązaniu jest środowisko zapasowe – DRC (Disaster Recovery Center), czyli replikacja asynchroniczna do środowiska zapasowego oddalonego o wiele kilometrów (nie ma limitu). W takim ośrodku możemy przechowywać kilka wersji danej maszyny wirtualnej. Oznacza to, że jeśli w środowisku podstawowym zadziało się coś niedobrego to mamy możliwość przełączenia się na DRC do stanu maszyny sprzed kilku minut / godzin lub dni – w zależności od polityki replikowania, kosztem utraty części danych (bo replikujemy asynchronicznie). Środowisko zapasowe musi również udostępniać nam możliwość „powrotu” (failback) do pierwotnej lokalizacji bez utraty daych, które były przetwarzane w momencie przełączenia (failover).

Wykorzystanie replikowanego środowiska w testach i utrzymanie DRC

Zreplikowane produkcyjne środowisko ma też jedną fundamentalną zaletę – może służyć jako środowisko do wszelakiego rodzaju testów – tak jakbyśmy to robili na tzw. produkcji. Po przeprowadzeniu prac, wszystkie zmiany zostają cofnięte i możemy kontynuować naszą replikację asynchroniczną. Utrzymanie środowiska DRC nie jest zadaniem łatwym. Szczególnie, że wszystkie systemy informatyczne ewoluują, powstają nowe, a inne są wygaszane. Aby w przypadku awarii nie tracić czasu, powinniśmy cyklicznie testować oraz aktualizować nasze plany DRP (Disaster Recovery Plan). Dobrą praktyką jest utrzymywanie planu w dwóch wersjach – pełnej zawierającej maksimum informacji oraz skróconej do minimum, zawierającej tylko niezbędne kroki podejmowane w przypadku awarii – bez opisów, z czego wyniknęła, ponieważ osoby wykonujące plan DR powinny być zaznajomione z pełną wersją dokumentu. Wdrożenie rozwiązania DRC powinno być poprzedzone analizą BIA i opracowaniem BCP.

Plan ciągłości działania (BCP) na podstawie analizy BIA

Na podstawie analizy BIA (Business Impact Analysis) można zbudować plan ciągłości działania BCP (Business Continuity Plan), który zawierać będzie kroki, jakie należy podjąć w celu uniknięcia niepotrzebnego ryzyka. Z tych dwóch dokumentów powinny wynikać dwa ważne parametry dla projektantów środowisk IT:

  • RTO (Recovery Time Objective) – czas jak szybko powinniśmy uzyskać dostęp do danych w przypadku awarii,
  • RPO (Recovery Point Objective) – liczba danych, które mogą zostać utracone w wyniku awarii, wyrażona w jednostce czasu (np. utrata danych z ostatnich 12 godzin).

Te dwa parametry pozwalają skomunikować ludzi od biznesu z architektami IT, który dobiorą rozwiązanie spełniające wymagania dla konkretnych aplikacji. Decyzja o konieczności posiadania środowiska zapasowego DRC często jest wynikiem nie tylko analizy BIA, ale również może to być wymóg regulacji prawnych takich jak rekomendacja D wydana przez KNF (Komisja Nadzoru Finansowego) dla sektora bankowego, czy też regulacje w stosunku do niektórych systemów służby ochrony zdrowia.

Alternatywy dla zapasowego centrum danych: usługi Veeam Cloud Connect

W przypadku gdy posiadanie zapasowego centrum danych jest dużym wyzwaniem finansowym, warto rozważyć alternatywy dostępne na rynku, takie jak usługi Veeam Cloud Connect. Rozróżniamy tutaj dwa rodzaje usługi:

  • Veeam CloudConnect Backup – umożliwia dostęp do repozytorium na backupy w „chmurze” czyli w ośrodku takim jak centrum danych Play – jest to tylko dodatkowa przestrzeń dyskowa powodująca, że posiadamy kopię backupu poza naszą infrastrukturą, a jednocześnie dane nadal znajdują się fizycznie na terytorium Polski. Można z tego miejsca odtworzyć swoje dane, ale… trzeba mieć też, gdzie. Ten problem rozwiązuje drugi typ usługi Cloud Connect,
  • Veeam CloudConnect Replica – jest to dodatkowo moc obliczeniowa w postaci CPU, RAM, Storage. W tym przypadku nie przechowujemy plików backupu (.vbk), ale kompletne wirtualne maszyny gotowe do uruchomienia.

Warto zauważyć, że o środowisku DRC można mówić nie tylko w kontekście czysto informatycznym. Katastrofą może być objęte miejsce pracy wielu ludzi i aby biznes przetrwał, nie wystarczy zapewnienie samego dostępu do danych, ale należy również zadbać o miejsce, gdzie Ci ludzie będą mogli szybko i sprawnie się przenieść, aby kontynuować swoje zadania. W największych firmach praktyką stała się okresowa symulacja „katastrof”, gdzie sprawdzany był czas relokacji pracowników lub nawet takie scenariusze, w których połowa z tych pracowników nie pojawia się przez jakiś czas w firmie. Pokazuje to dużą świadomość i dojrzałość danego przedsiębiorstwa, które potrafi wyciągać właściwe wnioski i rozsądnie podejmuje decyzje związane z krytycznym obszarami własnej działalności.

Play Expert poleca

Sprawdź najkorzystniejsze oferty na play.pl