Biocentrum Ochota - Grafen

Infrastruktura informatyczna dla rozwoju strategicznych kierunków biologii i medycyny

GRID COMPUTING

RÓŻNICA POMIĘDZY GRIDEM A KLASTREM

Grid to zespół zasobów komputerowych znajdujących się w różnych lokalizacjach połączonych ze sobą w celu świadczenia usług obliczeniowych. Grid można rozumieć jako potężny wirtualny komputer powstały poprzez połączenie wielu systemów współdzielących różne zasoby.

Pojęcia klastra i grida są często mylone. W obu przypadkach mamy do czynienia z systemami składającymi się z wielu komputerów. W odróżnieniu od systemów typu klastrowego grid jest luźniej zespolony, heterogeniczny i rozproszony geograficznie. Natomiast klaster na ogół składa się z serwerów będących w jednej lokalizacji i obsługiwanych przez jeden system operacyjny.

Charakterystyka systemu klastrowego:

  • ściśle zintegrowany,
  • jeden system operacyjny na wszystkich maszynach, wspólny obraz systemu operacyjnego,
  • zcentralizowane zarządzanie i wspólna kolejka zadań,
  • zasadniczo przeznaczony do świadczenia jednego rodzaju usług.

Charakterystyka systemu gridowego:

  • słabo zintegrowany,
  • składa się z różnych maszyn i systemów pod kontrolą różnych systemów operacyjnych,
  • rozproszone zarządzanie,
  • zwykle obejmuje szeroki zakres usług.

W systemach klastrowych pojedynczy komputer nazywany jest węzłem. Mogą być węzły obliczeniowe lub usługowe, niewpływające bezpośrednio na wydajność klastra, lecz udostępniające usługi niezbędne dla jego sprawnego działania, np. zarządzające, dyskowe i dostępowe.

Początki systemów gridowych to wielkie sieci składające się z tysięcy komputerów PC. Jednym z pierwszych systemów gridowych był SETI@home, który umożliwiał każdemu użytkownikowi Internetu uczestniczenie w poszukiwaniu sygnałów pozaziemskich cywilizacji przy pomocy swojego komputera osobistego.

Grid jest formą komputerowego systemu rozproszonego, a przetwarzanie „gridowe” można w niektórych przypadkach traktować jako przetwarzanie równoległe w oparciu o kompletne komputery przyłączone do sieci (prywatnej, publicznej lub Internetu) tradycyjnym łączem, np. typu Ethernet. To różni grid od superkomputera, który zbudowany jest z wielu rdzeni lub procesorów połączonych dedykowaną szyną danych o dużej przepustowości.

Wielkość grida może być bardzo różna – od małych, ograniczonych do lokalnej sieci przedsiębiorstwa lub instytucji – do dużych, publicznych, opierających się na współpracy wielu instytucji i sieci komputerowych. Technologie gridowe używane są do rozwiązywania problemów naukowych, często w oparciu o ochotników przyłączonych do grida. Używa się ich także w różnych zastosowaniach komercyjnych takich jak: poszukiwanie nowych leków, przewidywania ekonomiczne, analizy sejsmiczne, a także w przetwarzaniu backoffice w e-handlu i usługach webowych. Obecnie coraz bardziej popularne są także usługi komercyjne tego typu oraz gridy składające się z klastrów obliczeniowych.

PRZYKŁADY SYSTEMÓW GRIDOWYCH W POLSCE

  • Infrastruktura PL-Grid (www.plgrid.pl)

    PL-Grid to platforma informatyczna powstała w latach 2009-2012, oparta na klastrach komputerów, służących e-Science w różnych dziedzinach. Infrastruktura wspiera badania naukowe poprzez integrację danych doświadczalnych i wyników zaawansowanych symulacji komputerowych prowadzonych przez geograficznie rozproszone zespoły. Użytkownicy mogą korzystać ze specjalistycznych pakietów z różnych dziedzin: biologii, chemii kwantowej, fizyki, obliczeń numerycznych i symulacji.

  • Program Obliczeń Wielkich Wyzwań Nauki i Techniki (POWIEW) (wielkiewyzwania.pl)

    Celem programu jest utworzenie i udostępnienie infrastruktury obliczeniowej ze wsparciem naukowym i programistycznym, utworzenie krajowego ośrodka kompetencji w zakresie rozwoju modeli obliczeniowych dla wiodących klas architektur komputerowych generacji petaskalowej oraz utworzenie ośrodka kompetencji w dziedzinie wieloskalowej analizy danych i modelowania wizualnego. W ramach projektu udostępniane są systemy: obliczeń masywnie równoległych, zrównoleglonych obliczeń gruboziarnistych, przetwarzania symetrycznego, hybrydowych obliczeń akceleratorowych.

  • Krajowy Klaster Linuksowy (Krajowy Klaster Linuksowy)

    Projekt zakończony w 2005r. Celem projektu było udostępnienie użytkownikom akademickim rozproszonym w całym kraju zasobów, usług i aplikacji w celu prowadzenia prac naukowo-badawczych wymagających wyjątkowo dużej mocy obliczeniowej. Clusterix został wykorzystany m. in. do: modelowania zjawisk termomechanicznych w krzepnących odlewach, symulacji wielkiej skali przepływu krwi w mikrokapilarach, projektowania układów elektroniki molekularnej oraz symulacji mechanosyntezy.