Biocentrum Ochota - Grafen

Infrastruktura informatyczna dla rozwoju strategicznych kierunków biologii i medycyny

GRID Biocentrum - opis projektu

Działania skoncentrowane są na powstaniu zintegrowanej infrastruktury informatycznej Biocentrum Ochota umożliwiającej stworzenie, rozbudowę i scalenie baz danych i aplikacji w obszarze zastosowań Bio-Info-Tech, na bazie, unikalnych w skali kraju, serwisów informatycznych już istniejących w tworzących Biocentrum Instytutach. W wyniku realizacji projektu będą dostępne, poprzez portale internetowe, następujące usługi:

  • zintegrowany serwis internetowy do przewidywania struktury i funkcji makrocząsteczek biologicznych, białek i RNA
  • codziennie uaktualnianie, we współpracy z European Bionformatics Institute, bazy danych struktur makrocząsteczek (MSD); danych o białkach (UNIPROT) i ich oddziaływaniach (INTERPRO); genomach eukariotycznych (ENSEMBL) oraz narzędziach symulacyjnych biologii systemów (BIOMODELS)
  • serwis internetowy do przewidywania struktur receptorów GPCR i dokowania ligandów oraz ustalenia oddziaływania ligandów na przełączniki molekularne receptora
  • narzędzia służące do gromadzenia, zarządzania, analizowania i wizualizowania danych o regulacji ekspresji genów; dane o sekwencji genomowej, genach, obszarach regulatorowych i wystąpieniach miejsc wiążących w skali całych genomów zostaną zintegrowane w bazie danych
  • serwisy bioinformatyczne i medycyny molekularnej do przetwarzania i analizy danych pochodzących z eksperymentów wielkoskalowych: proteomiki, genomiki i transkryptorniki, umożliwiające m.in. automatyczną adnotację białek; tworzenie funkcjonalnych map interakcji między nimi oraz symulacje onkogennych szlaków sygnałowych
  • zestaw narzędzi do konstrukcji trójwymiarowych atlasów mózgów niższych ssaków, na podstawie dwuwymiarowych danych, połączony z bazą danych skrawków mózgu i przykładową rekonstrukcją
  • środowiskowe repozytorium obrazowe i sygnałowe wraz z dedykowaną bazą meta-danych przeznaczoną do lokalnego i zdalnego dostępu oraz z aplikacjami do wizualizacji i analizy zgromadzonych danych, z przeznaczeniem dla serwisu telemedycyny radiologicznej, tele- i neuropatologii oraz dla potrzeb internetowych systemów szkoleniowych
  • wieloośrodkowa komputerowa baza danych przeznaczona do kompleksowego wieloletniego monitorowania wyników diagnozowania, obserwacji i leczenia pacjentów z przewlekłą białaczką limfocytową B-komórkową (B-PBL), wraz z zestawem narzędzi do analizy zebranych danych w celu doboru optymalnego sposobu leczenia (chemioterapia i / lub immunoterapia), oceny bieżącego stanu pacjenta i predykcji zmian
  • aplikacje umożliwiające lekarzom i fizjologom przeprowadzanie zdalnych doświadczeń i badań na bazie Wirtualnego Układu Oddechowego
  • baza danych informacji o materiałach konstrukcyjnych, obejmująca również materiały do zastosowań medycznych i nanomateriały
  • baza danych o projektach finansowanych w Programach Ramowych UE jako narzędzie wspomagające badania.

Jako sprzętowa i programowa podstawa dla wymienionych wyżej aplikacji powstanie sieć typu GRID składająca się z sześciu klastrów, o sumarycznej mocy obliczeniowej rzędu 4 TFLOPS (około 1000 procesorów posiadających razem około 4000 rdzeni 64-bitowych, pracujących z częstotliwością około 3 GHz), powiązanych szybkimi łączami (powyżej 10 Gb/s,) z przestrzenią dyskową o wielkości około 4 petabajtów. Sieć będzie umożliwiać udostępnianie wirtualnych stacji roboczych o zamówionych zasobach, pracujących pod systemem operacyjnym wybranym przez użytkownika. Cały system dostępny będzie poprzez dedykowane graficzne stacje robocze (szybki dostęp do danych o wielkiej objętości), z poziomu komputerów PC lub Workstation połączonych lokalnymi sieciami instytutów (dla zastosowań o standardowych wymaganiach) oraz z Internetu — poprzez specjalne aplikacje webowe. Zostanie zakupione i zainstalowane oprogramowanie narzędziowe niezbędne do realizacji zadań przez Partnerów. System zostanie połączony z istniejącymi specjalistycznymi serwerami przetwarzania danych i urządzeniami analitycznymi, które zostały już zainstalowane na terenie aplikujących wspólnie instytutów Biocentrum Ochota.

Uzasadnienie Projektu

Konsorcjum Biocentrum Ochota posiada unikalny w skali kraju potencjał naukowy w dziedzinie nowoczesnych badań biologicznych oraz zastosowań tych badań w medycynie i biotechnologii. Poszczególne instytuty wchodzące w skład Biocentrum, w wyniku prowadzonych prac własnych, wytworzyły liczne metody bioinformatyczne interesujące dla szerokiego kręgu odbiorców — instytucji naukowych, edukacyjnych, służby zdrowia i firm działających w obszarze nowoczesnych technologii.

Współpraca sześciu instytutów w ramach Biocentrum Ochota stwarza wyjątkową możliwość utworzenia zintegrowanej funkcjonalnie i sprzętowo infrastruktury umożliwiającej dostęp, dotychczas ograniczony zarówno poprzez niedostatki sprzętowe, jak i możliwości współdziałania na odpowiednią skalę, do (wymienionych w opisie projektu) aplikacji i baz danych. Realizacja projektu doprowadzi także do rozwoju metod i lepszej interpretacji danych doświadczalnych w dziedzinie szeroko pojętej biomedycyny i biotechnologii.

Połączenie, częściowo odmiennych, kompetencji uczestników projektu pozwoliło na zaproponowanie w niniejszym wniosku szerokiego zakresu serwisów adresowanych do licznych grup odbiorców — lekarzy, przedsiębiorców, nauczycieli akademickich, studentów, pracowników nauki.

Stosunkowo niewielki, w porównaniu do oferowanych korzyści, zakres rzeczowy wniosku wynika z wykorzystania istniejącego już potencjału w instytutach Biocentrum Ochota.