Grid komputerowy PDF Drukuj E-mail
System rozproszony nie ma s艂abych punkt贸w. Wielokrotne kopie danych i automatyczne wyznaczanie zada艅 komputerowych dla dost臋pnych zasob贸w zapewnia ich szerokie zr贸wnowa偶enie i u艂atwia dost臋p do danych wszystkim uczestnikom projektu, niezale偶nie od szeroko艣ci geograficznej.

GRID KOMPUTEROWY - NOWE NARZ臉DZIE W NAUCE

01fa.jpg Budowany w CERN ko艂o Genewy Large Hadron Collider LHC jest najwi臋kszym na 艣wiecie urz膮dzeniem badawczym. Kiedy zostanie uruchomiony w 2007 roku, jego wielkie detektory ATLAS, CMS, LHCb oraz ALICE, otaczaj膮ce miejsca zderze艅 rozp臋dzonych do ogromnych energii przeciwbie偶nych wi膮zek proton贸w (lub jon贸w o艂owiu), b臋d膮 produkowa膰 10-15 petabajt贸w (milion贸w gigabajt贸w) danych rocznie. Dane te b臋d膮 szczeg贸艂owo analizowane i por贸wnywane z symulacjami komputerowymi oblicze艅 teoretycznych. W miar臋 up艂ywu czasu ich liczba jeszcze b臋dzie ros艂a.

SYSTEMY ROZPROSZONE

W eksperymentach na LHC uczestniczy 5 tysi臋cy naukowc贸w z oko艂o 500 instytut贸w badawczych i uniwersytet贸w na ca艂ym 艣wiecie. Wszyscy oni musz膮 mie膰 zapewniony pe艂ny dost臋p do danych przez ca艂y czas pracy LHC, kt贸ry przewiduje si臋 na 15-20 lat. Uaktualnianie, analiza i przechowywanie danych wymagaj膮 olbrzymich pami臋ci i mocy obliczeniowej rz臋du 100 tys. CPU-s (Central Processing Units). Zcentralizowanie tych urz膮dze艅 w jednym miejscu, w pobli偶u eksperymentu w CERN, pozornie naturalne, w rzeczywisto艣ci jednak by艂oby organizacyjnie bardzo trudne.

Postanowiono zastosowa膰 inny, bardziej optymalny, spos贸b: globalny Grid, czyli model rozproszonych mocy obliczeniowych. (Nazwa Grid pochodzi z analogii z sieci膮 elektryczn膮: kiedykolwiek u偶ytkownik pod艂膮czy si臋 do tej sieci, nie musi si臋 zastanawia膰, gdzie jest 藕r贸d艂o zasilania. Inaczej m贸wi膮c u偶ytkownicy mog膮 traktowa膰 Grid jako urz膮dzenie, z kt贸rego na 偶膮danie mog膮 czerpa膰 moc obliczeniow膮 i przechowywa膰 dane.) Oznacza艂o to potrzeb臋 zbudowania sprawnego systemu pozwalaj膮cego przesy艂a膰 dane czy programy do rozmieszczonych na ca艂ym globie element贸w komputerowych, na kt贸rych b臋d膮 wykonywane obliczenia i analizowane wyniki. Koszty utrzymania i uaktualniania koniecznych mocy obliczeniowych do takiego komputerowego wyzwania s膮 znacznie 艂atwiejsze do poniesienia w 艣rodowisku rozproszonym. Poszczeg贸lne instytuty i organizacje narodowe uczestnicz膮ce w projekcie mog膮 znale藕膰 lokalne zasoby komputerowe i przej膮膰 za nie odpowiedzialno艣膰, przyczyniaj膮c si臋 w ten spos贸b do osi膮gni臋cia celu globalnego. Ponadto, system rozproszony nie ma s艂abych punkt贸w. Wielokrotne kopie danych i automatyczne wyznaczanie zada艅 komputerowych dla dost臋pnych zasob贸w zapewnia ich szerokie zr贸wnowa偶enie i u艂atwia dost臋p do danych wszystkim uczestnikom projektu, niezale偶nie od szeroko艣ci geograficznej.

Podstawy system贸w gridowych opracowano ju偶 w po艂owie lat 90. w Stanach Zjednoczonych. By艂y to systemy Condor i Globus. W Europie Grid pojawi艂 si臋 nieco p贸藕niej, jednym z system贸w by艂 DataGrid, stworzony w celu opracowania danych fizyki, biologii i obserwacji Ziemi, zorganizowany przez CERN. Uczestniczy艂y w nim przede wszystkim du偶e instytuty Francji, Wielkiej Brytanii i W艂och. W ramach tego projektu stworzono podstawy oprogramowania pozwalaj膮cego na wykonywanie oblicze艅 fizycznych w rozproszonym systemie komputerowym oraz sprawdzono jego prac臋. Pokrewnym projektem by艂 projekt Unii Europejskiej CrossGrid, kt贸ry kontynuowa艂 prace rozpocz臋te przez DataGrid i rozszerza艂 je na aplikacje niezwi膮zane z fizyk膮. Uczestniczy艂y w nim instytucje z 11 kraj贸w, w tym pi臋膰 z Polski, a koordynatorem by艂 ACK CYFRONET AGH (zesp贸艂 pod kierunkiem dr. M. Bubaka z KI AGH i prof. Micha艂a Tura艂y z IFJ PAN).

Oprogramowanie stworzone przez DataGrid oraz infrastruktura gridowa pozwoli艂y na uruchomienie we wrze艣niu 2003 艣wiatowego Gridu do fizyki pod nazw膮 "LCG-LHC Computing Grid". Pierwsza instalacja skupia艂a 14 o艣rodk贸w z Europy, w tym i krakowski klaster kilkudziesi臋ciu procesor贸w Intel z oprogramowaniem Linux.

ORGANIZACJE WIRTUALNE

Koncepcja 艣wiatowego Gridu jest prosta, jednak jej realizacja stanowi ogromne wyzwanie, tak pod wzgl臋dem technicznym, jak i organizacyjnym.

Zadania projektu LCG polegaj膮 na rozwini臋ciu infrastruktury i utrzymaniu bazy s艂u偶b komputerowych w rozproszonym modelu oraz stworzeniu program贸w do scalenia tych urz膮dze艅 w jeden sprawny i wydajny system obliczeniowy - Grid. Nale偶y opracowa膰 spos贸b zarz膮dzania u偶ytkownikami i ich prawami w mi臋dzynarodowym, niejednorodnym i rozproszonym 艣rodowisku. S艂u偶y temu koncepcja "organizacji wirtualnych" (VO). Osobnym zadaniem jest opracowanie zarz膮dzania akwizycj膮, instalacj膮 i planowaniem pojemno艣ci do du偶ej liczby sk艂adowych sprz臋towych (hardwarowych) tworz膮cych fizyczn膮 p艂aszczyzn臋 LCG.

Dane z eksperyment贸w na LHC b臋d膮 rozprowadzane po ca艂ym 艣wiecie zgodnie z modelem czterow臋z艂owym. Pierwotny zapis danych na ta艣mach, dokonywany w CERN, b臋dzie stanowi膰 w臋ze艂 zerowy LCG - Tier-0. Dane te zostan膮 skopiowane do serii w臋z艂贸w Tier-1 - wielkich centr贸w komputerowych, o du偶ych zasobach pami臋ciowych - gdzie b臋d膮 wst臋pnie opracowywane i kompresowane w mniejsze obiekty. Centra Tier-1 udost臋pni膮 dane w臋z艂om Tier-2, z kt贸rych ka偶dy sk艂ada si臋 z wielu wsp贸艂pracuj膮cych urz膮dze艅 licz膮cych, posiadaj膮cych dostateczn膮 moc obliczeniow膮 do analizy przypadk贸w fizycznych oraz du偶ych pami臋ci do przechowywania rezultat贸w. System gridowy Tier-0, Tier-1 i Tier-2 b臋dzie do dyspozycji eksperyment贸w poprzez odpowiednie "organizacje wirtualne". Indywidualni fizycy b臋d膮 mieli dost臋p do danych przez licz膮ce centra Tier-3, kt贸re mog膮 si臋 sk艂ada膰 z lokalnych klaster贸w na wydzia艂ach uniwersyteckich lub nawet z indywidualnych pecet贸w, i kt贸re mog膮 by膰 w艂膮czone do regularnej bazy LCG.

OPERACJE, POWODZIE, SKA呕ENIA

Analiza przypadk贸w fizycznych nie jest jedynym zastosowaniem Gridu. Mo偶liwo艣膰 uzyskania wyniku w bardzo kr贸tkim czasie, w szczeg贸lno艣ci "uczenie" jak w sieciach neuronowych, rozproszonej infrastruktury obliczeniowej oraz dost臋p do odleg艂ych mocy obliczeniowych "na 偶yczenie" w trakcie przebiegu eksperymentu, doskonale si臋 nadaj膮 do wykorzystania Gridu w r贸偶nych aplikacjach. Wspomniany wy偶ej projekt CrossGrid obejmuje na przyk艂ad mo偶liwo艣膰 zastosowania Gridu w medycynie lub sytuacjach kryzysowych na og贸艂 wymagaj膮cych "natychmiastowych" (tzn. bardzo szybkich) decyzji. W 2005 aplikacje te zosta艂y uznane za jedne z najlepszych przyk艂ad贸w wykorzystania Gridu.

W przypadku medycyny chodzi o wspomaganie komputerowe lekarza z dowolnie odleg艂ego miejsca na kuli ziemskiej, w trakcie podejmowania decyzji, dotycz膮cych niekt贸rych zabieg贸w chirurgicznych, jak np. optymalizacja by-pass贸w. Oprogramowanie powinno pom贸c w wybraniu najlepszego rozwi膮zania, je艣li idzie o inwazyjno艣膰 - minimalizowanie czasu trwania i rozleg艂o艣ci operacji, i konsekwencje - ci艣nienie krwi w krwioobiegu po zabiegu. Wspomaganie przez rozproszon膮 sie膰 gridow膮 sztabu kryzysowego w sytuacjach zbli偶aj膮cej si臋 powodzi pozwoli z du偶ym prawdopodobie艅stwem przewidzie膰 realne zagro偶enie. Konieczna jest wtedy natychmiastowa, dog艂臋bna, na szerokim obszarze, analiza opad贸w, pogody, uk艂adu geologicznego i hydrogeologicznego, oraz wykorzystanie informacji o przebiegu podobnych wydarze艅 w przesz艂o艣ci, co wymaga mocy obliczeniowych przekraczaj膮cych dziesi膮tki razy dost臋pne w typowym o艣rodku komputerowym.

Prowadzone z wykorzystaniem rozproszonej infrastruktury gridowej badania przewidywa艅 ska偶e艅 艣rodowiska powstaj膮cych w okre艣lonych sytuacjach pogodowych pozwol膮 zminimalizowa膰 efekty uboczne (np. elektrownia mo偶e dobiera膰 jako艣膰 w臋gla w zale偶no艣ci od kierunk贸w wiatr贸w i roznoszenia py艂贸w) - i ten przypadek wymaga szybkich decyzji, w sytuacji zmiennych warunk贸w atmosferycznych.

Obecnie ACK CYFRONET AGH i IFJ PAN nale偶膮 do grona do艣wiadczonych partner贸w i uczestnicz膮 w kilku nowych inicjatywach gridowych, w tym nowych projektach europejskich: KWfGrid, EGEE, ViroLab czy BalticGrid, w kt贸rych cz臋sto odgrywaj膮 role wiod膮ce.
< Poprzedni   Nast阷ny >
Reklama
wosp.jpg
o nas | reklama | regulamin | kontakt
©2005 edukacja.info.pl
.Darmowe zliczanie odwiedzaj筩ych stron - FreeStat.pl .meskimbyc.pl