GRID Connecting People
2006-11-07 23:50:55System gridowy to zorganizowana, rozproszona struktura sprzętowa lub programowa umożliwiająca spójny podział i dostęp do zasobów obliczeniowych. Dzięki ustandaryzowanym protokołom połączeniowym ogólnego przeznaczenia zapewnia ścisła kontrolę nad współdzieleniem zasobów systemu. Jednocześnie poszczególne zasoby gridu nie podlegają zcentralizowanemu nadzorowi , tylko pracują jako autonomiczne jednostki obliczeniowe. Jednostka centralna zarządza jedynie spójnym podziałem zadania nad którym w danym momencie pracuje grid, rozprowadzeniem danych po systemie oraz późniejszym zbieraniem i scalaniem wyników.
• Optymalizacja zużycia zasobów
• Skalowalność
• Integracja silnie rozproszonych środowisk komputerowych
• Minimalizacja kosztów przeznaczonych na jednostki obliczeniowe
• Umożliwienie realizacji złożonych zadań
Standardowy przebieg działania systemu gridowego jest następujący:
1. Administrator uruchamia system gridowy i przydziela mu zadanie.
2. Grid odnajduje dostępne zasoby.
3. Podział (dekompozycja) głównego zadania na mniejsze podzadania.
4. Rozprowadzenie pakietów po systemie.
5. Realizacja zadania:
• System monitoruje postęp prac
System gridowy jest oparty na architekturze warstwowej:
2. Warstwa Usługowa - niewidoczna część systemu, składa się z następujących elementów:
• Zarządzanie wykonywaniem - nadzoruje przydział zadań do zasobów (funkcja planisty)
• DataGRID - zapewnia niezależność dostępu do danych
• System Informacyjny - informuje o postępie prac, prowadzi statystyki i monitoring systemu
3. Warstwa Zasobów - najbardziej rozproszona warstwa systemu, nie podlegająca ograniczeniom geograficznym, jej spójność zapewniają odpowiednio skonfigurowane aplikacje klienckie
Rozwój architektury i protokołów systemów gridowych nadzorowany jest przez Global Grid Forum. Dzięki ich pracy powstał standard protokołów Globus Toolkit mający być zastąpiony w przyszłości przez Open Grid Services Architecture(OGSA).
Globus Toolkit zapewnia następujące usługi:
• Usługa bezpieczeństwa oparta na PKI (Public Key Infrastructure)
• Dostarczanie i zarządzanie zadaniami
• Usługi informacyjne oparte na LDAP
• Zarządzanie plikami zdalnymi (w tym synchronizacja danych)
Systemy gridowe mają wiele zalet. Przede wszystkim skracają czas potrzebny na wykonanie zadania i odciążają główną jednostkę obliczeniową systemu. Oprogramowanie klienckie można zainstalować na każdym komputerze wolnostojącym, niezależnie od systemu operacyjnego pod jakim działa oraz jego położenia geograficznego. Pozwala to rozproszyć grid na całym świecie, nie naruszając przy tym spójności danych oraz płynności ich wymiany. Najlepszym przykładem ogólnoświatowego grida jest projekt SETI@Home. Zasoby rozproszone gwarantują również użycie nadmiarowych cykli, a przez to weryfikację otrzymywanych wyników.
Niestety systemy gridowe posiadają także wady, znacznie utrudniające korzystanie z wydawać by się mogło idealnego rozwiązania. Najważniejszą z nich jest fakt, że nie wszystkie zadania wymagające dużej mocy obliczeniowej są podzielne i skalowalne. Bez spełnienia tych postulatów niemożliwe jest skorzystanie z idei grida. Minusem jest tez konieczność ponownej implementacji algorytmów pracujących nad danym zadaniem, przystosowując je do obliczeń równoległych (chyba ze projektujemy system od razu jako grid). Stosowanie gridów wiąże się tez z dużą ilością pracy związanej z zainstalowaniem aplikacji klienckich. Otwarta też pozostaje kwestia bezpieczeństwa danych i ich ewentualnej poufności.
Przykładowe systemy gridowe:
• VIROLAB - gridowy projekt mający na celu opracowanie formuły leku na wirus HIV. Powstał jako wspólny projekt wyższych uczelni z Holandii, Polski i Niemiec.
• SETI@Home - ogólnoświatowy, ochotniczy system gridowy analizujący dane z radioteleskopów pod kątem poszukiwania cywilizacji pozaziemskich.
• EUROPEAN UNION DATA GRID – grid zastosowany w badań fizyki wysokich energii
• INFORMATION POWER GRID - wysokiej wydajności grid obliczeniowy NASA
Duże zainteresowanie liczących się koncernów informatycznych (Sun, IBM, Microsoft) jakim cieszą się gridy może świadczyć o tym, że to rozwiązanie może w niedługim czasie stać się podstawowa platformą obliczeniową. Jednak bez opracowanie efektywnego algorytmu, zapewniającego podzielność każdego zadania oraz elastycznych, łatwych w obsłudze środowisk umożliwiających implementacje aplikacji gridowych systemy te nie wyjdą poza specjalistyczne zastosowania naukowe.
• GLOBUS TOOLKIT - http://www.globus.org/
• GRID COMPUTINIG INFO CENTER - http://www.gridcomputing.com/
• GRIDWISETECH - http://www.gridwisetech.com
• GLOBAL GRID FORUM - http://www.ggf.org/
• SETI@Home - http://setiathome.ssl.berkeley.edu/
• VIROLAB - http://www.virolab.org
• GRID TODAY - http://www.gridtoday.com
• CRACOW GRID WORKSHOP - http://www.cyf-kr.edu.pl/cgw04/