Person ITPunkt
dell
High Performance Computing
HPC
11 maja 2022
Time 3 minut czytania

Superkomputery, czyli zaawansowane systemy obliczeniowe w natarciu

Person ITPunkt

Wraz z postępującą popularyzacją narzędzi umożliwiających symulacje procesów fizycznych bez potrzeby przeprowadzania kosztownych testów z użyciem realnych obiektów, możemy zauważyć nieustający wzrost zapotrzebowania firm inżynierskich na moc obliczeniową.

Każdy dodatkowy procent wydajności potrafi przyśpieszyć symulacje, a co za tym idzie skrócić czas potrzebny do wypuszczenia produktu na rynek lub zmniejszyć koszty związane z fazą projektową. Dotychczasowe podejście, polegające na zapewnianiu każdemu z inżynierów dedykowanej stacji roboczej sprawiało, że duża część potencjału obliczeniowego drzemiącego w zakupionych urządzeniach nie była wykorzystywana. Jedne stacje nie wykonywały obliczeń, podczas gdy inne obciążone były stale, co tworzyło kolejki zadań czekających na wykonanie.

Odpowiedzią na problem niewykorzystanych zasobów jest wdrożenie klastra HPC (ang. High Performance Computing). Rozwiązanie to łączy od kilku do kilku tysięcy wysokowydajnych stacji lub serwerów w jeden superkomputer przewyższający wielokrotnie możliwościami pojedynczą maszynę. Pozwala to scentralizować moc obliczeniową, a z wykorzystaniem systemu kolejkowego umożliwia sprawne zarządzanie zasobami oraz podział na wielu użytkowników.

Na potrzeby jednego z klientów zgłaszających zapotrzebowanie na klaster HPC, ITPunkt zaproponował rozwiązania oparte o serwer DellEMC R740 w roli węzła zarządzającego oraz magazynującego wyniki i czterech serwerów DellEMC R640 jako węzły obliczeniowe. Dwa z serwerów R640 zostały wyposażone w akceleratory GPU. Mają one na celu przyspieszenie obliczeń potrafiących wykorzystać potencjał procesorów graficznych.

Jako platformę do zarządzania klastrem zaproponowano rozwiązania Bright Cluster Manager firmy BrightComputing. Umożliwia ona kompleksowe zarządzanie wszystkimi komponentami oraz wygodną administrację użytkownikami wraz z zarządzaniem ich uprawnieniami.

Za odpowiedni przydział zasobów do poszczególnych użytkowników oraz ich zadań odpowiada otwarty system kolejkowania Slurm. Pozwala on na tworzenie wielopoziomowych zależności między kolejkami zadań, przydzielonymi do nich zasobami klastrowymi oraz zasobami udostępnionymi dla poszczególnych grup użytkowników. Po dodaniu zadania do systemu, Slurm przydziela mu wymagane zasoby, jeśli są w danym momencie dostępne, monitoruje proces wykonywania zadania oraz daje dostęp do statystyk dotyczących danego zadania już po jego wykonaniu.

Daje nam to pełną kontrolę nad zasobami oraz sposobem ich rozdzielania na poszczególnych użytkowników. Dzięki takiemu rozwiązaniu unikamy sytuacji, gdy część mocy obliczeniowej jest niewykorzystana (jak w przypadku, kiedy każdy z inżynierów posiada swoją stację roboczą) oraz dbamy o to, aby żaden z użytkowników nie był zmuszony czekać zbyt długo na wynik przesłanej symulacji.

Chcesz wiedzieć więcej? Napisz do nas na adres: handel@itpunkt.pl!

Porozmawiajmy

Szukasz bezpiecznych rozwiązań dla swojej firmy?
Skontaktuj się z nami.

Kontakt
image