Параллельное программирование для ресурсоёмких задач численного моделирования в физике
Основы работы на удалённых вычислительных системах коллективного пользования
Работа на суперкомпьютере "Ломоносов"
Основная информация по работе
Общее представление
Файловая система
Файловая система
Файловая система
Информация по работе
Slurm: очередь задач
Запуск задач
Больше информации http://parallel.ru/cluster https://users.parallel.ru/pages/welcome
2.41M
Category: programmingprogramming

Параллельное программирование для ресурсоёмких задач численного моделирования в физике

1. Параллельное программирование для ресурсоёмких задач численного моделирования в физике

Центр компьютерной физики
Кафедра общей физики и волновых процессов
Лаборатория Инженерной Физики
Параллельное программирование
для ресурсоёмких задач численного
моделирования в физике
В.О. Милицин, Д.Н. Янышев, И.А. Буткарев

2. Основы работы на удалённых вычислительных системах коллективного пользования

Физический факультет МГУ им М.В.Ломоносова

3. Работа на суперкомпьютере "Ломоносов"

Работа на суперкомпьютере
"Ломоносов"
http://parallel.ru/cluster/lomonosov.html
Физический факультет МГУ им М.В.Ломоносова
3

4. Основная информация по работе

Текущая конфигурация суперкомпьютера Ломоносов
http://parallel.ru/cluster/actual-T500.html
HOWTO
http://parallel.ru/cluster/lomonosov_howto
Адрес для входа пользователей по ssh:
lomonosov.parallel.ru
Компиляция программ осуществляется на узле
compiler (compiler.lomonosov.parallel.ru)
Физический факультет МГУ им М.В.Ломоносова
4

5. Общее представление

Физический факультет МГУ им М.В.Ломоносова
5

6. Файловая система

Физический факультет МГУ им М.В.Ломоносова
6

7. Файловая система

Физический факультет МГУ им М.В.Ломоносова
7

8. Файловая система

Физический факультет МГУ им М.В.Ломоносова
8

9. Информация по работе

Программное обеспечение
http://parallel.ru/cluster/toolkitinfo
система модульной конфигурации окружения Modules
module list, module add …
Система хранения данных
http://parallel.ru/node/7756
Узлы: access, compiler, вычислительные
Хранилища: быстрое, основное, архив
Система управления заданиями и ресурсами Slurm
http://parallel.ru/cluster/lomonosov_howto
regular4 - Основная очередь
test - предназначенный для отладки приложений
Физический факультет МГУ им М.В.Ломоносова
9

10. Slurm: очередь задач

Запуск задач только через очередь
sbatch
Удаление из очереди
scancel <N>
Просмотр очереди
squeue
Краткая информация
sinfo
http://slurm.schedmd.com/
Физический факультет МГУ им М.В.Ломоносова
10

11. Запуск задач

Часто используемые ключи команды sbatch:
-n NNN - число требуемых ядер
-N NNN - число требуемых узлов
-p NAME - имя раздела (очереди)
-t MINS - лимит времени работы задачи в минутах
-o/-e/-i - перенаправление ввода/ошибок/вывода в файл
пример: MPI+OpenMP программа на 16 ядер по 2 MPIпроцесса на узел в очереди test
sbatch -p test -n16 -N8 ompi ~/prj1/calc -i ~/prj1/myinput
-o /prj1/myoutput
Физический факультет МГУ им М.В.Ломоносова
11

12. Больше информации http://parallel.ru/cluster https://users.parallel.ru/pages/welcome

Физический факультет МГУ им М.В.Ломоносова

13.

Физический факультет МГУ им М.В.Ломоносова
13
English     Русский Rules