Similar presentations:
Архитектура вычислительных систем. Тема 8
1.
ВОЕННО-КОСМИЧЕСКАЯ АКАДЕМИЯ ИМЕНИ А.Ф. МОЖАЙСКОГОКафедра информационно-вычислительных систем и сетей
РАЗДЕЛ 3. Вычислительные системы
Тема 8. Архитектура вычислительных систем
Доктор технических наук профессор,
БАСЫРОВ А.Г.
2.
ОРГАНИЗАЦИЯ ЭВМ И СИСТЕМЛекция №26
Основные классы вычислительных систем
Цель: сформировать у обучающихся знания об особенностях
построения и функционирования вычислительных систем
классов SIMD и MIMD
Учебные вопросы:
1.Вычислительные системы класса SIMD
2.Вычислительные системы класса MIMD
2
3.
Учебный вопрос № 1Вычислительные системы класса SIMD
3
4.
Вычислительные системы класса SIMDК классу SIMD относятся ВС, в которых множество
элементов данных подвергается параллельной, но
однотипной обработке
SIMD-системы
Векторные (векторно-конвейерные) ВС
Матричные ВС
Ассоциативные ВС
Систолические ВС
4
5.
Векторно-конвейерные вычислительные системыСредства векторной обработки – вычислительные
средства обработки массивов, позволяющие с помощью
единой команды производить действие сразу над всеми
элементами массивов
Векторный процессор — процессор, в котором
операндами команд могут выступать упорядоченные
массивы данных – векторы.
Два варианта реализации векторного процессора:
1
ВП – основа самостоятельной ВС
2
ВП – дополнительный блок к универсальной
вычислительной машине (системе)
5
6.
Векторно-конвейерные вычислительные системыПример векторной операции
Операция скалярного произведения
3
c a b
ij
k 1
ik
kj
ПРИМЕР: c12 a11 b12 a12 b22 a13 b32
6
7.
Векторно-конвейерные вычислительные системыархитектура средств векторной
обработки
конвейерное АЛУ
массив АЛУ
массив процессорных элементов
7
8.
Векторно-конвейерные вычислительные системыВходные
регистры
8
Конвейерное АЛУ
Память
Выходной
регистр Векторные вычисления с конвейерным АЛУ
Входные
регистры
Массив АЛУ
АЛУ
АЛУ
АЛУ
Память
Выходной
Векторные вычисления с массивом АЛУ
9.
Векторно-конвейерные вычислительные системыУпрощенная структура векторно-конвейерной ВС
9
10.
Матричные вычислительные системы10
Назначение матричных вычислительных систем обработка больших массивов данных
В основе матричных систем лежит матричный процессор,
состоящий
из
регулярного
массива
процессорных
элементов.
ПЭ
ПЭ
ПЭ
ПЭ
ПЭ
ПЭ
ПЭ
ПЭ
ПЭ
ПЭ
ПЭ
ПЭ
ПЭ
ПЭ
ПЭ
ПЭ
11.
Матричные вычислительные системы11
Матричный
процессор
интегрирует
множество
идентичных функциональных блоков (ФБ), логически
объединенных в матрицу и работающих в SIMD-стиле.
ФБ логически скомпонованы в матрицу и работают синхронно, то
есть присутствует только один поток команд для всех
Отличие матричного процессора от векторного
Векторный процессор имеет встроенные команды для
обработки векторов данных, что позволяет эффективно
загрузить конвейер из функциональных блоков.
Векторные процессоры проще использовать, потому что команды
для обработки векторов более удобная для человека модель
программирования, чем SIMD
12.
Матричные вычислительные системы12
Структура матричной SIMD-системы
Шина
результата
Контроллер массива
процессоров
Шина широковещательной
рассылки
Массив
процессорных
элементов
Интерфейс ввода-вывода
Интерфейсная ВМ
Устройство
ввода-вывода
…
Устройство
ввода-вывода
13.
Матричные вычислительные системы13
ЭЛЕМЕНТЫ МАТРИЧНОЙ SIMD-СИСТЕМЫ
Интерфейсная ВМ соединяет матричную SIMD-систему с внешним
миром, используя для этого какой-либо из сетевых интерфейсов
Контроллер массива процессоров выполняет последовательный
программный код, реализует команды ветвления программы,
транслирует команды и сигналы управления в процессорные
элементы
Массив процессоров осуществляет
множественных элементов данных
параллельную
обработку
Интерфейс ввода-вывода обеспечивает ввод-вывод данных через
устройства ввода-вывода
Устройства ввода-вывода предназначены для непосредственного
взаимодействия вычислительной системы с пользователями
14.
Матричные вычислительные системыСтруктура контроллера массива процессоров
14
15.
Матричные вычислительные системыСтруктура массивов процессоров
«процессорный элемент - процессорный элемент»
15
16.
Матричные вычислительные системыСтруктура массивов процессоров
«процессорный элемент - память»
16
17.
Матричные вычислительные системыСхема процессорного элемента
КОМПОНЕНТЫ ПЭ
АЛУ
регистры данных
сетевой интерфейс (СИ)
номер ПЭ
регистр флага
разрешения
маскирования (F)
локальная память
17
18.
Ассоциативные вычислительные системы18
Ассоциативный процессор - процессор, построенный
на базе ассоциативного ЗУ
Ассоциативное ЗУ – устройство, способное хранить
информацию, сравнивать ее с некоторым образцом
(ассоциативным признаком) и указывать на их
соответствие друг другу
Ассоциативная память (ассоциативная матрица) - ЗУ, где
выборка информации осуществляется не по адресу
операнда, а по отличительным признакам операнда
19.
Ассоциативные вычислительные системыСтруктура ассоциативного запоминающего устройства
19
20.
Ассоциативные вычислительные системыКонцепция ассоциативного процессора
20
21.
Ассоциативные вычислительные системыУпрощенная структура ассоциативного процессора
21
22.
Ассоциативные вычислительные системыАссоциативная
ВС
—
многопроцессорная
ВС,
объединяющая множество ассоциативных процессоров,
процессор управления, процессор ввода/вывода и
основную память
ПРОЦЕССОР
ввода-вывода
ПРОЦЕССОР
управления
Основная
память
Каналы передачи данных
Каналы управления
Ассоциативный
процессор
Ассоциативный
процессор
… Ассоциативный
процессор
22
23.
Ассоциативные вычислительные системыКаждое слово (ячейка) ассоциативной памяти имеет свое
собственное устройство обработки данных (сумматор).
Операция осуществляется одновременно всеми ПЭ.
Все или часть элементарных последовательных ПЭ могут
синхронно выполнять операции над всеми ячейками или
над выбранным множеством слов ассоциативной памяти.
Время обработки N m-разрядных слов
в ассоциативной ВС:
N
T m t ( K)
n
t — время цикла ассоциативной памяти;
n — число ячеек ассоциативной системы;
К — коэффициент сложности выполнения элементарной операции
(количество последовательных шагов, каждый из которых связан с
доступом к памяти)
23
24.
Вычислительные системы с систолической структуройПамять
ПЭ
24
Принцип обработки данных в ЭВМ фоннеймановского типа
Принцип обработки данных в ВС с систолической
структурой
Память
ПЭ
ПЭ
ПЭ
Принцип систолических вычислений: данные на пути от
считывания из памяти до возвращения в память
пропускаются через большое число процессорных элементов
25.
Особенности систолических структур25
систолическая структура — однородная вычислительная среда из ПЭ,
совмещающая в себе свойства конвейерной и матричной обработки
вычислительный процесс - непрерывная и регулярная передача данных
1 от одного ПЭ к другому без запоминания промежуточных результатов
вычисления
каждый элемент входных данных выбирается из памяти однократно и
используется необходимое по алгоритму число раз, ввод данных
2
осуществляется в крайние ПЭ матрицы
3
ПЭ систолической структуры однотипны и каждый из них может
быть менее универсальным, чем обычные процессоры
4
потоки данных и управляющих сигналов обладают регулярностью,
позволяя объединять ПЭ локальными связями минимальной длины
алгоритмы функционирования позволяют совместить параллелизм с
5
конвейерной обработкой данных
6
производительность матрицы можно улучшить добавлением в нее ПЭ,
что обеспечит линейное повышение коэффициента ускорения
26.
Классификация систолических структурПО СТЕПЕНИ ГИБКОСТИ
специализированные
алгоритмически
ориентированные
программируемые
ПО ХАРАКТЕРУ ЛОКАЛЬНО-ПРОСТРАНСТВЕННЫХ СВЯЗЕЙ
одномерные
двухмерные
трехмерные
ПО РАЗРЯДНОСТИ ПРОЦЕССОРНЫХ ЭЛЕМЕНТОВ
одноразрядные
многоразрядные
26
27.
Топология систолических структурлинейная
гексагональная
прямоугольная
трехмерная
27
28.
Вычислительные системы с систолической структуройСтруктура процессорного элемента
для прямоугольной
систолической матрицы
для гексагональной
систолической матрицы
28
29.
Учебный вопрос № 1Вычислительные системы класса MIMD
29
30.
Классификация MIMD-системК классу MIMD относятся ВС, в которых множество
независимых процессорных элементов обрабатывают
независимые потоки данных
MIMD-системы
Системы с общей
(разделяемой) памятью
Системы с распределенной
(раздельной) памятью
Симметричные
мультипроцессорные ВС (SMP)
ВС с массовым
параллелизмом (MPP)
ВС c неоднородным
доступом к памяти (NUMA)
Кластерные ВС
30
31.
Многопроцессорные ВС с общей памятью31
ХАРАКТЕРИСТИКА SMP-ВЫЧИСЛИТЕЛЬНОЙ СИСТЕМЫ
1
Имеются два или более процессоров сопоставимой производительности
2
Процессоры совместно используют основную память и работают в едином
виртуальном и физическом адресном пространстве
3
Все процессоры связаны между собой так, что время доступа к памяти любого из
них одинаково
4
Все процессоры разделяют доступ к устройствам ввода/вывода
5
Все процессоры способны выполнять одинаковые функции
6
Любой из процессоров может обслуживать внешние прерывания
ВС управляется интегрированной операционной системой, которая организует и
координирует взаимодействие между процессорами и программами на уровне заданий,
задач, файлов и элементов данных
7
32.
Многопроцессорные ВС с общей памятьюпреимущества SMP-системы
по сравнению с однопроцессорными ЭВМ
ПРОИЗВОДИТЕЛЬНОСТЬ
ГОТОВНОСТЬ
МАСШТАБИРУЕМОСТЬ
32
33.
Многопроцессорные ВС с общей памятьюОрганизация симметричной
мультипроцессорной системы
процессор
процессор
…
процессор
процессор
кэш-память
кэш-память
… кэш-память
кэш-память
коммуникационная система
основная память
система вода/вывода
33
34.
Многопроцессорные ВС с общей памятьюОрганизация симметричной мультипроцессорной системы
с совместно используемой кэш-памятью
процессор
процессор
…
процессор
процессор
кэш-память
коммуникационная система
основная память
система вода/вывода
34
35.
Многопроцессорные ВС с общей памятьюОрганизация SMP-системы c общей шиной
процессор
процессор
…
кэш-память
кэш-память
…
процессор
процессор
кэш-память
кэш-память
общая шина
основная память
система вода/вывода
35
36.
Многопроцессорные ВС с общей памятьюСтруктура SMP-системы на базе МП «Pentium III»
36
37.
Многопроцессорные ВС с общей памятьюСтруктура SMP-системы с коммутатором типа «кроссбар»
37
38.
Многопроцессорные ВС с общей памятьюМногопроцессорный вычислительный комплекс «Эльбрус-2»
38
39.
Многопроцессорные ВС с общей памятьюСтруктура вычислительного комплекса «Эльбрус-3М1»
39
40.
Многопроцессорные ВС с общей памятьюЧетырехпроцессорная вычислительная система на базе
микросхем «МЦСТ-R1000»
40
41.
Многомашинные ВС…
сетевой адаптер
процессор
УВВ
процессор
память
кэш-память
УВВ
память
кэш-память
41
сетевой адаптер
Сеть обмена сообщениями
сетевой адаптер
процессор
сетевой адаптер
Структура MPP-вычислительной системы
УВВ
…
память
процессор
кэш-память
УВВ
память
кэш-память
42.
Многомашинные ВС42
Характерная черта МРР-систем — наличие единственного управляющего
устройства (процессора), распределяющего задания между множеством
подчиненных ему устройств
ХАРАКТЕРИСТИКА МPP-ВЫЧИСЛИТЕЛЬНОЙ СИСТЕМЫ
1
стандартные микропроцессоры
2
физически распределенная память
3
сеть соединений с высокой пропускной способностью и
малыми задержками
4
хорошая масштабируемость (до тысяч процессоров)
5
асинхронная MIMD-система с пересылкой сообщений
6
программа представляет собой множество процессов,
имеющих отдельные адресные пространства
43.
Многомашинные ВССХЕМА ВЗАИМОДЕЙСТВИЯ MPP-СИСТЕМЫ
центральное управляющее устройство формирует очередь заданий,
каждому из которых назначается некоторый уровень приоритета
по мере освобождения подчиненных устройств им передаются
задания из очереди
подчиненные устройства оповещают центральный процессор о ходе
выполнения задания (о завершении выполнения, о потребности в
дополнительных ресурсах и т.д.)
центральное устройство контролирует работу подчиненных
процессоров (в том числе для обнаружения нештатных ситуаций,
прерывания выполнения задания в случае появления более
приоритетной задачи и т. п).
43
44.
Многомашинные ВССтруктура МРР – системы RM 1000
44
45.
Многомашинные ВС45
ХАРАКТЕРИСТИКИ МРР-СИСТЕМ
Модель
Тип МП
Орг-ция
соединений
Intel
Paragon
I860
Двухмерная
решетка
IBM
SP2
PowerPC
604e
Коммутатор
Cray
Cray T3D
DEC Alpha
Трехмерный
тор
Орг-ция
хостпамяти компьютер
распределенная
Фирма
нет
нет
есть
Благодаря хорошей масштабируемости МРР-системы – лидеры
среди ВС по достигнутой производительности
46.
ВС с неоднородным доступом к памятиВС с неоднородным доступом к памяти (NUMA-система) –
вычислительная система, в которой каждый узел владеет
собственной основной памятью, но с точки зрения
процессоров имеет место глобальная адресуемая память,
где каждая ячейка любой локальной основной памяти
имеет уникальный системный адрес
46
47.
ВС с неоднородным доступом к памятиХАРАКТЕРИСТИКА NUMA-СИСТЕМЫ
Память является физически распределенной по различным частям
системы, но логически разделяемой, так что пользователь видит
1
единое адресное пространство
Система состоит из объединеных с помощью высокоскоростного
коммутатора однородных базовых модулей, содержащих небольшое
2
число процессоров и блок памяти
Доступ к локальной памяти осуществляется в несколько раз быстрее,
чем к удаленной
3
По существу архитектура NUMA является MPP
архитектурой, где в качестве отдельных вычислительных
элементов используются SMP узлы
47
48.
ВС с неоднородным доступом к памятиАрхитектура cc-NUMA (Cache Coherent Non-Uniform Memory Access) "неоднородный доступ к памяти с обеспечением когерентности кэшей"
Когерентность памяти — свойство компьютерных систем, в
которых два или более процессора имеют доступ к общей области
памяти
Процессор 1
Процессор 2
кэш-память
кэш-память
оперативная память
Архитектура ccNUMA поддерживает когерентность кэш памяти внутри
узла аппаратно, т.е. не требуется никакого программного обеспечения
для поддержки актуальности множества копий данных
48
49.
Кластерные вычислительные системыКластер – группа соединенных между собой и
координируемых вычислительных систем (узлов),
совместно выполняющих общий набор приложений,
которая воспринимается клиентами и приложениями как
единая система
УЗЛЫ КЛАСТЕРА
ЭВМ
SMP-система
MPP-система
Цели создания кластера
обеспечение высокой
доступности информации
за счет резервирования
ресурсов
ИЛИ
обеспечение высокой
производительности за
счет распараллеливания
процесса решения сложной
вычислительной задачи
49
50.
Кластерные вычислительные системыПРЕИМУЩЕСТВА КЛАСТЕРОВ
Абсолютная
масштабируемость
Наращиваемая
масштабируемость
Высокий коэффициент
готовности
Отличное соотношение
«цена/производительность»
50
51.
Кластерные вычислительные системыКАТЕГОРИИ КЛАСТЕРОВ (по назначению)
Кластеры высокой готовности
(High-Availability Clusters – HA-кластеры)
Кластеры балансировки нагрузки
(Load-Balancing Clusters – LB-кластеры)
Кластеры высокой производительности
(High Performance Computing Clusters – HPC-кластеры)
51
52.
Отказоустойчивый кластер52
Кластеры
высокой
готовности
(High-Availability
Clusters
–
HA-кластеры),
или
отказоустойчивые,
применяются для того, чтобы не допустить прекращения
обслуживания в случае выхода из строя основного сервера
53.
Кластер балансировки нагрузки53
Кластеры
балансировки
нагрузки
(LB-кластеры)
обеспечивают эффективное использование
ресурсов
вычислительной системы за счет перенаправления запросов
в случае высоких нагрузок на наименее загруженные
серверы
54.
Кластер высокой производительности54
Кластеры
высокой
производительности
(HPCкластеры) применяются для организации вычислений с
высокой масштабируемостью и использованием всех
процессорных мощностей для решения одной задачи,
которая должна быть способна распараллеливаться
55.
Кластерные вычислительные системыСтруктура вычислительного кластера Нижегородского университета
55
56.
Задание на самостоятельную работуЗадание:
1. Повторить материал лекции по конспекту
2. Изучить рекомендованную литературу [3, с. 56-92],
[4, с.98-105, 526-577, 600-606],
Ответить на следующие вопросы:
•какие типы ВС относят к классам SIMD и MIMD?
•для каких типов ВС характерна разделенная и
разделяемая память?
•к какому типу ВС относиться современная ПЭВМ?
56