Этот подход позволяет создавать компьютеры,
Этот подход позволяет создавать компьютеры, включающие в себя тысячи процессоров.
Но эта архитектура имеет 2 существенных недостатка:
- требуется быстродействующее коммуникационное оборудование, обеспечивающее среду передачи сообщений;
- при создании программ необходимо учитывать топологию системы и специальным образом распределять данные между процессорами, чтобы минимизировать число пересылок и объем пересылаемых данных.
Последнее обстоятельство и мешает широкому внедрению подобных архитектур.
К данному классу можно отнести компьютеры Intel Paragon, IBM SP1, Parsytec, IBM SP2 и CRAY T3D.
Компьютеры Cray T3D и T3E используют единое адресное пространство (общая виртуальная память) (см. рис. 11.1). По аппаратному прерыванию особого случая адресации ОС выполняет пересылку страницы с одного узла на другой. У каждого МП своя локальная память, но единое виртуальное адресное пространство.
Рис. 11.1. Структура супер-ЭВМ Cray T3D
Факторы, снижающие производительность параллельных компьютеров:
- Закон Амдала.
В табл. 11.1 показано, на какое максимальное ускорение работы программы можно рассчитывать в зависимости от доли последовательных вычислений и числа доступных процессоров.
Таблица 11.1. Число ПЭДоля последовательных вычислений
50%25%10%5%2%
2 | 1,33 | 1,60 | 1,82 | 1,90 | 1,96 |
8 | 1,78 | 2,91 | 4,71 | 5,93 | 7,02 |
32 | 1,94 | 3,66 | 7,80 | 12,55 | 19,75 |
512 | 1,99 | 3,97 | 9,83 | 19,28 | 45,63 |
2048 | 2,00 | 3,99 | 9,96 | 19,82 | 48,83 |
- Время инициализации посылки сообщения (латентность) и время передачи сообщения по сети.
Максимальная скорость передачи достигается на больших сообщениях, когда латентность, возникающая лишь вначале, не столь заметна на фоне непосредственно передачи данных.
- Возможность асинхронной посылки сообщений и вычислений.
Если или аппаратура, или программное обеспечение не поддерживают возможности проводить вычисления на фоне пересылок, то возникнут неизбежные накладные расходы, связанные с ожиданием полного завершения взаимодействия параллельных процессов.
- Неравномерная загрузка всех процессорных элементов.
Содержание Назад Вперед