
Insufficient memory bandwidth on Stencil code: the advantage of a vector dataflow processor
Author(s) -
Николай Иванович Дикарев,
B. M. Shabanov,
Александр Сергеевич Шмелёв
Publication year - 2018
Publication title -
programmnye sistemy: teoriâ i priloženiâ
Language(s) - Russian
Resource type - Journals
ISSN - 2079-3316
DOI - 10.25209/2079-3316-2018-9-4-399-415
Subject(s) - stencil , dataflow , computer science , parallel computing , code (set theory) , bandwidth (computing) , computer architecture , programming language , computational science , telecommunications , set (abstract data type)
Основным фактором, ограничивающим производительность большинства приложений для высокопроизводительных вычислительных систем, является недостаточная пропускная способность памяти, а не недостаточная вычислительная мощность. Программными методами преодоления этого недостатка являются блочные методы, локализующие обращения в пределах быстрой памяти на процессорном кристалле, и «программная конвейеризация» по организации вычислений в виде цепочек арифметических команд между командами обращения к памяти. На примере программ 2D и 3D Stencil показано, что использование «программной конвейеризации» в разрабатываемом векторном процессоре с архитектурой управления потоком данных позволяет достичь значительно более высокой производительности по сравнению с лучшими процессорами традиционной архитектуры.