Недостаточная пропускная способность памяти на программе Stencil: преимущество векторного потокового процессора

Автор: Дикарев Николай Иванович, Шабанов Борис Михайлович, Шмелв Александр Сергеевич

Журнал: Программные системы: теория и приложения @programmnye-sistemy

Рубрика: Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем

Статья в выпуске: 4 (39) т.9, 2018 года.

Бесплатный доступ

Основным фактором, ограничивающим производительность большинства приложений для высокопроизводительных вычислительных систем, является недостаточная пропускная способность памяти, а не недостаточная вычислительная мощность. Программными методами преодоления этого недостатка являются блочные методы, локализующие обращения в пределах быстрой памяти на процессорном кристалле, и «программная конвейеризация» по организации вычислений в виде цепочек арифметических команд между командами обращения к памяти. На примере программ 2D и 3D Stencil показано, что использование «программной конвейеризации» в разрабатываемом векторном процессоре с архитектурой управления потоком данных позволяет достичь значительно более высокой производительности по сравнению с лучшими процессорами традиционной архитектуры.

Еще

Архитектура управления потоком данных, векторный процессор, многопроцессорная система с общей памятью, оценка производительности

Короткий адрес: https://sciup.org/143166181

IDR: 143166181

Список литературы Недостаточная пропускная способность памяти на программе Stencil: преимущество векторного потокового процессора

  • Stencil code, From Wikipedia, the free encyclopedia.
  • J. Peraza, A. Tiwari, M. Laurenzano, L. Carrington, W. A. Ward, R. Campbell. "Understanding the performance of stencil computations on Intel's Xeon Phi", 2013 IEEE International Conference on Cluster Computing (CLUSTER) (23-27 Sept. 2013, Indianapolis, IN, USA).
  • B. Wah (ed.). "Dataflow Computers: Their History and Future", Wiley Encyclopedia of Computer Science and Engineering, John Wiley & Sons, Inc., 2008.
  • Н. И. Дикарев, Б. М. Шабанов, А. С. Шмелёв. Векторный потоковый процессор: оценка производительности//Известия ЮФУ. Технические науки, 2014, №12(161), Тематический выпуск: Суперкомпьютерные технологии. С. 36-46.
  • Н. И. Дикарев, Б. М. Шабанов, А. С. Шмелёв. Выбор оптимальной производительности ядра векторного потокового процессора//Суперкомпьютерные технологии, Материалы 4-й Всероссийской научно-технической конференции СКТ-2016, в 2 т.. Т. 1 (19-24 сентября 2016 г., Дивноморское, Россия), Изд-во ЮФУ, Ростов-на-Дону, 2016. С. 36-41.
  • Н. И. Дикарев, Б. М. Шабанов, А. С. Шмелёв. Моделирование параллельной работы ядер векторного потокового процессора с общей памятью//Программные системы: теория и приложения, Т. 9, № 1(36). 2018. С. 37-52.
Еще
Статья научная