Программное и аппаратное обеспечение для супер ЭВМ. Рубрика в журнале - Программные системы: теория и приложения

Публикации в рубрике (34): Программное и аппаратное обеспечение для супер ЭВМ
все рубрики
Погружная система охлаждения реконфигурируемых вычислительных систем на основе ПЛИС

Погружная система охлаждения реконфигурируемых вычислительных систем на основе ПЛИС

Левин Илья Израилевич, Дордопуло Алексей Игоревич, Доронченко Юрий Иванович, Раскладкин Максим Константинович, Федоров Александр Михайлович

Ред. заметка

В статье проанализированы проблемы построения перспективных реконфигурируемых вычислительных систем c жидкостным охлаждением для программируемых логических интегральных схем семейства Xilinx Virtex UltraScale. Подробно рассматриваются архитектура, компоновка и сравнительные технические характеристики систем погружного жидкостного охлаждения. Приводятся результаты расчетов, макетирования и экспериментальной проверки основных технических решений созданного энергоэффективного вычислительного модуля нового поколения для построения высокопроизводительных вычислительных систем с жидкостным охлаждением с производительностью 1 Пфлопс в стандартном вычислительном шкафу высотой 47U при потребляемой мощности 150 кВт. Разработанные решения обладают резервом мощности для выпускаемых и проектируемых семейств ПЛИС, нечувствительностью к протечкам и их последствиям и совместимостью с традиционными системами водяного охлаждения на базе промышленных чиллеров

Бесплатно

Построение и анализ модели процесса работы с двумя деками, двигающимися друг за другом в общей памяти

Построение и анализ модели процесса работы с двумя деками, двигающимися друг за другом в общей памяти

Барковский Евгений Александрович, Лазутина Анна Александровна, Соколов Андрей Владимирович

Статья научная

В work-stealing балансировщиках параллельных задач, каждое ядро имеет свой буфер задач-дек (англ. deque). Владелец дека использует один конец для добавления и извлечения задач, а из второго конца задачи перехватываются другими ядрами. В статье анализируются два метода представления деков: один из распространенных методов-раздельное последовательное циклическое представление деков; и новый предложенный нами метод, где общая память для деков заранее не делится и они двигаются друг за другом по кругу. Ранее эти методы анализировались нами для представления FIFO-очередей в сетевых приложениях, где для некоторых значений параметров системы метод «Друг за другом» давал лучший результат.Целью исследования является построение и анализ модели процесса работы с двумя последовательными деками, когда они двигаются друг за другом по кругу в общей памяти. Математическую модель мы будем строить как случайное блуждание по целым точкам в пирамиде. Имитационная модель строится с помощью метода Монте-Карло. Используемая стратегия work-stealing-перехват одного элемента. Предложены математическая и имитационная модели данного процесса и проведены численные эксперименты.

Бесплатно

Преимущества и недостатки использования метода векторов указателей в векторном потоковом процессоре

Преимущества и недостатки использования метода векторов указателей в векторном потоковом процессоре

Дикарев Николай Иванович, Шабанов Борис Михайлович, Шмелв Александр Сергеевич

Статья научная

Статья посвящена анализу выполнения программы быстрой сортировки (QS) в векторном процессоре с архитектурой управления потоком данных, в котором для хранения массивов используется метод векторов/указателей. Анализируется выявленный на программе QS недостаток хранения массивов с помощью векторов указателей и предложен способ решения этого недостатка введением команд split и fuse в систему команд процессора. Несмотря на значительное усложнение графа и числа выполняемых команд в программе QS, введение в систему команд ВПП новых команд split и fuse позволило достичь на этой программе до 7.4 раз более высокой производительности по сравнению с процессорным ядром Intel Skylake.

Бесплатно

Преобразования программ - фундаментальная основа создания оптимизирующих распараллеливающих компиляторов

Преобразования программ - фундаментальная основа создания оптимизирующих распараллеливающих компиляторов

Штейнберг Борис Яковлевич, Штейнберг Олег Борисович

Статья обзорная

В работе рассматриваются преобразования программ, приводящие к ускорению. Приводятся публикации о различных параллельных вычислительных архитектурах и инструментах разработки эффективных программ для них. Рассматривается сочетание распараллеливания и оптимизации доступа к модулям памяти разного уровня. Отмечается, что отставание автоматической оптимизации программ от потребностей новых архитектур сдерживает развитие новых перспективных вычислительных систем. Формулируются задачи развития теории преобразования программ и оптимизирующих (распараллеливающих) компиляторов, которые могли бы привести к существенному повышению производительности труда программистов. Статья обосновывает призыв к модернизации оптимизирующей компиляции.

Бесплатно

Принципы организации системы ввода/ вывода параллельной потоковой вычислительной системы

Принципы организации системы ввода/ вывода параллельной потоковой вычислительной системы

Змеев Дмитрий Николаевич, Левченко Николай Николаевич, Окунев Анатолий Семенович, Стемпковский Александр Леонидович

Статья научная

В статье рассматриваются основные принципы работы блока ввода/вывода данных параллельной потоковой вычислительной системы «Буран», приводится анализ влияния различных алгоритмов ввода данных на эффективность решения задач. Описываются средства, позволяющие уменьшать необходимый размер ассоциативной памяти ключей и анализируются результаты экспериментов на программной модели параллельной потоковой вычислительной системы. Ключевые слова и фразы: блок ввода/вывода, алгоритмы ввода данных, ассоциативная память, параллельная потоковая вычислительная система

Бесплатно

Программа анализа геномного распределения хромосомных контактов в ядре клетки по данным, полученным по технологиям ChIA-PET и Hi-C

Программа анализа геномного распределения хромосомных контактов в ядре клетки по данным, полученным по технологиям ChIA-PET и Hi-C

Кулакова Екатерина Викторовна, Спицина Анастасия Михайловна, Богомолов Антон Геннадьевич, Орлова Нина Геннадьевна, Дергилев Артур Игоревич, Чадаева Ирина Витальевна, Бабенко Владимир Николаевич, Орлов Юрий Львович

Ред. заметка

В связи с ростом объемов данных геномики о положении сайтов связывания транскрипционных факторов, хромосомных контактах, аннотации геномных характеристик, полученных с помощью современных технологий секвенирования, растет потребность в разработке нового программного обеспечения для их статистической обработки и анализа. Рассмотрены технологии получения и программы анализа геномных данных секвенирования на основе технологий ChIA-PET и Hi-C. Представлена разработанная компьютерная программа для обработки геномных данных о хромосомных контактах и их функциональной аннотации

Бесплатно

Разработка системы автоматического управления погружным жидкостным охлаждением высокопроизводительных вычислительных комплексов

Разработка системы автоматического управления погружным жидкостным охлаждением высокопроизводительных вычислительных комплексов

Амелькин Сергей Анатольевич, Карпеш Сергей Валерьевич, Клементьев Алексей Дмитриевич, Петров Алексей Анатольевич

Статья научная

Рассмотрены задачи алгоритмического и аппаратнопрограммного обеспечения системы управления погружным жидкостным охлаждением высокопроизводительных вычислительных комплексов. Система управления решает задачу минимизации энергопотребления при ограничении на максимальную допустимую температуру тепловыделяющих компонентов вычислительных комплексов. Предложено решение задачи минимизации энергопотребления, получены условия оптимальности. Выбрано аппаратное обеспечение, разработан контроллер, позволяющий обработать необходимое количество сигналов цифровых термометров

Бесплатно

Реализация t-системы с открытой архитектурой для CUDA-устройств с поддержкой динамического параллелизма и для гибридных суперЭВМ на их основе

Реализация t-системы с открытой архитектурой для CUDA-устройств с поддержкой динамического параллелизма и для гибридных суперЭВМ на их основе

Роганов Владимир Александрович, Кузнецов Антон Александрович, Матвеев Герман Анатольевич, Осипов Валерий Иванович

Статья научная

В работе изложены основные принципы реализации расширения T-системы с открытой архитектурой (OpenTS), которое распространяет парадигму программирования T++ на аппаратуру современных спецвычислителей с поддержкой технологии CUDA. Специализированная версия T-надстройки, реализованная в микроядре системы OpenTS, способна работать автономно внутри CUDA-устройства, фактически превращая его в полноценный интеллектуальный T-узел гибридной суперЭВМ. В сочетании с поддержкой динамического параллелизма новейшими CUDA-устройствами это помогает существенно поднять процент утилизации графических ускорителей (GPU) без ручной балансировки статически распараллеленных блоков программы. Универсальная логика распараллеливания в T-системе теперь способна порождать и запускать легковесные счетные гранулы, избегая потерь, возникающих при интенсивном взаимодействии GPU с процессами базовой кластерной ОС. Спектр прикладных задач, которые подходят для новой модели вычислений, существенно пополняет привычные вычислительные ядра для GPU, привнося произвольную управляющую логику на уровень спецвычислителей. В качестве демонстрационного примера в статье рассматривается задача обращения криптостойких хэш-функций. Приведены базовые сведения, связанные с прикладными вопросами применения хэш-функций.

Бесплатно

Самомаршрутизируемая неблокируемая системная сеть с прямыми каналами: сложность и быстродействие

Самомаршрутизируемая неблокируемая системная сеть с прямыми каналами: сложность и быстродействие

Подлазов Виктор Сергеевич

Статья научная

Разработана неблокируемая самомаршрутизируемая сеть с прямыми каналами, в которой конфликты пакетов разрешаются на входе в сеть посредством процедуры борьбы источников за вход в первый каскад сети, обеспечивая пакетную дуальность. Заблокированные при борьбе пакеты повторно передаются источниками с минимальными задержками. Дуальность подразумевает совместное использование шинного (с разведением во времени) и мультиплексного (с разведением по каналам) способов разрешения конфликтов пакетов. Внутри сети возникновение конфликтов предупреждается посредством ее внутреннего распараллеливания, т.е. созданием заведомо бесконфликтных путей. Сеть разработана в 2-, 4-, и 8-каскадном вариантах с масштабированием числа каналов от нескольких сот до многих миллионов при неизменном быстродействии сети. В сети возможно обеспечение 1-, или 2-канальной отказоустойчивости при сохранении ее быстродействия. Накладными затратами на достижение указанных свойств является повышенная сложность сети, которая сопоставима со сложностью теоретического неблокируемого коммутатора Клоза. Хотя его структура известна, но практическая реализация отсутствует вследствие неизвестности процедуры параллельной самомаршрутизации в нем. Практическая ориентация предложенных сетей - это системные сети с передачей маршрутной информации в заголовках пакетов с однократным использованием в каждом каскаде управляющей маршрутной информации для базового полного коммутатора. Предложенные сети выполнены в расширенном схемном базисе, состоящем из полных коммутаторов и отдельных мультиплексоров и демультиплексоров. В работе представлены характеристики построенных сетей при указанном способе представления маршрутной информации.

Бесплатно

Синхронное выполнение групповых операций в распределенных компонентах суперкомпьютеров и компьютерных кластерах

Синхронное выполнение групповых операций в распределенных компонентах суперкомпьютеров и компьютерных кластерах

Стецюра Геннадий Георгиевич

Статья научная

В статье предлагаются децентрализованные процессы синхронизации действий распределенной группы активных компонентов (объектов) в суперкомпьютерах и компьютерных кластерах, ускоряющие их синхронный переход в заданные состояния и воздействие на внешнюю среду. Объектам не задается значение момента времени перехода. Им известен только факт появления совокупности событий, требующих наиболее быстрого перехода всех объектов в новое состояние. Для синхронизации объекты обмениваются оптическими сигналами по беспроводным каналам связи через ретранслятор оптических сигналов, объединяющий группы объектов. Синхронизация ускоряется за счет применения групповых операций, каждая из которых одновременно получает и обрабатывает данные группы распределенных объектов. Такая обработка выполняется групповыми операциями при передаче данных объектами, не увеличивая это время. Причем время обработки не зависит от количества данных, одновременно обрабатываемых операцией. Групповые операции выполняются в ретрансляторе, не содержащем вычислительных средств. В целом решения статьи ускоряют при возникновении непредвиденных событий переход асинхронно действующих распределенных объектов в заданное синхронное состояние. Такая возможность наиболее востребована для систем, работающих в режиме жесткого реального времени.

Бесплатно

Специализатор JaSpe: алгоритм внутрипроцедурного анализа времени связывания программ на подмножестве языка Java

Специализатор JaSpe: алгоритм внутрипроцедурного анализа времени связывания программ на подмножестве языка Java

Адамович Игорь Алексеевич, Климов Юрий Андреевич

Статья научная

Анализ времени связывания в частичных вычислениях, нацеленных на оптимизацию программ, разделяет программные конструкции на статические и динамические. Статические конструкции исполняются специализатором, а динамические переходят в результирующую программу. Частичные вычисления применяются в основном для нетривиальной компиляции программ без компилятора, при наличии лишь интерпретатора и специализатора. Эффективность их существенно зависит от качества разметки программы, получаемой в результате анализа времени связывания.Статья посвящена особенностям алгоритма анализа времени связывания специализатора JaSpe, разрабатываемого авторами данной публикации для широко распространенного объектно-ориентированного языка Java. Она содержит основные понятия, использованные при реализации анализа времени связывания, внутрипроцедурную версию алгоритма и обсуждение деталей анализа конструкций, использующих ссылочные типы данных.Алгоритм отличается от предшествующих аналогов, из числа работающих с программами на объектно-ориентированных языках, нетривиальной обработкой конструкций ветвления (if, switch), циклов (for, while, do) и блочных инструкции, которые содержат последовательность других инструкций...

Бесплатно

Текущее состояние и перспективы развития центра коллективного пользования «Дальневосточный вычислительный ресурс»

Текущее состояние и перспективы развития центра коллективного пользования «Дальневосточный вычислительный ресурс»

Харитонов Дмитрий Иванович, Тарасов Георгий Витальевич, Леонтьев Денис Васильевич, Парахин Роман Валерьевич, Грибова Валерия Викторовна

Ред. заметка

В работе дается краткий обзор истории развития центра коллективного пользования «Дальневосточный Вычислительный Ресурс», созданного при Институте автоматики и процессов управления ДВО РАН (ЦКП ДВВР). Описаны текущие вычислительные ресурсы и статистика их использования. Рассматриваются примеры решаемых прикладных задач, проводимых различными учреждениями ДВО РАН на оборудовании ЦКП. Обозначены планы развития центра на ближайшее будущее

Бесплатно

Эффективность использования сопроцессоров NVIDIA для моделирования поведения носителей заряда в графене

Эффективность использования сопроцессоров NVIDIA для моделирования поведения носителей заряда в графене

Маханьков Алексей Владимирович, Кузнецов Максим Олегович, Панферов Анатолий Дмитриевич

Статья научная

В развитии суперкомпьютерных технологий важную роль играют специализированные аппаратные решения. В настоящее время большинство вычислительных систем максимальной производительности используют математические сопроцессоры различных типов. По этой причине при разработке прикладных программных решений, рассчитанных на реализацию потенциала современных вычислительных платформ, необходимо обеспечить эффективное использование аппаратных ускорителей. В ходе работы над программной системой для моделирования поведения носителей заряда в графене необходимо было решить задачу поддержки ею таких ускорителей и исследовать эффективность полученного решения. С учётом текущей ситуации и перспективы ближайших лет выбор был сделан в пользу ускорителей NVIDIA и программной технологии CUDA. В силу того, что аппаратная архитектура ускорителей NVIDIA имеет принципиальные отличия от архитектуры CPU, а адаптированные для CUDA математические библиотеки не поддерживают весь спектр алгоритмов, использовавшихся в исходной версии программы, потребовалось найти новые решения и оценить их эффективность. В работе представлены особенности реализации поддержки CUDA и результаты сравнительного тестирования полученного решения на примере задачи с реалистическими характеристиками.

Бесплатно

Язык программирования AJL: автоматическое динамическое распараллеливание для платформы JVM

Язык программирования AJL: автоматическое динамическое распараллеливание для платформы JVM

Адамович Алексей Игоревич

Ред. заметка

Нынешнее состояние программного обеспечения и аппаратных средств широкого применения настойчиво требует развития инструментов параллельного программирования на основе языка Java. В ИПС им. А.К. Айламазяна РАН выполнена реализация языка Ajl, являющегося расширением языка Java и предназначенного для разработки параллельных программ на основе использования вычислительной модели «самотрансформация вычисляемой сети». В данной публикации рассматриваются различные аспекты выполненной работы — от синтаксиса и семантики конструкций языка и методов разработки транслятора до реализации базовых понятий использованной модели вычислений. Описывается экспериментальное исследование выполненной реализации и обсуждаются его результаты. В заключение приводится краткий обзор близких работ

Бесплатно

Журнал