77346

МЕТОДЫ РАСПРЕДЕЛЁННЫХ ВЫЧИСЛЕНИЙ НА ОСНОВЕ МОДЕЛИ ПОТОКА ДАННЫХ. ПРОТОТИП СИСТЕМЫ

Научная статья

Информатика, кибернетика и программирование

Ему необходимо заботиться о распределении вычислительных задач синхронизации обмене данными и так далее. С другой стороны создаются среды для решения определённых классов задач в основном это касается задач для которых применим параллелизм по данным. Методика базируется на понятиях хранилища задач и правил. Задачей называется программа которая во время исполнения считывает данные с определёнными именами из хранилища и в результате своего исполнения формирует новые данные которые записываются в хранилище.

Русский

2015-02-02

21.5 KB

0 чел.

МЕТОДЫ РАСПРЕДЕЛЁННЫХ ВЫЧИСЛЕНИЙ НА ОСНОВЕ МОДЕЛИ ПОТОКА ДАННЫХ. ПРОТОТИП СИСТЕМЫ.

М.О. Бахтерев, П.А. Васёв

ИММ УрО РАН, Екатеринбург 

Популярные средства параллельного программирования, такие как MPI и OpenMP, требуют от программиста подробного описания большого количества сущностей. Ему необходимо заботиться о распределении вычислительных задач, синхронизации, обмене  данными и так далее. Существуют различные подходы к упрощению процесса программирования и исполнения параллельных вычислений. С одной стороны, создаются универсальные средства автоматического распараллеливания программ (как для исполнения в системах с общей памятью, так и в многомашинных конфигурациях). С другой стороны, создаются среды для решения определённых классов задач (в основном это касается задач, для которых применим параллелизм «по данным»). Также разрабатываются универсальные инструменты, пытающиеся упростить технические аспекты процесса программирования параллельных и распределённых систем.

Иногда при создании подобных средств разработчики пытаются использовать нестандартные парадигмы вычислений. Одной из таких парадигм является поток данных – Dataflow [1]. В различных вариантах методики, основанные на парадигме потока данных, применяются для создания процессорных архитектур, суперкомпьютеров в целом, для программной организации вычислительных потоков в рамках одного процесса и взаимодействия процессов в распределённой вычислительной среде.

В настоящей работе описывается разработанная авторами методика и технические средства для программирования в параллельных распределённых средах. Методика основана на анализе различных, в том числе и собственных, моделей потока данных. Цель данной разработки – упростить процесс создания параллельных программ, и сделать это не в ущерб эффективности исполнения вычислительных кодов. Предлагаемая методика вычислений возникла в результате продолжительной теоретической работы над архитектурой операционной системы для распределённых вычислений [2].

Методика базируется на понятиях хранилища, задач и правил. Хранилище содержит в себе именованные данные, по отношению к которым доступны три операции – запись (создание), чтение и удаление. Хранимые данные являются самодостаточными - это не очереди, но некие единицы информации с уникальными именами. Задачей называется программа, которая во время исполнения считывает данные с определёнными именами из хранилища и в результате своего исполнения формирует новые данные, которые записываются в хранилище. Правилом называется такая конструкция, которая определяет условия и параметры запуска задач. Правило содержит в себе:

  1.  Список имён данных, которые необходимы для выполнения задачи.
  2.  Список соответствия глобальных имён данных (находящихся в хранилище) локальным именам (с которыми и будет работать задача).
  3.  Список задач (программ), которые необходимо запустить.
  4.  Действия, совершаемые в случае успешного выполнения задач (3).

Правило считается готовым к исполнению, когда в хранилище присутствуют все данные c именами из списка (1). После успешного исполнения правило удаляется из списка выполняемых правил.

Процесс программирования и проведения вычислений происходит следующим образом. Прежде всего, разрабатываются программные коды задач. При этом в рамках одного вычисления могут использоваться любые комбинации языков, а также целевых аппаратных сред. Например, часть задач можно реализовать на графических ускорителях. Затем, формируется файл инициализации, в котором описываются начальные правила системы. В дальнейшем эти правила могут дополняться – при выполнении задачах или  завершающих действий других правил. Кроме правил, в файле инициализации указываются начальные данные, которые помещаются в хранилище.

После подачи команды на запуск вычислительная среда ищет правила, готовые к исполнению, и запускает указанные в них задачи на подходящих свободных вычислительных ресурсах. В результате часть правил исполняется, формируя новые данные и освобождая ресурсы для других правил. Среда продолжает поиск и выполнение правил вплоть до исчерпания всех правил, приостановки работы с внешней стороны или выявления ошибки.

Предлагаемая методика позволяет достаточно просто и эффективно реализовать проведение вычислительного эксперимента на гибридных архитектурах, динамическое изменение количества вычислительных узлов во время самого вычисления, работу в глобально-распределённых условиях, автоматическое создание контрольных точек, приостановку и продолжение вычисления прозрачным для программиста образом, использование распределённые хранилищ данных, а также обеспечивает ряд других преимуществ.

На основе предложенной методики авторами в рамках проекта RIDE разрабатывается прототип среды параллельного программирования. Первые версии показывают реализуемость предлагаемых идей и лаконичность программных конструкций для описания правил. Можно надеяться, что в результате развития этой среды удастся достичь главной цели – сделать процесс создания распределённых вычислительных программ более простым и эффективным.

Список литературы.

  1.  Dennis J., Data Flow Supercomputers // Computer, Vol.13, No.11, pp.48-56, 1980.
  2.  Бахтерев М.О., Описание параллельных вычислений при помощи замыканий // Тезисы 10-го Международного семинара "Супервычисления и Математическое моделирование", РФЯЦ-ВНИИЭФ, Саров, с. 31-32, 2008.


 

А также другие работы, которые могут Вас заинтересовать

68601. Обработка одномерных массивов. Организация ввода-вывода и обработки массива 43 KB
  Освоение способов описания массива, приобретение навыков организации ввода-вывода и обработки массива. Выполнение работы: в соответствии с вариантом составить и реализовать программы. Задание I Даны два массива разных размеров. Определить, какие элементы первого массива и сколько раз встречаются во втором массиве.
68602. Рулевое управление грузовых автомобилей с встроенным гидроусилителем 57.59 KB
  1 Усилитель тормозного привода 2 Крышка со встроенным контактом предупредительного сигнала при аварийном падении уровня тормозной жидкости F34 3 Бачок для тормозной жидкости гидравлического тормозного привода 4 Уплотнительное кольцо 5 Гайка самоконтрящаяся 20 Нм6 Штифт 7 Главный тормозной цилиндр...
68603. Рулевое управление грузовых авто с отдельно-расположенным ГУР 81.25 KB
  Конструктивные особенности Распределитель состоит из корпуса 13 и золотника 30. На внутренней поверхности корпуса золотника имеются три кольцевые канавки. Корпус золотника прикреплен к фланцу корпуса 6 шарниров. Буртик в крайних положениях упирается в торец корпуса 13 распределителя и в торец корпуса...
68604. Тормозные механизмы 64.22 KB
  Барабанный тормозной механизм состоит из следующих основных компонентов рис. Тормозной щит жестким креплением монтируется на колесной балке; на щите закреплен рабочий тормозной цилиндр. Несколько иную конструкцию имеет дисковый тормозной механизм. тормозной диск; тормозной суппорт...
68605. Информационные ресурсы. Образовательные информационные ресурсы 16.35 KB
  Образовательные информационные ресурсы. Научиться находить и использовать необходимые образовательные ресурсы по специальности. Национальные информационные ресурсы: проблемы промышленной эксплуатации.
68606. Вимірювання фізичних величин і обробка експериментальных даних 344.5 KB
  Фізичний практикум передбачає засвоєння курсантами методів фізичного дослідження вміння користуватися основними вимірювальним приладами знання основних прийомів і способів вимірювань обробки і інтерпретації експериментально отриманих даних. Види вимірювань Основним способом отримання...
68607. Исследование генераторов постоянного тока 113 KB
  Цель работы Приобретение практических навыков работы с генератором постоянного тока ГПТ и исследование основных характеристик ГПТ. Снятие внешних характеристик ГПТ при независимом и параллельном возбуждении. Снятие регулировочных характеристик ГПТ при независимом и параллельном возбуждении.
68609. Основы электротехники и электроники: Методические указания 979.07 KB
  Объём с содержание лабораторных и практических работ определяется рабочей программой дисциплины Основы электротехники и электроники При выборе содержания и объёма лабораторных и практических работ исходят из сложностей учебного материала для усвоения из внутрипредметных и межпредметных связей...