77327

DATAFLOW BASED DISTRIBUTED COMPUTING METHODS. SYSTEM PROTOTYPE

Научная статья

Информатика, кибернетика и программирование

Different methods re pplied to simplify the progrmming nd execution of prllel progrms. On the one hnd universl tools for utomtic progrm prlleliztion both for execution on shred memory nd for multicomputer systems re being developed. The gol of tht design is to simplify prllel progrm development but without significnt loss in the effectiveness of the progrm codes execution. Term tsk nmes the progrm which reds during its execution the dt items with specific nmes from storge nd s the result...

Английский

2015-02-02

20.5 KB

0 чел.

DATAFLOW BASED DISTRIBUTED COMPUTING METHODS. SYSTEM PROTOTYPE.

M.O. Bakhterev, P.A. Vasev

IMM UrB RAS, Yekaterinburg

The usage of parallel and distributed computing systems is accompanied with big expenditures, connected with programming for such a systems. The problem is that modern popular parallel programming tools - MPI and OpenMP - are quite complex to apply. Programmer needs to care about distribution of computational tasks, synchronization, data exchange and so on.

Different methods are applied to simplify the programming and execution of parallel programs. On the one hand, universal tools for automatic program parallelization (both for execution on shared memory and for multicomputer systems) are being developed. On the other hand, the environments for solving the particular task classes (in general, it concerns applications with high level of data parallelism) are being created. Also, the universal instruments, trying to simplify the technical side of the process of parallel and distributed systems programming, are being developed.

Sometimes, creating such a tools, developers are trying to make use of nonstandard calculus paradigms. One of them is Dataflow [1]. Some variants of Dataflow are used when developing processor architectures, supercomputers as whole, software organization of computational threads in bounds of single process, and interprocess communications in distributed environment.

At present work the authors, relying on the analysis of different, including their own, Dataflow models, are developing methods and tools for programming in parallel and distributed environments. The goal of that design is to simplify parallel program development, but without significant loss in the effectiveness of the program codes execution.

Suggested methods of computation arose as a consequence of long theoretical research of the operating system for distributed computations [2]. Methods are based on the storage, task and rule conceptions. Storage keeps named data, to which three operations could be applied - write (create), read and delete. At that the stored data are self-sufficient - they are not queues, but certain items of information with unique names. Term task names the program, which reads during its execution the data items with specific names from storage, and as the result of it's own execution form new data, which are written to storage. Term rule designates the construction, which defines the conditions and the parameters of the program launch. The rule contains:

1. The list of names, which are needed to execute task.

2. The list of correspondence between global data (been in storage) names and local names (which are used inside program).

3. The list of tasks (programs), which should be launched.

4. Actions, performed in the case of successful execution of the tasks (3).

The rule is considered ready for execution, when all data with names from the list (1) are present in storage. After successful execution the rule is deleted from the list of the rules being executed.

The process of programming and carrying out the calculations is unfolding in the following manner. The programmer prepares programs of tasks; at that, theoretically in the frame of one calculation experiment any combination of programming languages and target hardware could be used. For instance, some tasks could be executed on graphics processors.

Also, the programmer forms initialization file, in which prime rules of the system are described. That rule set could be increased later on - during task execution or performing the closing actions in rules. Besides rules there are initial data specified in initialization file, they will be placed in storage.

Further, the programmer gives run command. During the runtime the computing environment finds the ready to execute rules and launches tasks specified in them on suitable available resources. As the result of that, some of rules complete with forming new data and releasing resources for other rules execution. The environment continues the search and execution of rules till the rule set exhausting, the job suspension from the outside or the exposure of error.

Described methods possess a number of valuable capabilities, such as ability to carry out the computational experiment on hybrid architectures, the ability to alter the computing nodes amount during runtime, the ability to support applications in the  globally-distributed environments, the ability to automatically create checkpoints, the ability to suspend and resume the computation in the transparent to programmer manner, the ability to use distributed data storages, and so on.

The authors are developing the prototype of the system based on the suggested methods: the RIDE project. The early samples of programs show the realizability of the system and the elegance of the code for rules description. The authors believe that evolution of the running research will result in the achievement of the main goal - to make the process of distributed parallel programs development simpler and more effective.

Reference

1. Dennis J., Data Flow Supercomputers // Computer, Vol.13, No.11, pp.48-56, 1980

2. Bakhterev M.O. The description of parallel computations in the terms of closures // 10Th International Workshop "Supercomputing and Mathematical Simulations", RFNC-VNIIEF, Sarov, p. 31-32, 2008.


 

А также другие работы, которые могут Вас заинтересовать

42724. Исследование электрических величин двухобмоточного однофазного трансформатора 119 KB
  Исследование электрических величин двухобмоточного однофазного трансформатора. Цель работы: изучить конструкцию однофазного трансформатора описать принцип его действия замерить величины в различных режимах работы в масштабе построить характеристики и векторные диаграммы. б Коэффициент трансформации трансформатора зависит . в В режиме холостого хода с увеличением напряжения коэффициент мощности трансформатора .
42725. Методы классификации основанные на сравнении с эталоном 732 KB
  Поэтому обычно возникает необходимость сократить это число посредством выделения информативных признаков которые предполагаются инвариантными или малочувствительными по отношению к изменениям и искажениям. Результаты измерений признаков отображаются в пространство признаков. В этом случае будут установлены границы областей принятия решений для разделения признаков новых фрагментов подлежащих классификации см. Первая задача заключается в выборе подмножества признаков и их упорядочиванию в заданном множестве измерений.
42726. Строки и регулярные выражения 300 KB
  String Работа с функциями класса StringBuilder Работа с регулярными выражениями. В C есть тип string но класс System. Пример использования: String s= qqq ; int k=s. Пример использования: nmespce test { clss Test { public sttic void Min { String s1= rbour s2= ce s3= zote ; System.
42727. Запільна блок-схема 28.5 KB
  Накресліть схему лінійного алгоритму. Накресліть схему розгалуженого алгоритму. Як конструювати схему алгоритму.
42729. Найти минимальную сумму элементов в строках двумерного массива 58 KB
  Для проверки подлинности работы программы необходимо сверить результаты работы программы и результаты ручного тестирования. Если они сойдутся, то программа выполнена правильно. Для упрощения вычислений заполним массив цифрами
42730. ЛИНЕЙНЫЕ МЕТОДЫ КЛАССИФИКАЦИИ 178.5 KB
  В данной лабораторной работе мы будем рассматривать способ построения линейного решающего правила на основе обучения одного формального нейрона. Модель нейрона Нейрон представляет собой формализованную модель биологического нейрона.4 Простейший нейрон В общем виде функционирование нейрона подчиняется следующему выражению: где: вектор входного сигнала весовой вектор T порог f функция активации. Весовой вектор порог и функция активации определяют поведение нейрона то как он реагирует на входные данные.
42731. РАЗРАБОТКА АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ДЛЯ РАСЧЕТА ПОТРЕБНОСТИ В КОРМАХ НА ПАСТБИЩНЫЙ ПЕРИОД 70 KB
  Исходя из наличия поголовья сельскохозяйственных животных структуры и организации стада структуры суточных рационов и норм кормления рассчитать потребность в кормах по ферме на пастбищный период в кормовых единицах и физическом весе по видам корма и половозрастным группам. Промежуточными данными должны быть: Поголовье по половозрастным группам; Потребность в кормах в сутки на одну голову кормовые единицы и физический...
42732. Работа с файлами в С# 288.5 KB
  Потоки в С Под файлом обычно подразумевается именованная информация на внешнем носителе например на жестком или гибком магнитном диске. Логически файл можно представить как конечное количество последовательных байтов поэтому такие устройства как дисплей клавиатура и принтер также можно рассматривать как частные случаи файлов.