Перейти к: навигация, поиск

Наноструктуры. Математическая физика и моделирование, 2016, том 14, №2, 25–68

А.В. Махиборода, А.В. Ильичёв, А.А. Подобин, А.В. Царёв

Проблемы реализации массового динамического параллелизма. II

Ключевые слова: параллельные вычисления, архитектура ЭВМ, динамический параллелизм

Аннотация

В первой части статьи было отмечено, что освоение массового динамического параллелизма становится основным инструментом обеспечения устойчивого роста производительности вычислительных средств. Показано также, что на пути реализации массового параллелизма имеются два основных препятствия. Это специфические затраты на поддержку параллелизма, которые растут опережающими темпами с ростом числа процессорных элементов, и низкая производительность обменной среды, поддерживающей межпроцессорные пересылки данных. Во второй части проводится оценка прогнозов развития обменной среды в части совершенствования её алгоритмов и повышения пропускной способности. Делаются экспертные заключения о возможностях расширения диапазона эффективного параллелизма до значений в пределах сотен процессоров. При этом показатель в несколько тысяч процессоров на кристалле уже достигнут, а данные о текущем состоянии технологии позволяют прогнозировать рост числа процессоров до десятков тысяч и более на ближайшие несколько лет. Поиск путей дальнейшего расширения диапазона эффективной реализации параллелизма является актуальным и направлен на освоение принципиально новых форм организации вычислений. Излагаются основные идеи архитектуры самоопределяемых данных, и даётся краткий очерк построения математического аппарата дискретной динамики. Понятийный аппарат дискретной динамики позволяет сформулировать и решить задачу программирования процессов в архитектуре самоопределяемых данных.

[ Полный текст статьи ]


Nanostructures. Mathematical physics and modelling, 2016, vol. 14, №2, 25–68

A.V. Makhiboroda, A.V. Ilichev, A.A. Podobin, A.V. Tsarev

Problems of implementation of massive dynamic parallelism. II

Keywords: parallel computing, computer architecture, dynamic parallelism

Abstract

In the first part of this paper, it is noticed that the development of massive dynamic parallel computations becomes the main tool for ensuring the stable growth of the processing power of computing facilities. It is also shown that the implementation of massive parallel computations meets two major obstacles. These are specific costs of the parallelism support which grow faster than the number of processors and a poor performance of the interconnection networks supporting the interprocessor communications. In the second part of this paper, the forecasts of the interconnection network development are evaluated from the standpoint of improving its algorithms and increasing its bandwidth. The expert opinions about the possibilities of extending the effective parallelism range to the value of hundreds of processors are given. At the same time, systems with several thousands of processors on a chip have already been constructed, and the current state of the art in these technologies allows predicting an increase in the number of processors to more than tens of thousands in the next few years. Searching the ways to extend the effective implementation range of parallelism is a rather urgent problem directed to develop principally new forms of algorithms. The basic ideas of self-defined data architecture are discussed and a brief outline of the construction of discrete dynamics mathematical formalism is given. The conceptual apparatus of discrete dynamics allows formulating and solving the problem of programming the processes in self-defined data architecture.

[ Full text ]