Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Программные системы и вычислительные методы
Правильная ссылка на статью:

Неоднозначность результатов при использовании методов класса Parallel в рамках исполняющей среды .NET Framework


Гибадуллин Руслан Фаршатович

ORCID: 0000-0001-9359-911X

кандидат технических наук

доцент кафедры компьютерных систем Казанского национального исследовательского технического университета им. А.Н. Туполева-КАИ (КНИТУ-КАИ)

420015, Россия, республика Татарстан, г. Казань, ул. Большая Красная, 55, каб. 432

Gibadullin Ruslan Farshatovich

PhD in Technical Science

Associate Professor of the Computer Systems Department of Kazan National Research Technical University named after A.N. Tupolev-KAI (KNRTU-KAI)

420015, Russia, Republic of Tatarstan, Kazan, Bolshaya Krasnaya str., 55, office 432

rfgibadullin@kai.ru
Другие публикации этого автора
 

 
Викторов Иван Владимирович

аспирант кафедры компьютерных систем Казанского национального исследовательского технического университета им. А.Н. Туполева - КАИ (КНИТУ-КАИ)

420015, Россия, республика Татарстан, г. Казань, ул. Большая Красная, 55, оф. 432

Viktorov Ivan Vladimirovich

Postgraduate Student of the Computer Systems Department of Kazan National Research Technical University named after A.N. Tupolev-KAI (KNITU-KAI)

420015, Russia, Republic of Tatarstan, Kazan, Bolshaya Krasnaya str., 55, office 432

victorov.i.vl@yandex.ru
Другие публикации этого автора
 

 

DOI:

10.7256/2454-0714.2023.2.39801

EDN:

UGEGOO

Дата направления статьи в редакцию:

17-02-2023


Дата публикации:

08-03-2023


Аннотация: Параллельное программирование – это способ написания программ, которые могут выполняться параллельно на нескольких процессорах или ядрах. Это позволяет программам обрабатывать большие объемы данных или выполнить более сложные вычисления за приемлемое время, чем это было бы возможно на одном процессоре. Преимущества параллельного программирования: увеличение производительности, распределение нагрузки, обработка больших объемов данных, улучшение отзывчивости, увеличение надежности. В целом, параллельное программирование имеет множество преимуществ, которые могут помочь улучшить производительность и надежность программных систем, особенно в условиях растущей сложности вычислительных задач и объемов данных. Однако параллельное программирование также может иметь свои сложности, связанные с управлением синхронизацией, гонками данных и другими аспектами, которые требуют дополнительного внимания и опыта со стороны программиста. В ходе тестирования параллельных программ можно получить неоднозначные результаты. Например, это может происходить, когда мы оптимизируем объединение данных типа float или double посредством методов For или ForEach класса Parallel. Подобное поведение программы заставляет усомниться в потокобезопасности написанного кода. Такой вывод может быть неправильным и преждевременным. Статья раскрывает возможную причину неоднозначности результатов, получаемых параллельной программой, и предлагает лаконичное решение вопроса.


Ключевые слова:

Параллельное программирование, Язык программирования СиШарп, Многопоточность, Ошибки округления, Неоднозначность результатов, Потоковая безопасность, Вещественные числа, Тип decimal, Платформа NET, Класс Parallel

Abstract: Parallel programming is a way of writing programs that can run in parallel on multiple processors or cores. This allows programs to process large amounts of data or perform more complex calculations in a reasonable amount of time than would be possible on a single processor. The advantages of parallel programming: increased performance, load sharing, processing large amounts of data, improved responsiveness, increased reliability. In general, parallel programming has many advantages that can help improve the performance and reliability of software systems, especially with the increasing complexity of computational tasks and data volumes. However, parallel programming can also have its own complexities related to synchronization management, data races, and other aspects that require additional attention and experience on the part of the programmer. When testing parallel programs, it is possible to get ambiguous results. For example, this can happen when we optimize concatenation of float- or double-type data by means of For or ForEach methods of the Parallel class. Such behavior of a program makes you doubt about the thread safety of the written code. Such a conclusion can be incorrect and premature. The article reveals a possible reason for ambiguity of the results received by a parallel program and offers a concise solution of the question.


Keywords:

Parallel programming, Programming language CSharp, Multithreading, Rounding errors, Variability of results, Thread safety, Real numbers, Type decimal, NET platform, Class Parallel

Введение

В научных и инженерных расчетах точность является важным критерием, определяющим достоверность результатов. При проведении математических операций и вычислений на ЭВМ (электронно-вычислительной машине) возникает необходимость округления чисел, что может приводить к погрешностям. Поэтому снижение погрешности расчетов, связанной с использованием округлений, является важной задачей в научной и инженерной практике.

Округление чисел происходит в результате ограничения количества значащих цифр после запятой, что неизбежно приводит к потере точности. В зависимости от задачи и требуемой точности необходимо выбирать правильный способ округления чисел. Например, при округлении до целого числа, некоторые десятичные дроби будут потеряны, а при округлении до определенного числа знаков после запятой произойдет потеря точности из-за отбрасывания оставшихся десятичных цифр.

Снижение погрешности расчетов может быть достигнуто путем использования более точных методов вычислений, таких как метод Гаусса или методы численного интегрирования. Кроме того, для уменьшения погрешности можно применять различные алгоритмы и техники вычислений, которые позволяют уменьшить потерю точности при округлении чисел.

Снижение погрешности расчетов особенно важно в случаях, когда требуется высокая точность, например, при использовании методов решения систем линейных уравнений [1], при использовании численных методов дифференцирования и интегрирования [2], при моделировании физических явлений [3], при вычислении математических функций [4], при вычислении процентных ставок или доходности инвестиций [5,6], при использовании алгоритмов машинного обучения и искусственного интеллекта [7]. В этих случаях даже небольшие погрешности могут привести к серьезным ошибкам и неверным результатам, которые могут негативно повлиять на принимаемые решения.

Таким образом, снижение погрешности расчетов, связанной с использованием округлений, является важным фактором в научной и инженерной практике, поскольку позволяет получать более точные результаты вычислений и уменьшить вероятность ошибок и неверных выводов.

В современных вычислительных системах все более широко используются технологии параллельного программирования для увеличения производительности. Однако при использовании параллельных алгоритмов возникают дополнительные сложности [8,9], связанные с необходимостью обмена данными между различными процессами, а также с синхронизацией операций.

В условиях параллельного программирования использование округления чисел может приводить к возникновению дополнительных погрешностей, связанных с несогласованностью округления между различными процессами. Это может приводить к ошибкам в вычислениях, что особенно важно в случаях, когда требуется высокая точность вычислений.

Поэтому снижение погрешности расчетов, связанной с использованием округлений, имеет практическую значимость в технологиях параллельного программирования. Для уменьшения погрешностей в параллельных алгоритмах необходимо применять специальные алгоритмы и техники. В частности, это актуально в ходе параллельного агрегирования локальных значений, что определяет предмет исследования данной статьи. В демонстрационных целях взята задача – вычисление квадратных корней, которое часто используется в различных областях науки и техники, где необходимы точные вычисления.

Вычисление суммы квадратных корней может быть полезным в решении многих задач, таких как:

  • Определение расстояния между двумя точками в n-мерном пространстве.
  • Вычисление нормы вектора в n-мерном пространстве.
  • Расчет площади кривой на плоскости.
  • Определение времени, за которое тело падает на землю с заданной высоты при ускорении свободного падения.
  • Расчет стоимости доставки груза в зависимости от расстояния и веса груза.
  • Определение времени, за которое свет проходит расстояние между двумя точками в пространстве.
  • Оценка времени, необходимого для прохождения тестов и обучения в машинном обучении.
  • Оценка скорости работы компьютерных программ и алгоритмов.

Неоднозначность результатов в ходе параллельной агрегации локальных значений

Методы Parallel.For и Parallel.ForEach предлагают набор перегруженных версий, которые работают с аргументом обобщенного типа по имени TLocal. Такие перегруженные версии призваны помочь оптимизировать объединение данных из циклов с интенсивными итерациями. Ниже представлена перегруженная версия метода Parallel.For, которую далее мы будем использовать в предметном анализе.

public static ParallelLoopResult For(

ᅠint fromInclusive,

ᅠint toExclusive,

ᅠFunc localInit,

ᅠFunc<int, ParallelLoopState, TLocal, TLocal> body,

ᅠAction localFinally);

Где:

  • fromInclusive – начальный индекс, включительно.
  • toExclusive – конечный индекс, не включительно.
  • localInit – делегат функции, который возвращает начальное состояние локальных данных для каждой задачи.
  • body – делегат, который вызывается один раз за итерацию.
  • localFinally – делегат, который выполняет финальное действие с локальным результатом каждой задачи.
  • TLocal – тип данных, локальных для потока.
  • Возвращаемый объект – структура (ParallelLoopResult), в которой содержатся сведения о выполненной части цикла.

Применим данный метод на практике, чтобы просуммировать квадратные корни чисел от 1 до 107.

object locker = new object();

double grandTotal = 0;

Parallel.For(1, 10000000,

ᅠ() => 0.0, // Initialize the local value.

ᅠ(i, state, localTotal) => // Body delegate. Notice that it

ᅠᅠlocalTotal + Math.Sqrt(i), // returns the new local total.

ᅠlocalTotal => // Add the local

ᅠᅠ{ lock (locker) grandTotal += localTotal; } // to the master value.

);

Console.WriteLine(grandTotal);

Данное решение может выдавать неоднозначный результат, например:

  • 21081849486,4431;
  • 21081849486,4428;
  • 21081849486,4429.

Таким образом, по итогам запусков программы результаты вычислений могут отличаться в 3 или 4 знаке после запятой, что является недопустимым при решении таких задач, как:

  • Научные и инженерные расчеты, связанные с проектированием и тестированием новых технологий и устройств, где даже небольшие погрешности могут привести к неправильным выводам.
  • Разработка и анализ финансовых моделей, где точность результатов может оказать значительное влияние на принимаемые инвестиционные решения.
  • Работа с большими наборами данных в машинном обучении и анализе данных, где точность результатов может быть важна для получения правильных выводов и прогнозов.
  • Вычисление физических и химических констант, таких как постоянная Планка или постоянная Больцмана, которые используются в широком диапазоне научных и инженерных расчетов.
  • Исследования в области астрономии и космологии, где высокая точность результатов может быть важна для определения физических характеристик звезд, планет и галактик.

Причина неоднозначности результатов является комплексной. Во-первых, имеют место ошибки округления вещественных чисел. Во-вторых, выполнение делегата, отвечающего за формирование локального накопителя, в потоках пула носит порциональный характер. Рассмотрим и то и другое более детально.

Типы float и double внутренне представляют числа в двоичной форме. По указанной причине точно представляются только числа, которые могут быть выражены в двоичной системе счисления. На практике это означает, что большинство литералов с дробной частью (которые являются десятичными) не будут представлены точно. Например:

float x = 0.1f; // Не точно 0.1

Console.WriteLine (x + x + x + x + x + x + x + x + x + x); // 1.0000001

Именно потому типы float и double не подходят для финансовых вычислений. В противоположность им тип decimal работает в десятичной системе счисления, так что он способен точно представлять дробные числа вроде 0.1, выразимые в десятичной системе (а также в системах счисления с основаниями-множителями 10 – двоичной и пятеричной). Поскольку вещественные литералы являются десятичными, тип decimal может точно представлять такие числа, как 0.1. Тем не менее, ни double, ни decimal не могут точно представлять дробное число с периодическим десятичным представлением:

decimal m = 1M / 6M; // 0.1666666666666666666666666667M

double d = 1.0 / 6.0; // 0.16666666666666666

Это приводит к накапливающимся ошибкам округления:

decimal notQuiteWholeM = m+m+m+m+m+m; // 1.0000000000000000000000000002M

double notQuiteWholeD = d+d+d+d+d+d; // 0.99999999999999989

которые нарушают работу операций эквивалентности и сравнения:

Console.WriteLine (notQuiteWholeM == 1M); // False

Console.WriteLine (notQuiteWholeD < 1.0); // True

Ниже в таблице 1 представлен обзор отличий между типами double и decimal.

Таблица 1. Отличия между типами double и decimal [9]

Характеристика

double

decimal

Внутреннее представление

Двоичное

Десятичное

Десятичная точность

15–16 значащих цифр

28–29 значащих цифр

Специальные значения

+0, -0, положительная (отрицательная) бесконечность и NaN

Отсутствуют

Скорость обработки

Присущая процессору

Не присущая процессору (примерно в 10 раз медленнее, чем в случае double)

Раскроем тип decimal более детально, чтобы ответить на вопрос, почему обработка данных типа decimal не является присущей процессору.

Двоичное представление decimal числа состоит из 1-битового знака, 96-битового целого числа и коэффициента масштабирования, используемого для деления целочисленного числа и указания его части десятичной дроби. Коэффициент масштабирования неявно представляет собой число 10, возведенное в степень в диапазоне от 0 до 28. Таким образом, bits – это массив из четырех элементов, состоящий из 32-разрядных целых чисел со знаком:

  • bits_0, bits_1 и bits_2 содержат низкие, средние и высокие 32 биты 96-разрядного целого числа.
  • bits_3:
    • 0-15 не используются;
    • 16-23 (8 бит) содержат экспоненту от 0 до 28, что указывает на степень 10 для деления целочисленного числа;
    • 24-30 не используются;
    • 31 содержит знак (0 означает положительное значение, а 1 – отрицательное).

Для вычисления суммы квадратных корней с использованием типа данных decimal некоторые параметры представления числа, которые могут быть значимыми, включают:

  • Количество знаков в дробной части – чем больше знаков, тем точнее будет представление квадратных корней, и тем выше точность вычисления суммы.
  • Режим округления – если результат вычисления имеет много знаков после запятой, режим округления может повлиять на точность вычисления суммы. Режим округления может влиять на округление до ближайшего четного числа или до ближайшего нечетного числа, что может повлиять на точность.
  • Размер памяти – чем больше размер памяти, тем больше знаков можно хранить, и тем выше точность вычисления суммы.
  • Диапазон значений – это может быть не столь значимо, так как в задаче вычисления суммы квадратных корней используются только положительные значения.

В целом, для вычисления суммы квадратных корней с использованием типа данных decimal, параметры, которые являются наиболее значимыми, это количество знаков в дробной части и режим округления. Эти параметры могут быть выбраны на основе требуемой точности и скорости выполнения вычислений.

Разбиение на основе порций работает путем предоставления каждому рабочему потоку возможности периодически захватывать из входной последовательности небольшие “порции” элементов с целью их обработки [9]. Например (рис. 1), инфраструктура Parallel LINQ начинает с выделения очень маленьких порций (один или два элемента за раз) и затем по мере продвижения запроса увеличивает размер порции: это гарантирует, что небольшие последовательности будут эффективно распараллеливаться, а крупные последовательности не приведут к чрезмерным циклам полного обмена. Если рабочий поток получает “простые” элементы (которые обрабатываются быстро), то в конечном итоге он сможет получить больше порций. Такая система сохраняет каждый поток одинаково занятым (а процессорные ядра “сбалансированными”); единственный недостаток состоит в том, что извлечение элементов из разделяемой входной последовательности требует синхронизации – и в результате могут появиться некоторые накладные расходы и состязания.

Рисунок 1. Разделение на основе порций [9]

Метод For класса Parallel работает схожим образом, разница лишь в том, что вместо элемента входной последовательности выступает номер итерации, который как правило учитывается при выполнении тела цикла (точнее делегата типа Action). Реализация разделения основана на механизме разбиения на порции, при котором размер порции потенциально увеличивается в случае положительной динамики обработки итераций. Такой подход помогает обеспечить качественную балансировку нагрузки при небольшом количестве итераций и минимизировать число монопольных блокировок (в ходе назначения диапазонов номеров итераций для рабочих потоков) при их большом количестве. При этом обеспечивается, чтобы большинство итераций потока было сосредоточено в одной и той же области итерационного пространства для достижения высокой локальности кэша.

Исследование метода Parallel.For для детализации причины неоднозначности конечного результата

Реализация метода For сложна и требует детального рассмотрения, которое выходит за рамки данной статьи. Тем не менее отметим некоторые моменты программной реализации метода Parallel.For с аргументом обобщенного типа.

public static ParallelLoopResult For (int fromInclusive, int toExclusive, Func localInit, Func <int, ParallelLoopState, TLocal, TLocal> body, …) {

ᅠ…

ᅠreturn ForWorker(fromInclusive, toExclusive, s_defaultParallelOptions,

ᅠᅠnull, null, body, localInit, localFinally);

}

private static ParallelLoopResult ForWorker (int fromInclusive, int toExclusive, ParallelOptions parallelOptions, Action body, …) {

ᅠ…

ᅠrootTask = new ParallelForReplicatingTask(parallelOptions, delegate {

ᅠᅠif (rangeWorker.FindNewWork32(

ᅠᅠᅠᅠout var nFromInclusiveLocal,

ᅠᅠᅠᅠout var nToExclusiveLocal) &&

ᅠᅠᅠᅠ!sharedPStateFlags.ShouldExitLoop(nFromInclusiveLocal)) {

ᅠᅠᅠᅠ…

ᅠᅠᅠᅠdo {

ᅠᅠᅠᅠᅠif (body != null) {

ᅠᅠᅠᅠᅠᅠfor (int i = nFromInclusiveLocal; i < nToExclusiveLocal; i++) {

ᅠᅠᅠᅠᅠᅠᅠif (sharedPStateFlags.LoopStateFlags != ParallelLoopStateFlags.PLS_NONE

ᅠᅠᅠᅠᅠᅠᅠᅠ&& sharedPStateFlags.ShouldExitLoop()) {

ᅠᅠᅠᅠᅠᅠᅠᅠbreak;

ᅠᅠᅠᅠᅠᅠᅠ}

ᅠᅠᅠᅠᅠᅠᅠbody(i);

ᅠᅠᅠᅠᅠᅠ}

ᅠᅠᅠᅠᅠ}

ᅠᅠᅠᅠ}

ᅠᅠᅠᅠwhile (rangeWorker.FindNewWork32(out nFromInclusiveLocal, out nToExclusiveLocal) …);

ᅠᅠᅠᅠ…

ᅠᅠ}

ᅠ}, creationOptions, internalOptions);

ᅠrootTask.RunSynchronously(parallelOptions.EffectiveTaskScheduler);

ᅠrootTask.Wait();

ᅠ…

}

internal ParallelForReplicatingTask(...) {

ᅠm_replicationDownCount = parallelOptions.EffectiveMaxConcurrencyLevel;

ᅠ…

}

Метод rootTask.RunSynchronously запускает исполнение задач в рабочих потоках пула, при этом число задач задается свойством parallelOptions.EffectiveMaxConcurrencyLevel. Метод FindNewWork32 определяет рабочий диапазон для каждого потока пула. В представленном коде можно увидеть, что выполнение любой задачи не ограничивается выполнением первоначально определенного диапазона, потоки пула продолжают работу для вновь задаваемых диапазонов в операторе while.

Проведем детализацию работы метода Parallel.For с аргументом обобщенного типа на ранее представленном примере по суммированию квадратных корней чисел, расширив код следующим образом.

object locker = new object();

double grandTotal = 0;

ConcurrentBag<(int?, double)> cb1 = new ConcurrentBag<(int?, double)>();

ConcurrentDictionary<int?, long> cd = new ConcurrentDictionary<int?, long>();

ConcurrentBag<(int?, int)> cb2 = new ConcurrentBag<(int?, int)>();

var time = Stopwatch.StartNew();

time.Start();

Parallel.For(1, 1000,

ᅠ() => { return 0.0; },

ᅠ(i, state, localTotal) =>

ᅠ{

ᅠᅠcb1.Add((Task.CurrentId, localTotal));

ᅠᅠif (!cd.ContainsKey(Task.CurrentId)) cd[Task.CurrentId] = time.ElapsedTicks;

ᅠᅠcb2.Add((Task.CurrentId, i));

ᅠᅠreturn localTotal + Math.Sqrt(i);

ᅠ},

ᅠlocalTotal =>

ᅠ{ lock (locker) grandTotal += localTotal; }

);

cb1.GroupBy(_ => _.Item1).Select(_ => new

{

ᅠTaskId = _.Key,

ᅠIterations = _.Count(),

ᅠStartTime = cd[_.Key]

}).OrderBy(_ => _.StartTime).Dump();

var query = cb2.OrderBy(_ => _.Item2).GroupBy(_ => _.Item1, _ => _.Item2);

foreach (var grouping in query)

{

ᅠConsole.WriteLine("TaskId: " + grouping.Key);

ᅠvar r = grouping.GetEnumerator();

ᅠint? i = null;

ᅠbool onlyOne = true;

ᅠforeach (int iteration in grouping)

ᅠ{

ᅠᅠif (i == null)

ᅠᅠᅠConsole.Write("{" + $"{iteration}");

ᅠᅠelse

ᅠᅠ{

ᅠᅠᅠif (iteration - i != 1)

ᅠᅠᅠᅠConsole.Write(",...," + i + "}, {" + iteration);

ᅠᅠᅠonlyOne = false;

ᅠᅠ}

ᅠᅠi = iteration;

ᅠ}

ᅠif (onlyOne) Console.WriteLine("}");

ᅠelse Console.WriteLine(",...," + i + "}");

}

Программный код позволяет учесть:

  • идентификатор каждой задачи TaskId;
  • количество итераций выполненное в рамках каждой задачи Iterations;
  • StartTime – время начала работы каждой задачи, выраженное в тиках посредством класса Stopwatch (один тик является меньше одной микросекунды);
  • диапазоны номеров обработанных итераций каждой задачи.

Например, по результатам работы программы на машине, способной выполнять 8 потоков параллельно на аппаратном уровне, можно получить следующие показатели TaskId, Iterations, StartTime (табл. 2). Диапазоны номеров обработанных итераций представлены в таблице 3.

Таблица 2. Показатели TaskId, Iterations, StartTimeпосле завершения метода Parallel.For

TaskId

Iterations

StartTime

20

205

54568

21

1

54597

16

1

54709

22

159

54846

18

204

54986

24

161

55689

17

111

55689

15

1

55821

19

156

55880

Таблица 3. Диапазоны номеров обработанных итераций каждой задачи

Идентификатор задачи

Диапазоны номеров обработанных итераций

24

{1,...,31}, {40,...,55}, {88,...,103}, {120,...,124}, {142,...,173}, {206,...,221}, {266,...,281}, {330,...,345}, {484,...,496}

22

{32,...,39}, {56,...,87}, {104,...,119}, {126,...,141}, {174,...,189}, {222,...,237}, {250,...,265}, {298,...,313}, {346,...,361}, {993,...,999}

15

{125}

20

{190,...,205}, {238,...,248}, {282,...,297}, {314,...,329}, {362,...,372}, {858,...,992}

16

{249}

17

{373,...,483}

18

{497,...,620}, {716,...,731}, {746,...,761}, {778,...,793}, {810,...,825}, {842,...,857}

19

{621,...,715}, {732,...,744}, {762,...,777}, {794,...,809}, {826,...,841}

21

{745}

По результатам работы программы можно увидеть, что рабочие диапазоны различны. Некоторые задачи состоят из единственной итерации. Но это не является недостатком алгоритма по которому реализован исследуемый метод, а следствием того, что обработка одной итерации представляет собой нетрудоемкую с вычислительной точки зрения процедуры. Так, например, если в целевой метод делегата, представляющий четвертый параметр метода Parallel.For, добавить строки:

for (int k = 0; k < 1000000; k++)

ᅠMath.Sqrt(k);

тем самым существенно усложнив обработку каждой итерации цикла, то можно получить равномерное распределение диапазонов по задачам (табл. 4).

Таблица 4. Показатели TaskId, Iterations, StartTime после усложнения обработки каждой итерации цикла

TaskId

Iterations

StartTime

13

79

50828

10

63

50849

12

79

51226

16

79

51698

15

79

52224

11

95

52788

19

108

53181

17

84

53640

14

79

53976

20

32

3263706

21

32

3355186

22

32

3462087

23

32

3543335

24

29

3562197

25

39

3575327

26

29

3639235

27

29

3797790

Таким образом, результаты апробации метода Parallel.For показывают, что в ходе повторных запусков программы с данным методом создается различное число задач и рабочих диапазонов, отличных друг от друга. Данное поведение программы при обработке данных типа float и double приводит к неоднозначности результата выполнения делегата localFinally, определяющего финальное действие с локальным результатом каждой задачи.

Чтобы обеспечить высокую точность проводимых вычислений, следует обеспечить переход на тип decimal:

object locker = new object();

decimal grandTotal = 0;

Parallel.For(1, 10000000,

ᅠ() => (decimal)0,

ᅠ(i, state, localTotal) =>

ᅠᅠlocalTotal + (decimal)Math.Sqrt(i),

ᅠlocalTotal =>

ᅠᅠ{ lock (locker) grandTotal += localTotal; }

);

grandTotal.Dump();

Такой переход сопряжен с накладными расходами по быстродействию программы (при вычислении суммы квадратных корней чисел от 1 до 107 на четырехъядерном процессоре Intel Core i5 9300H время выполнения составляет приблизительно 0,260 мсек. при использовании типа decimal, в то время как при использовании типа double это занимает лишь 0,02 мсек.) и может быть неоправданным из-за отсутствия необходимости в результатах повышенной точности. Однако взамен на выходе обеспечивается однозначный результат: 21081849486,44249240077608.

Заключение

Точность вычислений имеет большое значение в параллельном программировании, особенно при решении сложных научных задач или задач, связанных с обработкой больших объемов данных. В параллельном программировании, когда вычисления выполняются на многопроцессорных системах, точность вычислений может быть нарушена из-за нескольких причин:

  • Проблемы с синхронизацией данных – когда несколько процессоров обрабатывают одни и те же данные, возможно необходимо синхронизировать вычисления между процессорами, чтобы результаты были согласованы и точны.
  • Проблемы с коммуникацией – когда процессы обмениваются данными, возможны проблемы с задержками и утечками данных, которые могут привести к ошибкам в вычислениях.
  • Проблемы с точностью округления – некоторые операции вычислений могут приводить к потере точности, особенно при использовании типов данных с плавающей запятой. При распределенных вычислениях на многопроцессорных системах потеря точности может быть усугублена.

В статье особое внимание уделено последней причине на примере использования метода For класса Parallel в рамках исполняющей среды .NET Framework. Проведен анализ метода Parallel.For, исследована работа параллельной программы вычисления суммы квадратных корней заданного диапазона чисел. Выявлено, что причина неоднозначности результатов вычислений является комплексной и связана с ошибками округления вещественных чисел и порциональной обработкой диапазона чисел в потоках пула. Для уменьшения этой неоднозначности целесообразно использовать более точные типы данных, также представляет интерес применения алгоритмов, которые уменьшают влияние ошибок округления и улучшают согласованность результатов между потоками [10].

Библиография
1. X. Fan, R. -a. Wu, P. Chen, Z. Ning and J. Li, "Parallel Computing of Large Eigenvalue Problems for Engineering Structures," 2011 International Conference on Future Computer Sciences and Application, Hong Kong, China, 2011, pp. 43-46, doi: 10.1109/ICFCSA.2011.16.
2. Xuehui Chen, Liang Wei, Jizhe Sui, Xiaoliang Zhang and Liancun Zheng, "Solving fractional partial differential equations in fluid mechanics by generalized differential transform method," 2011 International Conference on Multimedia Technology, Hangzhou, 2011, pp. 2573-2576, doi: 10.1109/ICMT.2011.6002361.
3. R. Landau, "Computational Physics: A Better Model for Physics Education?," in Computing in Science & Engineering, vol. 8, no. 5, pp. 22-30, Sept.-Oct. 2006, doi: 10.1109/MCSE.2006.85.
4. H. Ali, A. Doucet and D. I. Amshah, "GSR: A New Genetic Algorithm for Improving Source and Channel Estimates," in IEEE Transactions on Circuits and Systems I: Regular Papers, vol. 54, no. 5, pp. 1088-1098, May 2007, doi: 10.1109/TCSI.2007.893507.
5. D. -M. Zhu, J. -w. Gu, F. -H. Yu, W. -K. Ching and T. -K. Siu, "How correlation risk in basket credit derivatives might be priced and managed?," in IMA Journal of Management Mathematics, vol. 32, no. 2, pp. 195-219, April 2020, doi: 10.1093/imaman/dpaa013.
6. J. Xu and Y. Shi, "Financial Leasing, Optimal Financial Structure and Economic Growth: An Analysis Based on Financial Inclusion Perspective," 2019 International Conference on Economic Management and Model Engineering (ICEMME), Malacca, Malaysia, 2019, pp. 147-150, doi: 10.1109/ICEMME49371.2019.00038.
7. S. N. Cherny and R. F. Gibadullin, "The Recognition of Handwritten Digits Using Neural Network Technology," 2022 International Conference on Industrial Engineering, Applications and Manufacturing (ICIEAM), Sochi, Russian Federation, 2022, pp. 965-970, doi: 10.1109/ICIEAM54945.2022.9787104.
8. Albahari, Joseph. C# 10 in a Nutshell. " O'Reilly Media, Inc.", 2022.
9. Гибадуллин Р.Ф. Потокобезопасные вызовы элементов управления в обогащенных клиентских приложениях // Программные системы и вычислительные методы. – 2022. – № 4. – С. 1-19.
10. Rump, S.M. Fast and Parallel Interval Arithmetic. BIT Numerical Mathematics 39, 534–554 (1999). https://doi.org/10.1023/A:1022374804152.
References
1. X. Fan, R. -a. Wu, P. Chen, Z. Ning and J. Li, "Parallel Computing of Large Eigenvalue Problems for Engineering Structures," 2011 International Conference on Future Computer Sciences and Application, Hong Kong, China, 2011, pp. 43-46, doi: 10.1109/ICFCSA.2011.16.
2. Xuehui Chen, Liang Wei, Jizhe Sui, Xiaoliang Zhang and Liancun Zheng, "Solving fractional partial differential equations in fluid mechanics by generalized differential transform method," 2011 International Conference on Multimedia Technology, Hangzhou, 2011, pp. 2573-2576, doi: 10.1109/ICMT.2011.6002361.
3. R. Landau, "Computational Physics: A Better Model for Physics Education?," in Computing in Science & Engineering, vol. 8, no. 5, pp. 22-30, Sept.-Oct. 2006, doi: 10.1109/MCSE.2006.85.
4. H. Ali, A. Doucet and D. I. Amshah, "GSR: A New Genetic Algorithm for Improving Source and Channel Estimates," in IEEE Transactions on Circuits and Systems I: Regular Papers, vol. 54, no. 5, pp. 1088-1098, May 2007, doi: 10.1109/TCSI.2007.893507.
5. D. -M. Zhu, J. -w. Gu, F. -H. Yu, W. -K. Ching and T. -K. Siu, "How correlation risk in basket credit derivatives might be priced and managed?," in IMA Journal of Management Mathematics, vol. 32, no. 2, pp. 195-219, April 2020, doi: 10.1093/imaman/dpaa013.
6. J. Xu and Y. Shi, "Financial Leasing, Optimal Financial Structure and Economic Growth: An Analysis Based on Financial Inclusion Perspective," 2019 International Conference on Economic Management and Model Engineering (ICEMME), Malacca, Malaysia, 2019, pp. 147-150, doi: 10.1109/ICEMME49371.2019.00038.
7. S. N. Cherny and R. F. Gibadullin, "The Recognition of Handwritten Digits Using Neural Network Technology," 2022 International Conference on Industrial Engineering, Applications and Manufacturing (ICIEAM), Sochi, Russian Federation, 2022, pp. 965-970, doi: 10.1109/ICIEAM54945.2022.9787104.
8. Albahari, Joseph. C# 10 in a Nutshell. " O'Reilly Media, Inc.", 2022.
9. Gibadullin R.F. Flow-safe calls of controls in enriched client applications, "Software Systems and Computational Methods", no. 4, pp. 1-19, 2022.
10. Rump, S.M. Fast and Parallel Interval Arithmetic. BIT Numerical Mathematics 39, 534–554 (1999). https://doi.org/10.1023/A:1022374804152.

Результаты процедуры рецензирования статьи

Рецензия скрыта по просьбе автора