Агибалов О.И., Венцов Н.Н. —
Оценка параметров и результатов работы генетических алгоритмов выполняемых на GPU и CPU
// Программные системы и вычислительные методы. – 2019. – № 3.
– С. 12 - 19.
DOI: 10.7256/2454-0714.2019.3.30502
URL: https://e-notabene.ru/itmag/article_30502.html
Читать статью
Аннотация: Объектом исследования являются процессы выбора оптимальной аппаратной архитектуры при организации ресурсоемких вычислений. Предметом исследования являются процессы решения оптимизационных задач генетическими алгоритмами на GPU и CPU архитектурах. Показано влияние выбора аппаратной архитектуры на процесс решения оптимизационной задачи: определены абсолютные и относительные зависимости замедления вычислительного процесса, при выборе нерациональной аппаратной архитектуры, от числа особей, обрабатываемых алгоритмом. Установлено, что для рассматриваемой задачи граница наиболее эффективной аппаратной конфигурации может находиться в диапазоне от 1000 до 5000 особей. По этой причине, размытость границы эффективной аппаратной конфигурации целесообразно описывать как множество пар «число особей- принадлежность к переходу» Метод исследования базируется на анализе результатов проведенного вычислительного эксперимента. Целью эксперимента является определение зависимостей времени выполнения генетического алгоритма (ГА) на GPU и CPU архитектурах от числа генерируемых особей (хромосом). Проведено сопоставление зависимостей минимального и максимального времени работы генетического алгоритма, выполняемого на GPU и CPU от числа особей. Показано, что при решении рассмотренной задачи минимальные и максимальные временные зависимости алгоритма, выполненного на GPU, близки к линейной функции; минимальные временные зависимости алгоритма, выполненного на СPU близки к линейной функции, а максимальные - к полиномиальной.
Abstract: The object of research is the process of choosing the optimal hardware architecture for organizing resource-intensive computing. The subject of the research is the process of solving optimization problems by genetic algorithms on GPU and CPU architectures. The influence of the choice of hardware architecture on the process of solving the optimization problem is shown: the absolute and relative dependences of the slowdown of the computing process, when choosing an irrational hardware architecture, on the number of individuals processed by the algorithm are determined. It is established that for the considered problem, the boundary of the most efficient hardware configuration can be in the range from 1000 to 5000 individuals. For this reason, it is advisable to describe the blurring of the boundary of an effective hardware configuration as a set of pairs “number of individuals — membership in a transition”. The research method is based on an analysis of the results of a computational experiment. The purpose of the experiment is to determine the dependencies of the runtime of the genetic algorithm on the GPU and CPU architectures on the number of individuals generated (chromosomes). The dependences of the minimum and maximum time of the genetic algorithm running on the GPU and CPU on the number of individuals are compared. It is shown that when solving the considered problem, the minimum and maximum time dependences of the algorithm performed on the GPU are close to a linear function; the minimum time dependences of the algorithm performed on CPU are close to a linear function, and the maximum to polynomial.
Агибалов О.И., Венцов Н.Н. —
Оценка зависимостей времени работы генетического алгоритма, выполняемого на CPU и GPU
// Кибернетика и программирование. – 2017. – № 6.
– С. 1 - 8.
DOI: 10.25136/2644-5522.2017.6.24509
URL: https://e-notabene.ru/kp/article_24509.html
Читать статью
Аннотация: Предметом исследования является проблема выбора наиболее эффективной аппаратной архитектуры для реализации стохастического популяционного алгоритма.
Объект исследования – генетический алгоритм, выполняемый на центральном процессоре (central processing unit, CPU) и графическом процессоре (graphics processing unit, GPU).
Приведены результаты вычислительного эксперимента, проведенного с целью сравнения зависимостей времени работы генетического алгоритма, выполняемого на центральном процессоре и графическом процессоре, от используемого количества хромосом. Приведено сопоставление как общего времени решения задачи, так и времени, необходимого для инициализации CPU и GPU.
По причине невозможности получения точной временной оценки генетического алгоритма построена расплывчатая оценка времени работы GPU-алгоритма на 3000 хромосом.
Метод исследования базируется на экспериментальной оценке зависимостей времени работы генетического алгоритма выполняемого на CPU и GPU от количества особей в популяции. Вычислительная сложность реализации генетического алгоритма на обоих видах процессоров приблизительно соответствует величине O(n)-O(n2). На основании представленных результатов установлено, что при использовании популяции размером до 2000-2500 хромосом генетический алгоритм целесообразнее реализовывать на CPU, а при использовании более 3000-4000 хромосом - на GPU. Размытость границы эффективности обусловлена стохастичностью генетического алгоритма.
Полученные оценки границ целесообразности выбора аппаратной архитектуры справедливы исключительно для данной задачи. Для прочих задач, в иных аппаратных и программных условиях эти результаты будут другими. В рассматриваемой ситуации важна не только числовая оценка границы эффективности, но и сам факт возможности определения такой точки перелома.
Abstract: The subject of the research is the problem of choosing the most efficient hardware architecture to execute a stochastic population-based algorithm. The object of the research is the genetic algorithm carried out using the central processing unit (CPU) or graphics processing unit (GPU). In their research the authors give results of a computational experiment aimed at comparing time dependencies of the genetic algorithm executed on the central processing unit or graphics processing unit based on the number of chromosomes used. The authors also compare the overall time of task solutions and time necessary to initialize CPU and GPU. Due to the fact that it was impossible to obtain the precise time assessment of the genetic algorithm, the authors have developed a loose time assessment of GPU-algorithm for 3000 chromosomes. The research method is based on the experimental assessment of time dependencies of the genetic algorithm executed using CPU or GPU based on the number of species in the population. The computational complexity of the genetic algorithm for both types of processing units is approximately O(n)-O(n2). Based on the results the authors have stated that in cases when the population is 2000-2500 chromosomes, the genetic algorithm should be better executed using CPU and when the population exceeds 3000-4000 chromosomes it is better to execute it using GPU. Such unclarity of efficiency frontiers is caused by the stochastic nature of the genetic algorithm. It should be also noted that these frontiers for choosing the most efficient hardware architecture are right exclusively for solving the above mentioned task. The results will be different for simpler tasks and other hardware and software conditions. The present research focuses not only on the numerical assessment of efficiency frontiers but on whether such crossing point can be defined or not.
Чернышев Ю.О., Венцов Н.Н., Долматов А.А. —
Разработка подхода, оперирующего с треугольным представлением нечетких чисел, на основе PSO-алгоритма
// Кибернетика и программирование. – 2017. – № 2.
– С. 1 - 7.
DOI: 10.7256/2306-4196.2017.2.22429
URL: https://e-notabene.ru/kp/article_22429.html
Читать статью
Аннотация: Предметом исследования являются интеллектуальные алгоритмы решения оптимизационных задач. Известно, что для одних и тех же проектных процедур в одних случаях необходимо получать точные решения, а в других достаточно получения приближенных решений. По этой причине актуальной является проблема управления точностью получаемых приближенных решений. Под приближенным решением можно понимать некоторую область точек, каждая из которых может быть в некоторой степени решением задачи. Предполагается, что на начальных этапах решения оптимизационной задачи допустимо оперировать нечеткими значениями, постепенно сужая область поиска. Предлагается подход который дополняет известный алгоритм «оптимизации с использованием роя частиц» возможностью обработки нечетких чисел с треугольным представлением. Современные многоагентные методы адаптивного поиска решений задач оптимизации, развиваются в направлении совершенствования способов взаимодействия между агентами. Например, известный метод «оптимизации с использованием роя частиц» (Particle Swarm Optimization, PSO) базируется на понятии популяции и моделирует поведение птиц в стае и косяков рыб. При этом классические биоинспирированные методы поиска решений оперируют, как правило, с четкими решениями. Разработана модификация PSO- алгоритма, за счет выполнения известных операций над нечеткими числами с треугольным представлением. Отличительной чертой предлагаемого подхода является организация интеллектуального процесса поиска в нечетком пространстве решений, оригинальность которого заключается в разработке способа движения интеллектуального агента (группы агентов) в пространстве образованном треугольным представлением нечетких чисел. Данный подход позволяет осуществлять поиск решений в нечетких пространствах, оперируя переменными вида «близко к X » не прибегая к лингвистическому анализу.
Abstract: The object of studies involves intellectual algorithm for solving optimization problems. It is known that for the same type of project procedures some cases require exact solutions, while others allow for approximate solutions. For this reason the issue of managing the exactness of the approximate solutions is so topical. An approximate solution may be regarded as some sphere of dots, each of them being a possible problem solution. It is supposed that at the early stages of solving optimization problems, it is possible to operate fuzzy ranges, while gradually narrowing the search area. The authors offer an approach, which complements the well-known algorithm of particle swarm optimization with the possibility to process fuzzy numbers with the triangular expression. The current multi-agent methods for the adaptive search for the optimization solutions are developed towards improvement of the interaction among the agents. For example, the well-known particle swarm optimization methods (PSO) is based upon the idea of population and it models the behavior of the birds in a flock or fish in a shoal. At the same time classic bio-inspired methods for finding solutions usually operate with clear solutions. The authors have developed the modification of the PSO algorithm thanks to performance of a number of known operations with the fuzzy numbers involving triangular expressions. The special feature of this approach is organization of the intellectual searching process in a fuzzy solution space. Its originality is due to the development of the method for the movement of an agent (group of agents) within the area formed with the triangular expression of fuzzy numbers. This approach allows for searching for solutions in fuzzy spaces, operating with the variables of the "close to X" type, avoiding the linguistic analysis.
Чернышев Ю.О., Венцов Н.Н. —
Разработка декодеров искусственной иммунной системы, восприимчивых к нечетким командам
// Кибернетика и программирование. – 2016. – № 5.
– С. 213 - 221.
DOI: 10.7256/2306-4196.2016.5.19885
URL: https://e-notabene.ru/kp/article_19885.html
Читать статью
Аннотация: Объектом исследования является модель искусственной иммунной системы. Предмет исследования — разработка способа построения нечеткого декодера. В качестве декодеров предложено использовать нечеткие функции принадлежности, описывающие соответствие контролируемого параметра критической ситуации. Использование такого подхода на основе нечетких декодеров, позволило избавиться от бинарной количественной классификации и перейти к расплывчатым и качественным оценкам. Приведен пример построения декодера для нечеткого условия «длина полупериметра L, описывающего фрагмент проектируемого изделия, должна быть не более 0,7 nm». На основе функции CON(μ1(L)), описывающей соответствие нечеткому условию «очень близко к 0,7 nm», построена функция μ5(L), описывающая соответствие нечеткому условию «очень меньше 0,7 nm». Расплывчатый декодер для оценки соответствия интервалу, строится на основе функции принадлежности данному интервалу. Приведен пример графика зависимости функции μ7 декодера от длинны полупериметра L, описывающей принадлежность к условию «желательная длина полупериметра от 0,55 до 0,7 nm». По аналогии с условиями «очень близко к 0,7 nm» и «слегка близко к 0,7 nm»можно определить функции принадлежности «очень в диапазоне от 0,55 до 0,7 nm» и «слегка в диапазоне от 0,55 до 0,7 nm». Метод исследования базируется на построении нечетких декодеров, описывающих нежелательные состояния вычислительного процесса. Нечеткость описывается при помощи функции принадлежности. Новизна исследования состоит в получении расплывчатых декодеров восприимчивых к нечетким командам. Используя соответствующие нечеткие функции принадлежности μ декодера, можно корректировать процесс оценивания степени близости контролируемого параметра к критической ситуации. Применение функций CON и DIL к функциям принадлежности декодеров позволяет менять их восприимчивость на тестовых данных от 20-30% до 200%-300%
Abstract: The object of research is the model of artificial immune system. Subject of the research is providing a method of constructing a fuzzy decoder. The authors proposed to use fuzzy membership function as the decoders. This functions describes the relevance of a controlled parameter to a critical situation. Using such an approach based on fuzzy decoders allows to move from binary quantitative classification to fuzzy qualitative estimates. The article present an example o f construction of a decoder for fuzzy term “semiperimeter length of L, describing a fragment of the designed product, should be no more than 0.7 nm”. On the basis of the function CON(μ1(L)), describing fuzzy matching condition “very close to 0.7 nm” the authors build a function μ5(L), describing fuzzy matching condition “a little less than 0.7 nm”. Fuzzy decoder for conformity assessment interval is based on the given interval membership function. The authors give a graph of a μ7 decoder function semiperimeter on the length L, describing the belonging to “semiperimeter desired length from 0.55 to 0.7 nm” condition. By analogy with the conditions “very close to 0.7 nm” and “slightly close to 0.7 nm” it is possible to determine a membership functions “very in range from 0.55 to 0.7 nm” and “slightly in range from 0.55 to 0.7 nm”. The research method is based on the construction of fuzzy decoders describing the undesirable state of the computational process. Fuzziness is described by the membership function. The novelty of the research is in getting fuzzy decoders receptive to fuzzy commands. Using the corresponding fuzzy membership function μ decoder it is possible adjust the process of estimating the degree of closeness of the controlled parameter to a critical situation. Applying CON and DIL functions to the decoder functions allows to change their susceptibility on test data from 20-30% up to 200% -300%.