Степанов П.П. —
Применение алгоритмов группового управления и машинного обучения на примере игры "Battlecode"
// Кибернетика и программирование. – 2019. – № 1.
– С. 75 - 82.
DOI: 10.25136/2644-5522.2019.1.23527
URL: https://e-notabene.ru/kp/article_23527.html
Читать статью
Аннотация: Предметом исследования являются задача группового управления автономными агентами в динамичной мультиагентной системе и самообучение модели управления. Автор подробно рассматривает такие аспекты проблемы как групповое взаимодействие, на примере наиболее эффективных алгоритмов групповго управления, таких как SWARM, муравьиный алгоритм, пчелиный алгоритм, алгоритм светлячков и алгоритм движения косяка рыб, и обучение искусственной нейронной сети, посредством применения обучения с подкреплением. Проведено сравнение различных алгоритмов поиска оптимального пути. Сравнение было проведено на основе игровой среды "Battlecode", динамично формирующей новую карту для нового раунда, что обеспечило качество сравнения рассмотренных алгоритмов. Автор использует статистические методы анализа данных, выделение и анализ качественных признаков, методы прогнозирования, метод моделирования, метод классификации. Автор показывет, что Q-обучение увеличивает свою эффективность, при замене табличного представления Q-функции на нейронную сеть. Проведенная работа доказывает эффективность пчелиного алгоритма в решении задачи исследования и патрулирования местности. При этом алгоритм поиска пути А* оказывается значительно более гибким и эффективным, чем алгоритм Дейкстры.
Abstract: The subject of the research is the task of group management of autonomous agents in a dynamic multi-agent system and self-study of the management model. The author examines such aspects of the problem as a group interaction, using the example of the most effective group control algorithms, such as SWARM, ant algorithm, bee algorithm, firefly algorithm and fish school movement algorithm, and training of an artificial neural network through the use of reinforcement training. A comparison of various algorithms for finding the optimal path. The comparison was made on the basis of the gaming environment "Battlecode", which dynamically forms a new map for the new round, which ensured the quality of the comparison of the considered algorithms. The author uses statistical methods of data analysis, the selection and analysis of qualitative signs, forecasting methods, modeling method, classification method. The author shows that Q-learning increases its effectiveness by replacing the tabular representation of the Q-function with a neural network. This work proves the effectiveness of the bee algorithm in solving the problem of researching and patrolling the area. At the same time, the path search algorithm A* is much more flexible and efficient than the Dijkstra algorithm.
Степанов П.П. —
Решение актуальных проблем предприятий нефтегазовой отрасли с применением методов теории игр
// Кибернетика и программирование. – 2016. – № 4.
– С. 11 - 17.
DOI: 10.7256/2306-4196.2016.4.20162
URL: https://e-notabene.ru/kp/article_20162.html
Читать статью
Аннотация: Предметом исследования являются проблемы информационной безопасности, а также формирования конкурентной стратегии на рынке нефтепродуктов для нефтегазовых компаний, и применению для их решения методов теории игр. Особое внимание уделяется вопросам обеспечения информационной безопасности, объясняется роль стратегического взаимодействия при планировании и формировании конкурентной стратегии компании, после чего для каждой из проблем автор вводит аппарат теории игр в виде целевой функции, с заданием платежной матрицы, которая при накоплении фактической базы позволит провести симуляционное моделирование. В качестве методологии выбран аппарат теории игр, в частности игры с постоянной суммой, кооперативные игры класс игр с неполной информацией. Основными выводами проведенного исследования являются установленная возможность использования методов теории игр для решения специфических проблем предприятий нефтегазовой отрасли. Предложение целевой функции для заполнения платежной матрицы для каждой из проблем. Установление направления для перспективных исследований в данной области с использованием теории игр и симуляционного моделирования.
Abstract: The subject of the research is the problems of information security as well as development of the competitive strategy on the market of oil products for oil companies and implementation of the game theory method in the process of solving the aforesaid issues. Special attention is paid to the questions of providing information security. The author explaines the role of strategic interaction in the process of planning and developing company's competitive strategy. After that the author introduces the framework of the game theory in a form of a target function with a set game matrix which alllows to carry out simulation modeling when the actual basis is accumulated. The research methodology is based on the framework of the game theory, in particular, constant sum games, cooperative games and games with inexact information. The main conclusion of the research is the proof that it is possible to apply the game theory method to solving specific problems of oil industry. The author also offers to use the target function to fill in the game matrix for each problem and defines directions for further researches in this field using the game theory and simulation modeling methods.