Библиотека
|
ваш профиль |
Программные системы и вычислительные методы
Правильная ссылка на статью:
Щербань П.С., Соколов А.Н., Абу-Хамди Р.В., Есаян В.Н.
Исследование статистики отказов кавитаторов на мазутном хозяйстве тепловых станций путем применения регрессионного и кластерного анализа
// Программные системы и вычислительные методы.
2022. № 3.
С. 45-60.
DOI: 10.7256/2454-0714.2022.3.38841 EDN: LTMFZL URL: https://nbpublish.com/library_read_article.php?id=38841
Исследование статистики отказов кавитаторов на мазутном хозяйстве тепловых станций путем применения регрессионного и кластерного анализа
DOI: 10.7256/2454-0714.2022.3.38841EDN: LTMFZLДата направления статьи в редакцию: 26-09-2022Дата публикации: 08-10-2022Аннотация: Одной из главных задач в управлении технологическими процессами является сокращение аварийных ситуаций и отказов действующего оборудования. Получаемые при функционировании машин и механизмов статистические данные требуют соответствующей математической обработки, для анализа динамики технологических процессов и установления взаимосвязей между отклонениями, воздействующими факторами и отказами. Удобным инструментарием для обработки этих данных являются регрессионный и кластерный анализы. Существенной, и при этом слабоосвещённой в научной периодике темой являются отказы кавитационных систем. Кавитаторы - сравнительно распространенные технические устройства, позволяющие поддерживать технологические показатели мазута в резервуарных парках на требуемом уровне (вязкость, содержание воды, адгезионные свойства). Практика применения кавитаторов на мазутных хозяйствах тепловых станций в Калининградской области показывает, что данные технические устройства могут сравнительно часто давать отказы. Так, в случае отключения или ограничения подачи требуемых объемов газа на теплоэлектростанцию, могут быть использованы резервы мазута из топливного парка. В свою очередь, отказ кавитационной системы может привести к невозможности ввода резервного топлива и, как следствие - к остановке энергогенерации. Таким образом, проблема обеспечения энергобезопасности и безотказность работы кавитационных систем тесно взаимосвязаны. В настоящем исследовании проанализирован массив накопленной статистической информации по параметрам функционирования кавитаторов в мазутных хозяйствах и моментам наступления отказов. Для обработки массива данных были использованы регрессионный и кластерный анализы, что позволило определить взаимосвязи между видами отказов и воздействующими факторами и ранжировать весомость факторов по степени их воздействия на кавитационное оборудование. По результату математической обработки и анализа данных разработаны предложения по обеспечению большей технической надежности кавитаторов, реорганизации системы их технического обслуживания и снижения числа отказов. Ключевые слова: регрессионный анализ, кластерный анализ, метод наименьших квадратов, к-метод кластеризации, нефтегазовая техника, кавитационное оборудование, анализ статистических данных, отказы техники, надежность оборудования, износ оборудованияAbstract: One of the main tasks in the management of technological processes is to reduce emergencies and failures of existing equipment. The statistical data obtained during the operation of machines and mechanisms require appropriate mathematical processing to analyze the dynamics of technological processes and establish relationships between deviations, influencing factors and failures. Regression and cluster analyses are convenient tools for processing these data. The failures of cavitation systems are an essential, and at the same time poorly illuminated topic in scientific periodicals. Cavitators are relatively common technical devices that allow maintaining the technological parameters of fuel oil in tank farms at the required level (viscosity, water content, adhesive properties). The practice of using cavitators on fuel oil farms of thermal power plants in the Kaliningrad region shows that these technical devices can fail relatively often. So, in case of disconnection or restriction of the supply of the required volumes of gas to the thermal power plant, reserves of fuel oil from the fuel park can be used. In turn, the failure of the cavitation system may lead to the impossibility of entering reserve fuel and, as a consequence, to the shutdown of power generation. Thus, the problem of ensuring energy security and the reliability of cavitation systems are closely interrelated. In this study, an array of accumulated statistical information on the parameters of the functioning of cavitators in fuel oil farms and the moments of failure is analyzed. Regression and cluster analyses were used to process the data array, which made it possible to determine the relationship between the types of failures and the influencing factors and to rank the weight of factors according to the degree of their impact on cavitation equipment. Based on the results of mathematical processing and data analysis, proposals have been developed to ensure greater technical reliability of cavitators, reorganize their maintenance system and reduce the number of failures. Keywords: regression analysis, cluster analysis, least squares method, k-clustering method, oil and gas equipment, cavitation equipment, analysis of statistical data, equipment failures, equipment reliability, wear and tearВведение. Разработанный во второй половине XIX начале XX века регрессионный анализ (Ф. Гальтон, К. Пирсон, Е. Случцкий и др.), а также разработанный в середине XX века кластерный анализ (Г. Штейнгауз, С. Ллойд, Дж. Ходжес, Р. Сокэл и др.) нашли широкое применение в оценке технического состояния машин и механизмов, определении причин возникновения отказов, установлении тесноты взаимосвязей между частотами отказов и воздействующими факторами. Данные математические инструменты часто используются в анализе статистических данных по технологическим процессам конвейерного производства, ремонтов оборудования, анализе отклонений в точности процессов сварки, монтажа, оценке взаимосвязи отклонений качества продукции с влияющими факторами. Массивы статистических данных получаемых в различных механических, термобарических, химических, комплексных процессах обрабатываются подобным инструментарием и служат основой для принятия инженерным персоналом решений. Полученный в ходе функционирования мазутных хозяйств комплекс данных, включающий данные по отказам кавитаторов позволил с использованием регрессионного и кластерного анализов оценить степень влияния различных факторов на частоту отказов, а также выявить причинно-следственную связь между воздействующими на кавитаторы факторами и остановками / авариями оборудования. Стоит отметить, что использование кавитаторов для обработки резервного топлива (мазута) позволяет: -Увеличить энергетическую ценность мазутов и поддержать их качественные показатели. -Уменьшить содержание веществ, снижающих срок службы печей и котлов, а также уменьшить токсичность продуктов горения [1]. При схлопывании разряженных пузырей в мазуте возникает ударная волна, которая разбивает цепочки молекул, веществ и разрушает его физико- химическую структуру. После такой обработки возрастает количество низкомолекулярных соединений и образуется новая структура. В результате после кавитационной обработки и последующих химических реакций снижается количество примесей, содержащих свободные серу и фосфор, что ведет к уменьшению скорости коррозии [2]. Использование кавитаторов осложняется отказами, что является следствием целого комплекса факторов: производственных, организационных, качества применяемых материалов, точности диагностики оборудования, частоты и полноты технического обслуживания и ремонтов [3]. По результату использования регрессионного и кластерного анализов установлены причины преждевременного отказа кавитаторов, факторы, влияющие на частоту выхода из строя данного оборудования. Полученные в результате математической обработки статистические данные позволили разработать организационно-управленческие и технические рекомендации для эксплуатантов кавитационных систем с целью сокращения количества аварийных ситуаций и обеспечения непрерывность функционирования данного оборудования.
1.Особенности применения регрессионного и кластерного анализов для обработки статистических данных по отказам техники. Регрессионный анализ – это метод исследования, позволяющий получить функциональную эмпирическую зависимость одной случайной величины от другой на основе статистической обработки массива экспериментальных данных. Основной задачей регрессионного анализа является построение математической модели (кривой регрессии), описывающей связь между переменными величинами: зависимой, случайной и одним или несколькими независимыми случайными или не случайными параметрами [4]. В простейшем случае регрессионного анализа для двух переменных имеется n пар экспериментально найденных или наблюденных значений (Xi; Yi) и требуется получить в аналитическом виде зависимость y = f(x). Прежде всего, для визуального анализа, эти пары значений отображаются на X-Y диаграмме. Далее, на основании визуального анализа и/или априорной информации выбирается тот или иной тип функции (полиномиальная, экспоненциальная, синусоидальная и т.п.), который с точки зрения исследователя наиболее правдоподобно описывает зависимость y(x). После выбора типа функции требуется найти числовые коэффициенты, при которых выбранная функция наилучшим образом соответствует результатам наблюдений и оценить корректность выбранной математической модели [5]. Расчет численных значений коэффициентов, при которых выбранная функция "наилучшим образом" соответствует результатам наблюдений может быть выполнен несколькими способами. Наиболее распространенным и самым простым в реализации является метод наименьших квадратов (МНК) [Draper, N.R. and Smith, H. Applied Regression Analysis. 2nd Edition, John Wiley & Sons, New York. 1981. 709pp.] Альтернативами являются метод максимального правдоподобия [см., например, Rossi, Richard J. (2018). Mathematical Statistics: An Introduction to Likelihood Based Inference. New York: John Wiley & Sons. 448pp (p. 227). ISBN: 978-1-118-77104-4], метод моментов [см., например, O. Kimiko, K. O. Bowman & L. R. Shenton, "Estimator: Method of Moments", pp 2092–2098, Encyclopedia of statistical sciences, Wiley (1998)], а также ряд других. В данном исследовании использован метод наименьших квадратов, в котором коэффициенты аппроксимирующей функции y=f(x) выбираются так, чтобы сумма квадратов отклонений (Yi – f(Xi))2 была бы минимальной. Применение регрессионного анализа в рассматриваемом случае осложнено выбором величины, которую можно было бы интерпретировать как Y – переменную, с которой сравнивались бы значения аппроксимирующей функции. Обычно Y – это непрерывная величина. В случае же с кавитаторами, само событие отказа по своей природе двоично: либо отказ есть, либо его нет и фиксируются только значения воздействующих параметров, при которых этот отказ произошел [6]. Кроме того, в нашем распоряжении имелась информация об обстоятельствах только чуть более двух десятков отказов кавитаторов, поэтому говорить о какой-либо более-менее корректной вероятности отказа, которая могла бы выступить в качестве непрерывной переменной Y не приходится. В связи с отмеченными особенностями был применен следующий подход. Для каждого из влияющих параметров X ряд с информацией о значениях параметров при отказе сортировался по возрастанию Х и номер члена такого упорядоченного ряда играл роль переменной Y. Т.е. yi – это количество отказов при котором значение анализируемого параметра больше или равно xi. Применение кластерного анализа для обработки статистических данных по отказам в технике, также является эффективным инструментом, позволяющим стратифицировать данные, определять взаимовлияние параметров друг на друга. Данный вид анализа имеет ряд особенностей. Так, возможно применять различные подходы кластерного анализа к обработке данных. Иерархический подход позволяет анализировать множество объектов с определенной степенью связности (например, виды дефектов оборудования, виды ремонтных материалов, виды химических реагентов для обслуживания) и либо разделять их (дивизивный подход) либо объединять (агломеративный подход) в зависимости от решаемой задачи [7]. Подход, основанный на нейронной сети Кохонена (карты Кохонена) – позволяет выполнять обработку информации по выборке элементов, упорядочивая элементы в сравнительно однородные группы. После чего формируется матрица показателей. На основе матрицы строится карта Кохонена. При обучении карты Кохонена вектор входного массива сравнивается с векторами нейронов активного слоя. Сравнение производится по функции близости. Нейрон активного слоя, для которого значение функции близости между вектором входного массива и вектором нейронов активного слоя максимально, объявляется «победителем». Таким образом становиться возможным стратифицировать данные. Например, возможно обработать данные по отказам и износу трубопроводных сетей, по отказам контрольно-измерительной аппаратуры (систем датчиков) – выделить элементы, требующие вывода в капитальный ремонт / замену, текущий ремонт, требующие дополнительного технического обслуживания и не требующие работ сверх установленных текущими процедурами. При этом для применения карт Кохонена также есть ряд ограничений. Так, например, окончательный результат работы нейронной сети в карте зависит от начальных установок сети, т.е. выбросы в изначальном обрабатываемом пакете данных могут существенно влиять на точность результатов. Подход кластеризации DBSCAN (Density-based spatial clustering of applications with noise) – позволяет хорошо фильтровать шумы и выбросы в потоке обрабатываемых данных. Поскольку данный алгоритм ориентирован на поиск «соседей» у каждого из анализуруемого элемента данных, в случае отсутствия соседства элемент отбрасывается как «шум». Способ хорош при обработке данных по телеметрии, дистанционному контролю технического состояния системой датчиков, обработке результатов вибродиагностического контроля работающего оборудования. Устранение явных «шумовых» элементов позволяет очистить выборку и сформировать четкие кластеры, что улучшает результаты анализа без потери качества данных [8]. Однако здесь существует своя специфика использования. Данный подход возможно применять к данным получаемым от технических устройств, функционирующих в условиях повышенной генерации нестандартных и случайных «шумовых» данных – работающие турбины, корабельные винты, двигатели, в ином случае при стабильной постоянной работе элемента оборудования (линейные части трубопроводов, цистерны, резервуары) есть риск принять выбивающиеся одиночные данные за «шум», в то время как именно они в данных устройствах могут сигнализировать об аварии или отказе. Подход, основанный на методе к-средних (один из самых распространенных видов кластерного анализа). Идея метода состоит в том, что, обладая пакетом статистических данных и изначально предполагая количество кластеров в обрабатываемом массиве, возможно последовательно проводя итерации вычислить центр масс для каждого из кластеров. При этом векторы по каждому из элементов данных разбиваются на кластеры вновь в соответствии с тем, какой из новых центров оказался ближе по выбранной метрике. Алгоритм завершается, когда на какой-то итерации не происходит изменения центра масс кластеров. В результате возможно установить частоту и вероятность реализации того или иного события, его весомость и взаимосвязь с другими факторами (в зависимости от характеристик сформированных кластеров, положения центра масс, плотности распределения событий). Данный метод удобен для анализа отказов и сбоев работы оборудования, работающего в стандартных условиях, без резких нагрузок и изменения картины действующих внешних сил. При этом не требуется уменьшать количество шумов и вбросов, кроме того, устанавливаются довольно определенные взаимосвязи между причинами отказов и аварий и действующими факторами или группой факторов [9]. Для рассматриваемой проблемы отказов и остановок работы кавитаторов в мазутном хозяйстве применим данный метод. Далее последовательно представим проблемы работы кавитационного оборудования, данные по отказам, а также применим регрессионный и кластерный анализ для обработки имеющейся статистической информации.
2. Отказы кавитационной установки и анализ причин их возникновения. Формирование статистической базы данных. Кавитационные установки, применяемые в резервуарных парках, имеют механическую часть состоящею из кавитирующего органа, создающего искусственное разряжение потока жидкости, а также электрическую часть – отвечающую за контроль и управление процессом. На протяжении 2018-2021 г. на ряде предприятий теплоэнергетики Калининградской области осуществлялся сбор статистических данных по отказам кавитационного оборудования. В результате было установлено, что наиболее частыми явлениями, приводящими к остановке системы в механической части, являются - протечки мазута во фланцевых ниппельных соединениях, а в электрической части – срабатывание аварийной защиты по одному из электропотребителей (рис. 1.). Руководствуясь принципом Парето было решено перейти к изучению непосредственно причин двух наиболее частых видов отказа кавитаторов. Для понимания причин возникновения протечек во фланцевых нипельных разъемах кавитаторов, а также причин срабатывания аварийной защиты по энергопотребителям были сформированы диаграммы основных факторов, реализация которых могла привести к возникновению подобных отказов (рис. 2., рис 3.).
Рис. 1. Количество отказов (по видам), зафиксированных при работе кавитационных установок в 2018-2021 гг.
1-протечки жидкости в фланцевых ниппельных разъемах; 2-срабатывание аварийной защиты по одному из электропотребителей; 3-отсутствие показаний, неправильные показания манометров; 4-отсутствие показаний расходомеров; 5-не работает вентилятор в пультовой Основываясь на записях журналов технического обслуживания и ремонта кавитационных установок, актов технической экспертизы работоспособности оборудования, зафиксированных показателях контролирующих систем, по приведенным факторам был сформирован пул статистических данных. А именно, для каждого факта протечки были зафиксированы соответствующие этому событию глубина коррозии металла, плотность прокладки и момент затяжки. Для каждого факта срабатывания системы защиты были зафиксированы соответствующие температура элементов трансформатора, сила тока и превышение напряжения трансформатора.
Рис. 2. Группа факторов, влияющих на возникновение протечек во фланцево нипельных разъемах кавитаторов (отказ по механическим показателям - утечка)
1. Ослабление затяжки крепежа; 1.1. Несоблюдение персоналом технологии установки; 1.2 Люфт, превышающий допустимые значения; 1.3 Износ резьбы соединительных отверстий; 2 Дефектность прокладки; 2.1 Смятие прокладки; 2.2 Забоины прокладки; 2.3 Низкое качество детали; 3 утечки, вызванные разрушением детали; 3.1 Химическая деградация композита фланцевых соединений; 3.2 Механические повреждения; 3.3 Деформации под влиянием вибраций и изгибающих нагрузок; 3.4 Коррозионное разрушение металлических элементов прокладки или фланца Рис. 3. Группа факторов, влияющих на срабатывание аварийной защиты по энергопотребителям кавитаторов (отказ по электрическим показателям – аварийное срабатывание)
1. срабатывание автоматического выключателя; 1.1. наличие короткого замыкания; 1.2 неисправен автоматический выключатель; 1.3 отказ дистанционной системы управления; 2.срабатывание электротеплового реле; 2.1 неисправность реле; 2.2 перегрузка электродвигателя; 2.3 проблема с датчиками уплотнением вала насоса (нет обратной связи в систему); 3.падение давления на выходе из насоса ниже допустимого (срабатывание датчика на падение давления); 3.1 неисправность манометра;3.2 неисправность цепи аварийной защиты; 3.3 неисправность датчика работы насоса
Далее в ходе исследования встала задача по обработке полученных данных математическим путем и выявления взаимосвязей между двумя основными зафиксированными видами отказов кавитаторов с одной стороны и выходом приведенных факторов за пределы допустимых значений (согласно технических регламентов), с другой стороны. Сформированный пул данных был стратифицирован, сначала по виду отказа кавитатора, далее внутри каждого вида по воздействовавшим факторам. В качестве зависимой переменной (т.е. "у") была выбрана частота отказов кавитаторов. Точнее, зафиксированное количество аварийных ситуаций в случае, если значение той или иной независимой переменной превышает граничное допустимое значение в соответствии с рабочей документацией на оборудование. При этом была указана зафиксированная величина параметра фактора на момент обнаружения отказа и приведен диапазон допустимых значений. Далее для обработки данных было решено использовать регрессионный и кластерный анализы. Этот подход позволил определить тесноту взаимного влияния отклонения факторов от допустимых значений на отказ кавитационного оборудования. В результате возможно выявить весомость факторов, приведших к возникновению отказа кавитаторов и как следствие разработать рекомендации по минимизации их воздействия.
3. Применение регрессионного анализа для определения взаимосвязи между отказами кавитаторов и воздействующими факторами. Как уже отмечалось, основная задача регрессионного анализа – установить функциональную зависимость одной величины от другой. В нашем случае – установить функциональную зависимость количества (частоты) отказов от численного значения того или иного влияющего параметра [10]. Для проведения регрессионного анализа используем данные получение в ходе фиксации протечек во фланцево-ниппельных разъемах кавитаторов, а также по срабатыванию аварийной защиты по энергопотреблению кавитаторов. Сопоставим данные по частоте возникновения утечек и плотности используемых прокладок, глубине коррозии металла, а также по степени затяжки крепежа фланцево-ниппельных разъёмов. Для отказов, связанных со срабатыванием аварийной защиты по энергопотреблению, сопоставим данные по частоте отказов, температуре при которой произошел отказ, силе тока и превышению допустимого напряжения. Ранжировав количество отказов по каждому из анализируемых механических параметров, получаем линейные зависимости частоты утечек в кавитаторах от каждого из воздействующих факторов, показанные на рис. 4. Для оценки корректности модели (определения того, насколько хорошо аппроксимирующая функция соответствует экспериментальным данным) чаще всего используют следующие статистические параметры: смещение (BIAS), среднеквадратическую ошибку (RMSE), коэффициент корреляции (R) и коэффициент детерминации (квадрат коэффициента корреляции, R2) [11].
(а) (б) (в) Рис 4. Наблюдаемые значения частоты утечек в кавитаторах в зависимости от плотности прокладки (а), момента затяжки (б) и глубины коррозии металла (в).
Ранжировав количество отказов по каждому из анализируемых параметров, зависящих от потребляемой энергии, получаем зависимости частоты срабатывания аварийной защиты от каждого из воздействующих факторов, показанные на рис. 5.
(а) (б) (в) Рис 5. Наблюдаемые значения частоты срабатывания аварийной защиты в зависимости от температуры элементов трансформаторов (а), значения тока трансформатора (б) и превышения напряжения системы (в).
- под смещением (BIAS) понимают разность между средними за весь период наблюдений рассчитанными и измеренными значениями:
Положительное значение BIAS означает, что модель дает в среднем завышенные значения, а отрицательное – заниженные. Т.е. BIAS служит индикатором систематической погрешности. - среднеквадратическая ошибка (RMSE) – это корень квадратный из суммы квадратов разностей между результатами наблюдений и расчетов, деленный на общее количество наблюдений: Фактически – оценка эффективности метода наименьших квадратов[12]. В дальнейшем, при наличии существенно большего объема фактических данных по отказам оборудования, вместо простых линейных моделей можно было бы использовать более сложные. Например, рассмотрим кусочно-линейную модель для зависимости количества отказов от плотности прокладки. Будем предполагать, что если плотность прокладки лежит в пределах нормы (1,5–2 г/см3) аппроксимация производится одной линейной функцией, а если вне этих пределов – то другой.
Тогда метод наименьших квадратов позволяет построить кусочно-линейную модель, представленную на рис. 6 [13,14]. Из табл. 1 следует, что точность такой модели по параметрам RMSE и коэффициенту детерминации существенно выше, чем простой линейной модели, представленной на рис. 4а. Таким образом, при постепенном накоплении статистических данных по виду и количеству отказов кавитаторов на тепловых станциях возможно произвести перерасчет и перейти к более точным кусочно-линейным регрессионным моделям [15]. Вместе с тем, с технической точки зрения результаты уже текущего регрессионного моделирования с построением линейных зависимостей показывают, что в механической части наиболее четкая зависимость между количеством отказов и отклонениями от допустимых значений параметров прослеживается в моменте затяжки прокладки. В случае если прокладка недозатянута – возникает свободное пространство, через которое происходит утечка или возможен доступ воды и воздуха для образования зон коррозии. В случае если прокладка перезатянута, то она становиться более напряженной хрупкой – быстрее изнашивается и трескается, в результате возникают еще большие утечки и повреждения. Таким образом в механической части именно данный фактор играет наибольшую роль в развитии отказа. В электрической части большее значение имеют сила тока и температура электрических элементов кавитационного оборудования. Данные параметры взаимосвязаны, и вместе с тем рост количества отказов по данным двум параметрам интенсивнее, чем при увеличении сопротивления. Это связано с спецификой используемых материалов, для систем резисторов и датчиков в кавитаторах. Полученные выводы говорят о необходимости пересмотра характеристик систем производителями и придания им большей стойкости к перепадам силы тока и температурным изменениям.
4. Применение кластерного анализа для определения взаимосвязи между отказами кавитаторов и воздействующими факторами. Примененный регрессионный анализ позволил рассмотреть индивидуальное влияние отклонения одного из рабочих параметров на частоту возникновения отказов кавитаторов. Однако, безусловно на оборудование воздействует комплекс факторов, и для изучения синергетического влияния таких отклонений используем кластерный анализ. Кластерный анализ позволяет выявить структуру статистических данных и установить наличие нетипичных объектов или специфических кластеров. Определение центров кластеризации позволят установить величину разброса данных по каждому из кластеров, то есть установить среднее отклонение, а, следовательно, определить какие величины рабочих параметров кавитационного оборудования будут наиболее характерны для работоспособного, предельного и неработоспособного состояний. При выполнении данного исследования возможно использовать различные методы кластеризации, например, нейронные сети Кохонена, иерархический метод, однако наиболее удобным и визуально показательным будет являться метод к-средних, разработанный польским ученым – Гуго Штейнгаузом. Кластерный анализ методом к-средних предполагает изначальное определение числа кластеров. Учитывая статистические данные по каждому из факторов, влияющих на кавитаторы, для отказов в виде утечек можно выделить три кластера – кластер данных по параметрам в «допустимой зоне», кластер данных в «зоне предельного состояния», кластер данных при котором оборудование находится в состоянии «зона отказа». В случае с электрической частью выделяется только два кластера – «допустимая зона» и «зона отказа». После выделения количества кластеров внутри них случайным образом выбираются центры кластеризации. Далее вычисляются средние арифметические точек, принадлежащих к определённому кластеру. Именно эти значения становятся новыми центрами кластеров. После ряда итераций, точка центра кластеризации каждого из кластеров стабилизируется, принимая оптимальное значение. Так как начало алгоритма опирается на случайный выбор изначальных центров кластеризации, для обеспечения наиболее качественного разбиения данных на кластеры, алгоритм повторяется несколько раз, при этом выбирается результат с самым качественным решением задачи кластеризации. Согласно теореме невозможности Клейнберга, оптимального алгоритма кластеризации не существует, однако качество результата алгоритма можно оценить по ряду критериев. Для оценки качества кластеризации полученных данных были выбраны критерии компактности и отделимости кластеров, индекс Данна и силуэт [16]. Компактность кластеров (Cluster Cohesion) измеряет степень сходства элементов кластера. В данном случае степенью сходства будем считать суммой квадратов евклидового расстояние между точками внутри одного кластера и центром этого кластера. Чем меньше данное значение, тем лучше качество кластеризации так как в один кластер попадают условно схожие точки. Компактность выражается следующей формулой: В вышеуказанной формуле – кластер из множества полученных алгоритмом кластеров , – элемент кластера , – центр кластера . Отделимость кластеров оценивает на сколько результирующие кластеры отделены друг от друга. Чем больше значение отделения кластеров, тем лучше схожие элементы были сгруппированы. В анализе данных воспользуемся отделимостью каждого кластера индивидуально, и средней отделимостью кластеров в целом [17]. Индивидуальную отделимость кластера можно определить, как минимальное расстояние от центра данного кластера, до центров остальных кластеров: , -центры кластеров и соответственно. Среднюю отделимость можно рассчитать, как среднее расстояние центров каждого кластера до центра всей выборки: - количество кластеров, – центр (средняя точка) выборки, – центр кластера .
Индекс Данна позволяет оценить внутрекластерную компактность и отделимость кластеров (расстояние кластеров друг от друга). Чем выше индекс Данна, тем кластеризация качественнее. Формула расчета индекса Данна следующая: В данном случае – множество кластеров, – функция расстояние. и – кластеры из множества , – элементы кластера . Функцию расстояния в случае расстояния между кластерами определим как минимальное расстояние между элементами кластеров:
В случае расстояние между элементами рассчитывается евклидово расстояние. Оценка силуэта кластера также качественно оценивает на сколько подходит точка к её кластеру. Определяется силуэт точки степенью её схожестью с точками в кластере, и степенью её различия с точками других кластеров. Для точки силуэт выражается формулой:
Функции и являются средним расстоянием от точки до других точек кластера и минимальное среднее расстояние от точки до точек других кластеров соответственно. Модуль кластеров и в данном случае означает количество элементов в данном кластере [18]. Оценку силуэта кластера можно определить как среднее значение силуэта его элементов. Для вычисления представленных результатов был разработан скрипт на языке python с помощью библиотек numpy, для эффективной работы с многомерными данными, и matplotlib для визуализации данных. Скрипт состоит из реализации алгоритма k-средних, функций для расчета вышеописанных оценок качества, а также для визуализации полученных результатов. Для создания оболочки для каждого кластера был построен эллипсоид с центром в центральной точке кластера, и осями равными диаметру кластера (разность максимального и минимального значения) по соответствующей координате [19]. Выполняя алгоритм кластеризации, и вычисляя вышеописанные характеристики по результирующим кластерам, получаем следующие таблицы (таблицы 2 и 3). Анализируя результаты кластеризации, можно отметить, что индекс Данна имеет достаточно низкое значение, что связано с высоким значением компактности – то есть разброса в каждом конкретном кластере, и низким значением отделимости, как каждого конкретного кластера, так и множества кластеров в целом, однако силуэт каждого кластера превышает среднее значение , что свидетельствует о достаточной схожести данных, сгруппированных в кластеры Из этого можно сделать вывод, что не смотря на разброс точек в кластерах, каждый кластер содержит достаточно схожие точки. В результате проведенного кластерного анализа установлено, что в переходе кавитационного оборудования от работоспособного состояния к предельному и неработоспособному участвуют отклонения по всем рассматриваемым параметрам как в механической, так и в электрической части. Об этом говорит отделимость кластеров.
Таблица 2. Показатели кластеризации при анализе отказов механической части кавитаторов.
Таблица 3. Показатели кластеризации при анализе отказов электрической части кавитаторов.
Больший размер кластеров в неработоспособном и предельном состоянии, по сравнению с кластером допустимой зоны говорит о том, что, во-первых, в данных кластерах играют большую роль стохастические процессы (что характерно для оборудования выходящего из строя), а во-вторых, косвенно свидетельствует о том, что на частоту отказов кавитационного оборудования влияют и иные факторы, не рассмотренные в настоящем исследовании (что делает менее однородными кластеры предельного состояния и состояния «отказа» системы).
Рис 7. Результаты кластерного анализа по отказам механической (a) и электрической (б), систем кавитаторов. Красным выделены – кластеры, в которых оборудование вышло из строя (отказ), оранжевым – кластеры, в которых оборудование находится в предельном состоянии, зеленым - кластеры, в которых работа оборудования осуществляется в допустимой
В большинстве кластеров удаленность точек от центров кластеризации равномерна, что показывает на наличие взаимосвязей между всеми рассматриваемыми параметрами и отклонениями между ними [20]. Несколько больший и размытый характер имеет кластер «отказа» в электрической части, что очевидно связано с недостаточным количеством числа измерений или с большими величинами отклонений по рассматриваемым параметрам от предельных значений. Полученные результаты кластерного анализа позволяют разрабатывать организационные и технологические мероприятия по обеспечению большей стабильности функционирования кавитаторов в резервуарных парках тепловых станций. Это может быть достигнуто как через реорганизацию системы технического обслуживания данных механизмов, так и через работу с поставщиками оборудования и расходных материалов.
Заключение. В результате проведенного исследования выявлено, что наибольшее число утечек в кавитаторах связано с низким качеством применяемых прокладок и с неравномерной силой затяжки резьбовых соединений. Отказы электрической части в целом обусловлены превышением температуры токоведущих элементов систем и ростом силы тока, что приводит к аварийной остановке кавитатора. Использованные регрессионный и кластерный анализы позволили установить взаимовлияние рассматриваемых факторов на переход системы из работоспособного состояния в предельное и далее в неработоспособное. В регрессионном анализе этот переход можно связать с точкой изменения графика функции (при кусочно-линейной модели), а в кластерном анализе с пустой зоной между кластерами, характерезующейся отделимостью одного от другого. В итоге с помощью обоих математических методов установлено, что наибольшее влияние на работоспособность кавитаторов оказывает отклонение от допустимых значений параметров момента затяжки прокладки и ее плотности в механической части, а также силы тока и температуры в электрической части. Данные параметры наиболее тесно взаимосвязаны. Использованный метод наименьших квадратов, также, как и к-метод кластеризации показали свою эффективность для обработки небольшого массива статистических данных (что, к сожалению, является спецификой использования данного оборудования). В целом для проведения дальнейших исследований отказов кавитаторов по мере накопления дополнительной информации рационально использование не линейных регрессионных моделей, а кусочно-линейных моделей. Кроме того, необходимо рассмотреть возможность проведения замеров и по остальным параметрам для детализации их взаимовлияния и повышения точности кластеризации. На основе полученных математических результатов может быть сформирован ряд технических решений выявленных проблем. Так сокращение числа отказов кавитаторов может быть достигнуто путем замены типов используемых прокладок на прокладки с большей прочностью, а также при использовании динамометрических ключей в ходе сборки элементов кавитаторов. Кроме того, требуется изменение графика технического обслуживания и ремонта оборудования. Необходимо рассмотреть и возможность внедрения систем дистанционного контроля параметров установки. Рациональна также и замена используемых материалов в электрических системах или внесение изменений в саму электрическую схему с целью обеспечения ее меньшей чувствительности к скачкам силы тока или росту температуры (работа с производителем электрической части). Например, это может быть достигнуто путем внедрения в конструкцию электрической цепи датчиков тока на основе эффекта Холла.
Благодарности. Регрессионный анализ данных проводился в рамках госзадания ИО РАН (тема № FMWE-2021-0012). Библиография
1. Мутугуллина, И. А. Применение подогревателей при использовании мазута / И. А. Мутугуллина // Международный научный журнал. – 2017 – № 03-2. – С. 92-95.
2. Салтанаева, Е. А. Определение эффективности применения кавитаторов при подготовке к сжиганию мазута с высоким содержанием воды / Е. А. Салтанаева // Тинчуринские чтения : Материалы XIV Международной молодежной научной конференции. В 3-х томах, Казань, 23 апреля – 26 2019 года / Под общей редакцией Э.Ю. Абдуллазянова. – Казань: Казанский государственный энергетический университет, 2019. – С. 249-251. – EDN SEXETF. 3. Есаян, В. Н. Специфика использования кавитаторов для борьбы с застыванием резервного топлива (мазута) в стальных резервуарах / В. Н. Есаян // Молодежь и XXI век-2022 : Материалы 12-й Международной молодежной научной конференции. В 4-х томах, Курск, 17–18 февраля 2022 года / Отв. редактор М.С. Разумов. – Курск: Юго-Западный государственный университет, 2022. – С. 228-232. – DOI 10.47581/2022/ML-61/Esaan.01. – EDN SUZDTE. 4. Application of Correlation-Based Regression Analysis for Improvement of Power Distribution Network / Sh. Hagiwara, T. Uezono, T. Sato, K. Masu // IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences. – 2008. – Vol. E91-A. – No 4. – P. 951. – EDN IPQZCN. 5. Smirnova, A. Correlation-regression analysis in Excel when solving problems / A. Smirnova // Process Management and Scientific Developments. Part 1., Birmingham, 09 июня 2021 года. – Мельбурн: AUS PUBLISHERS, 2021. – P. 40-44. – DOI 10.34660/INF.2021.51.55.007. – EDN ZDNYRN. 6. Mohan, R., Sivakumar, V. Analysis and correlation of ultrasound cavitation energy in ultrasound tank with coloration of fibrous materials: leather dyeing. Braz. J. Chem. Eng. (2022). https://doi.org/10.1007/s43153-022-00241-7 7. Santosh Kumar Majhi, Shubhra Biswal, Optimal cluster analysis using hybrid K-Means and Ant Lion Optimizer, Karbala International Journal of Modern Science, Volume 4, Issue 4, 2018, Pages 347-360, ISSN 2405-609X, https://doi.org/10.1016/j.kijoms.2018.09.001. 8. Lopes H. E. G., Gosling M. S. Cluster analysis in practice: Dealing with outliers in managerial research //Revista de Administração Contemporânea. – 2020. – Т. 25. 9. A Performance of the Scattered Averaging Technique based on the Dataset for the Cluster Center Initialization / A. B. W. Putra, A. F. O. Gaffar, B. Suprapty, Mulyanto // International Journal of Modern Education and Computer Science. – 2021. – Vol. 13. – No 2. – P. 40-50. – DOI 10.5815/ijmecs.2021.02.05. 10. Gruzdev A. N. Accounting for long-term serial correlation in a linear regression problem //IOP Conference Series: Earth and Environmental Science. – IOP Publishing, 2019. – Т. 231. – №. 1. – С. 012020. 11. Frumin, L. L. Linear least squares method in nonlinear parametric inverse problems / L. L. Frumin // Journal of Inverse and Ill-Posed Problems. – 2020. – Vol. 28. – No 2. – P. 307-312. – DOI 10.1515/jiip-2019-0009 12. Акимова, И. В. Компьютерная реализация метода наименьших квадратов в задачах строительного материаловедения / И. В. Акимова, Е. И. Титова // Современные проблемы науки и образования. – 2020. – № 2. – С. 18. – DOI 10.17513/spno.29626. 13. Сапкина, Н. В. Нечеткие линейные регрессионные модели Метод наименьших квадратов для модели с четкими входами и гауссовым нечетким выходом / Н. В. Сапкина // Глобальная научная интеграция. – 2011. – № 6. – С. 66-67. 14. Носков, С. И. Оценка динамики вкладов факторов в линейной регрессионной модели / С. И. Носков // Вестник Воронежского государственного технического университета. – 2021. – Т. 17. – № 5. – С. 15-19. – DOI 10.36622/VSTU.2021.15.5.002. 15. A Multiprocess Joint Modeling Method for Performance Prediction of Nonlinear Industrial Processes Based on Multitask Least Squares Support Vector Machine / F. Chu, X. Ma, B. Dai [et al.] // Industrial and Engineering Chemistry Research. – 2022. – Vol. 61. – No 3. – P. 1443-1452. – DOI 10.1021/acs.iecr.1c04075. 16. Pandey, P., & Singh, I. (2016). Comparision between K-mean clustering and improved K-mean clustering. International Journal of Computer Applications, 146(13), 39-42. http://doi.org/10.5120/IJCA2016910868 17. Lund B., Ma J. A review of cluster analysis techniques and their uses in library and information science research: k-means and k-medoids clustering //Performance Measurement and Metrics. – 2021. 18. Борисова, Л. В. Основы теории эксперимента. Построение математических моделей / Л. В. Борисова, В. П. Димитров, Е. М. Зубрилина. – Ростов-на-Дону : ДГТУ-Принт, 2018. – 105 с. – ISBN 978-5-6041793-7-6. 19. Кравцов, А. Н. Моделирование технологического обеспечения производственно-технических характеристик блочно-модульных инструментов с элементами диагностики и контроля на основе системной оптимизации : Монография / А. Н. Кравцов. – Ирбит : Закрытое акционерное общество "ОНИКС", 2015. – 300 с. – ISBN 978-5-906703-09-5. 20. Щербатов, И. А. Управление сложными слабоформализуемыми многокомпонентными системами / И. А. Щербатов. – Ростов-на-Дону : Южный научный центр РАН, 2015. – 268 с. – ISBN 978-5-4358-0107-1. References
1. Mutugullina, I. A. Primenenie podogrevatelej pri ispol'zovanii mazuta [Application of heaters in fuel oil usage] / I. A. Mutugullina // Mezhdunarodnyj nauchnyj zhurnal. – 2017 – № 03-2. – S. 92-95.
2. Saltanaeva, E. A. Opredelenie effektivnosti primeneniya kavitatorov pri podgotovke k szhiganiyu mazuta s vysokim soderzhaniem vody [Determination of the effectiveness of cavitators usage in preparation for the combustion of fuel oil with a high water content] / E. A. Saltanaeva // Tinchurinskie chteniya : Materialy XIV Mezhdunarodnoj molodezhnoj nauchnoj konferencii. V 3-h tomah, Kazan', 23 aprelya – 26 2019 goda / Pod obshchej redakciej E.YU. Abdullazyanova. – Kazan': Kazanskij gosudarstvennyj energeticheskij universitet, 2019. – S. 249-251. – EDN SEXETF. 3. Esayan, V. N. Specifika ispol'zovaniya kavitatorov dlya bor'by s zastyvaniem rezervnogo topliva (mazuta) v stal'nyh rezervuarah [The specifics of cavitators usage for combat the solidification of reserve fuel (fuel oil) in steel tanks] / V. N. Esayan // Molodezh' i XXI vek-2022 : Materialy 12-j Mezhdunarodnoj molodezhnoj nauchnoj konferencii. V 4-h tomah, Kursk, 17–18 fevralya 2022 goda / Otv. redaktor M.S. Razumov. – Kursk: YUgo-Zapadnyj gosudarstvennyj universitet, 2022. – S. 228-232. – DOI 10.47581/2022/ML-61/Esaan.01. – EDN SUZDTE. 4. Application of Correlation-Based Regression Analysis for Improvement of Power Distribution Network / Sh. Hagiwara, T. Uezono, T. Sato, K. Masu // IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences. – 2008. – Vol. E91-A. – No 4. – P. 951. – EDN IPQZCN. 5. Smirnova, A. Correlation-regression analysis in Excel when solving problems / A. Smirnova // Process Management and Scientific Developments. Part 1., Birmingham, 09 июня 2021 года. – Мельбурн: AUS PUBLISHERS, 2021. – P. 40-44. – DOI 10.34660/INF.2021.51.55.007. – EDN ZDNYRN. 6. Mohan, R., Sivakumar, V. Analysis and correlation of ultrasound cavitation energy in ultrasound tank with coloration of fibrous materials: leather dyeing. Braz. J. Chem. Eng. (2022). https://doi.org/10.1007/s43153-022-00241-7 7. Santosh Kumar Majhi, Shubhra Biswal, Optimal cluster analysis using hybrid K-Means and Ant Lion Optimizer, Karbala International Journal of Modern Science, Volume 4, Issue 4, 2018, Pages 347-360, ISSN 2405-609X, https://doi.org/10.1016/j.kijoms.2018.09.001. 8. Lopes H. E. G., Gosling M. S. Cluster analysis in practice: Dealing with outliers in managerial research //Revista de Administração Contemporânea. – 2020. – Т. 25. 9. A Performance of the Scattered Averaging Technique based on the Dataset for the Cluster Center Initialization / A. B. W. Putra, A. F. O. Gaffar, B. Suprapty, Mulyanto // International Journal of Modern Education and Computer Science. – 2021. – Vol. 13. – No 2. – P. 40-50. – DOI 10.5815/ijmecs.2021.02.05. 10. Gruzdev A. N. Accounting for long-term serial correlation in a linear regression problem //IOP Conference Series: Earth and Environmental Science. – IOP Publishing, 2019. – Т. 231. – №. 1. – С. 012020. 11. Frumin, L. L. Linear least squares method in nonlinear parametric inverse problems / L. L. Frumin // Journal of Inverse and Ill-Posed Problems. – 2020. – Vol. 28. – No 2. – P. 307-312. – DOI 10.1515/jiip-2019-0009 12. Akimova, I. V. Komp'yuternaya realizaciya metoda naimen'shih kvadratov v zadachah stroitel'nogo materialovedeniya [Computer implementation of the least squares method in problems of building materials science] / I. V. Akimova, E. I. Titova // Sovremennye problemy nauki i obrazovaniya. – 2020. – № 2. – S. 18. – DOI 10.17513/spno.29626. 13. Sapkina, N. V. Nechetkie linejnye regressionnye modeli. Metod naimen'shih kvadratov dlya modeli s chetkimi vhodami i gaussovym nechetkim vyhodom [Fuzzy linear regression models. Least Squares for a Model with Crisp Inputs and a Gaussian Fuzzy Output]/ N. V. Sapkina // Global'naya nauchnaya integraciya. – 2011. – № 6. – S. 66-67. 14. Noskov, S. I. Ocenka dinamiki vkladov faktorov v linejnoj regressionnoj modeli [Estimation of the dynamics of the contributions of factors in a linear regression model]/ S. I. Noskov // Vestnik Voronezhskogo gosudarstvennogo tekhnicheskogo universiteta. – 2021. – T. 17. – № 5. – S. 15-19. – DOI 10.36622/VSTU.2021.15.5.002. 15. A Multiprocess Joint Modeling Method for Performance Prediction of Nonlinear Industrial Processes Based on Multitask Least Squares Support Vector Machine / F. Chu, X. Ma, B. Dai [et al.] // Industrial and Engineering Chemistry Research. – 2022. – Vol. 61. – No 3. – P. 1443-1452. – DOI 10.1021/acs.iecr.1c04075. 16. Pandey, P., & Singh, I. (2016). Comparision between K-mean clustering and improved K-mean clustering. International Journal of Computer Applications, 146(13), 39-42. http://doi.org/10.5120/IJCA2016910868 17. Lund B., Ma J. A review of cluster analysis techniques and their uses in library and information science research: k-means and k-medoids clustering //Performance Measurement and Metrics. – 2021. 18. Borisova, L. V. Osnovy teorii eksperimenta. Postroenie matematicheskih modelej [Fundamentals of the theory of experiment. Building mathematical models]/ L. V. Borisova, V. P. Dimitrov, E. M. Zubrilina. – Rostov-na-Donu : DGTU-Print, 2018. – 105 s. – ISBN 978-5-6041793-7-6 19. Kravcov, A. N. Modelirovanie tekhnologicheskogo obespecheniya proizvodstvenno-tekhnicheskih harakteristik blochno-modul'nyh instrumentov s elementami diagnostiki i kontrolya na osnove sistemnoj optimizacii [Modeling of technological support of production and technical characteristics of block-modular tools with elements of diagnostics and control based on system optimization] : Monografiya / A. N. Kravcov. – Ir-bit : Zakrytoe akcionernoe obshchestvo "ONIKS", 2015. – 300 s. – ISBN 978-5-906703-09-5. 20. Shcherbatov, I. A. Upravlenie slozhnymi slaboformalizuemymi mnogokomponentnymi sistemami [Management of complex weakly formalized multicomponent systems] / I. A. Shcherbatov. – Rostov-na-Donu : Yuzhnyj nauchnyj centr RAN, 2015. – 268 s. – ISBN 978-5-4358-0107-1. |