POSSIBILITY OF APPLYING A MODERN METHOD FOR PREDICTING WELL FAILURES IN THE FIELDS OF JSC NC KMG
- Authors: Utemisova L.G.1, Merembayev T.Z.2, Bekbau B.E.1
-
Affiliations:
- KMG Engineering LLP
- Институт информационных и вычислительных технологий КН МОН РК
- Section: Reviews
- URL: https://vestnik-ngo.kz/2707-4226/article/view/108750
- DOI: https://doi.org/10.54859/kjogi108750
- ID: 108750
Cite item
Full Text
Abstract
This article presents an analysis of the possibility of using machine learning to improve the reliability of underground well equipment in the fields of JSC NC KazMunayGas. The research focuses on the development and validation of predictive models capable of predicting potential downhole equipment failures with high accuracy. Existing techniques, machine learning approaches and their application in real-life conditions are analyzed in detail, highlighting key success factors and limitations. The study results demonstrate the enormous potential of using the optimal machine learning well failure prediction model to reduce unscheduled downtime and optimize well maintenance processes. The article contributes to the development of the application of predictive analysis methods in petroleum engineering, offering a path to improving the efficiency and safety of oil and gas production.
Full Text
Введение
В процессе освоения нефтегазового месторождения, пластовая энергия с момента начала добычи скважинной продукции уменьшается, в связи с этим после прекращения фонтанирования переходят на механизированный способ эксплуатации. Одним из важных этапов добычи нефти является подъем нефти на поверхность с помощью систем механизированной добычи. В настоящее время АО «НК «КазМунайГаз» (АО НК КМГ) основной механизированный фонд скважин эксплуатируется штанговыми глубинными насосами (ШГН). Ключевой особенностью ШГН, который объясняет его широкое применение в производстве, является его высокое значение коэффициента полезного действия, возможность использования в скважинах с осложняющими факторами, возможность выполнения ремонтных работ в полевых условиях. Основными недостатками ШГН является ограничения по глубине скважин, невозможность применения в искривленных скважинах, невысокое значение коэффициента подачи. Следовательно, одним из важных параметров, характеризующих долговременную работу глубинно-насосного оборудования, является наработка на отказ оборудования [1].
Частота преждевременных отказов глубинно-насосного оборудования месторождений, а также высокая доля часторемонтируемого фонда скважин (ЧРФ) показывает необходимость применения современных методов диагностики и прогнозирования отказов оборудования (Рис. 1) [2]. Авторами был изучен международный опыт применения прогнозирования отказов внутрискважинного оборудования и изучены возможности применения на месторождениях группы компаний АО НК КМГ.
Рис. 1 – Доля ремонтов скважин ЧРФ
Целью исследования является построение и дальнейшее применение на промысловых данных модели прогнозирования отказов глубинно-насосного оборудования скважин, эксплуатируемых ШГН. Данная работа выполняется с целью уменьшения внепланового останова оборудования, перевод внепланового отказа в плановый за счет раннего заблаговременного прогноза отказа оборудования и планирования необходимых мероприятий на скважинах.
Для достижения цели решаются следующие задачи:
- анализ и подготовка качественных данных;
- подготовка и определение признаков, которые влияют на прогноз;
- построение и выбор моделей предсказания отказов;
- обучение модели для задачи прогнозирования;
- валидация модели на реальных данных.
Область применения машинного обучения
Основной фонд скважин группы компания АО НК «КазМунайГаз» представлен механизированным способом эксплуатации, в частности использование ШГН для добычи пластовой жидкости на поверхность. В процессе эксплуатации установки ШГН могут отказывать по ряду причин, среди которых основными причинами отказа могут послужить: 1) геологические причины, такие как снижение притока; 2) технологические причины, не корректный подбор глубинно-насосного оборудования. Анализ причины отказов подземных ремонтов скважин (ПРС) показывает ряд скважин с высокой частотой ремонтов в год (3 и более ремонтов в год), которые относятся к ЧРФ скважин.
Основными причинами отказов на скважинах, оборудованных ШГН, является обрыв штанг, протирание штанг, негерметичность насосно-компрессорных труб и др. На Рис. 2 представлена статистика причин отказов глубинно-насосного оборудования [2]. Основываясь на исторических данных работы скважины, а также отказов скважин с причинами отказов, как позывает международный опыт, можно построить модели прогнозирования отказов скважины, c помощью которой на начальном уровне можно предсказать следующую дату отказа, и на более усложненной модели предсказания – это предсказание причины отказа.
Статистика отказов скважин группы компаний АО НК КМГ показывает необходимость применения предиктивной аналитики скважин (Рис. 2).
Рис. 2 – Основные причины отказов глубинно-насосного оборудования.
Изученный международный опыт показывает возможность построения модели предсказания даты отказов скважин. Подход к построению модели прогнозирования имеет общую структуру, где основным шагом построения модели предсказания отказов является сбор и подготовка качественных данных. Данные для построения модели можно разделить на статистические и динамические, где статистические данные – данные, которые в процессе жизни скважины не меняются, динамические данные-данные, которые меняются с течением времени. Так, авторами работы Prediction of ESPs Failure Using ML at Western Siberia Oilfields with Large Number of Wells [3] подробно описана группировка параметров работы скважины, оборудованных электроцентробежными насосами. В работе авторами уделяется особое внимание подготовке данных для построения модели прогнозирования отказов. Так как успешность модели прогнозирования зависит от качества используемых данных.
Основную долю построения и успешности модели предсказания отказов зависит от полноты и качества данных для модели. В связи с этим, при подготовке модели прогнозирования необходимо особое внимание уделить подготовке данных для модели, так как успешность предсказания модели зависит от качества используемых данных в модели прогнозирования.
Высокое качество входных данных имеет решающее значение для надежных результатов анализа; поэтому важно, чтобы подготовка данных осуществлялась с применением надлежащих методов проверки доступности данных и проверки их работоспособности. Это позволяет избежать ненадежных данных в процессе построения модели и гарантировать, что модели обучаются на основе соответствующих характеристик данных.
Данные, необходимые для построения модели прогнозирования отказов глубинно-насосного оборудования, включают статические данные, такие как профиль скважины, установленное оборудование, история отказов и технического обслуживания, а также данные, полученные в режиме реального времени по скважинам (режим работы скважины) – динамические данные.
Большую часть данных, используемых для машинного обучения, можно разделить на 4 основных типа: числовые или количественные данные, которые могут быть непрерывными и дискретными, категориальные данные, данные временных рядов и текст.
Предварительная обработка данных - это метод интеллектуального анализа данных, который включает преобразование необработанных данных в корректный формат. Поскольку реальные данные часто неполны, противоречивы и/или не содержат определенных моделей поведения или тенденций, а также могут содержать множество ошибок. Предварительная обработка данных - проверенный метод решения проблем некорректности данных, поскольку предварительная обработка данных напрямую влияет на способность модели прогнозирования к обучению.
В связи с этим, при применении современного метода диагностики отказов скважин, необходимо основательно подойти к подготовке и проверке качества данных.
Для прогнозирования отключений и сбоев системы глубинно-насосного оборудования создаются различные алгоритмы машинного обучения, тесно связанные с моделями больших данных, которые описывают рабочее состояние глубинно-насосного оборудования на основе собранных параметров.
Подход машинного обучения
Машинное обучение - это методология, в которой компьютерные системы обучаются на основе исторических данных, чтобы делать прогнозы и принимать решения [4, 5]. Для построения модели предсказания отказов, необходимо выполнить следующие шаги:
- Сбор данных: сначала собираются данные о работе подземного оборудования;
- Подготовка данных: данные анализируются, очищаются от выбросов и пропущенных значений, а также могут быть созданы новые признаки;
- Обучение модели: на основе отработанных данных создается модель машинного обучения, которая может предсказывать вероятность отказа насоса на основе текущих параметров;
- Мониторинг и обновление: модель регулярно мониторится и обновляется на основе новых данных, чтобы сохранять актуальность и точность прогнозов.
Одним из ключевых применений машинного обучения является создание моделей, которые способны предсказывать отказы подземного оборудования скважин. Для этого используются различные методы, включая:
- Методы временных рядов, которые могут использоваться для анализа и прогнозирования изменений параметров скважин со временем. Это помогает выявить паттерны, которые предшествуют отказам, и принимать меры предосторожности заблаговременно.
- Методы классификации могут определять состояние оборудования как «нормальное» или «неисправное» на основе данных о его работе.
- Методы кластеризации могут группировать скважины с похожими характеристиками и историей, что позволяет выявлять общие аномалии и прогнозировать отказы на групповом уровне.
Одним из главных приоритетов использования машинного обучения в предсказании отказы – это возможность проводить профилактическое обслуживание. Модели машинного обучения определяют, когда оборудование приближается к отказу, и позволяют инженерам и техническим специалистам предпринимать меры для предотвращения отказов, и как следствие останова скважин.
Широкую оценку использования машинного обучения получили при построении модели предсказания отказов скважин, оборудованных электроцентробежными насосами. В скважинах, оборудованных электроцентробежными насосами, машинное обучение позволяет создавать системы мониторинга, которые следят за работой насосов в режиме реального времени. Датчики, установленные на насосах, собирают данные о давлении, расходе, вибрации и других параметрах, которые затем анализируются с использованием машинного обучения для выявления аномалий и предсказания возможных отказов.
На сегодняшний день авторами статьи проводятся работы по построению и оценке моделей предиктивной аналитики отказов на скважинах, оборудованных штанговыми глубинными насосными оборудованиями. ШГН занимают львиную долю фонда АО НК КМГ, особенно в случае с низкопродуктивными и газонасыщенными скважинами.
На Рис. 3 показана схема работы штанговой скважинной насосной установки, распространённой на месторождениях АО НК КМГ. Мониторинг и оптимизация работы ШГН являются ключевыми факторами для повышения производительности скважин и снижения затрат. Применение моделей машинного обучения в данной области обосновано и имеет потенциал для достижения высокого эффекта.
Рис. 3 – Схема работы штанговой скважинной насосной установки
В данном исследовании мы рассматриваем использование машинного обучения для предсказание предаварийного состояния в скважинах, оборудованных ШГН, а именно:
- Сложность работы с переменными условиями: Работа ШГН зависит от множества факторов, таких как глубина скважины, состав нефтегазовой смеси, давление и температура в скважине. Эти параметры постоянно меняются, и модели машинного обучения могут адаптироваться к изменениям, что сложно сделать с использованием традиционных методов.
- Многофакторный анализ: Машинное обучение может анализировать множество параметров одновременно и определять, какие из них оказывают наибольшее влияние на производительность ШГН. Это помогает выявить скрытые закономерности и оптимизировать настройки насосов.
- Прогнозирование отказов: Модели машинного обучения могут предсказывать возможные отказы ШГН и предотвращать аварийные ситуации. Это снижает риски и экономит средства на ремонтах и заменах оборудования.
Использование модели машинного обучения позволяет создавать модели предсказания отказов, опираясь на исторические данные работы скважины. Авторами для создания модели использованы данные по кривизне ствола скважин (инклинометрия скважин – темп набора кривизны, зенитный угол ствола скважины), режим работы скважин (дебит жидкости, обводненность), режим откачки, дата и причина отказа ПРС [5, 6]. Огромную часть работы при создании модели авторы потратили на обработку и подготовку данных для дальнейшего построения модели предсказания, так как успешность модели предсказания зависит от полноты и качества входных данных.
Для увеличения класса точности предсказания, авторами проводится моделирование различными методами для дальнейшего выбора успешной модели, и применения ее на месторождениях с целью уменьшения количества отказов скважин, оборудованных штанговыми глубинными насосными оборудованиями.
Как результат, модели предсказания отказов глубинно-насосного оборудования, представляют следующие преимущества [7]:
- Проактивное обслуживание (заблаговременное обслуживание): модели предиктивной аналитики отказов позволяют проводить обслуживание насосов до того, как произойдет отказ, сокращая количество ремонтов и сокращая потери добычи жидкости;
- Оптимизация затрат: предсказание отказов позволяет оптимизировать расходы на ремонт и замену оборудования;
- Увеличение надежности: регулярный мониторинг и обновление модели могут значительно повысить надежность насосного оборудования;
- Снижение рисков: предсказание отказов помогает снизить риски, связанные с нештатными ситуациями, такими как протечки или аварии.
Модели машинного обучения имеют общепризнанный метод поэтапного формирования модели обучения:
1 – Обнаружение аномалий;
2 – Диагностика отказов;
3 – Прогнозирование;
4 – Уменьшение последствий (смягчение).
В процессе подготовки данных были собраны исторические данные фонда скважин, эксплуатируемых ШГН. По итогам сбора, была проведена предварительная подготовка и верификация данных путем очистки и интерполяции имеющихся данных скважины. За основу анализа были приняты следующие данные скважины: режим эксплуатации скважин, кривизна ствола скважины, история ПРС (дата и причина отказа), спущенное глубинно-насосное оборудование, режим откачки (число качаний, длина ходу станка-качалки).
Исторические данные работы скважины были сгруппированы на статистические (постоянные в процессе эксплуатации скважины) и динамические (переменные в процессе эксплуатации скважины).
В процессе формирования модели предсказания отказов глубинно-насосного оборудования аномалией является отказ подземного оборудования – дата отказа, как первая ступень предсказания, и более усложненная модель – предсказание причины отказа.
Диагностика отказов подземного оборудования, дальнейшее формирование модели прогнозирования, и их использование позволит недропользователям проводить смягчение последствий отказов оборудования путем реализации заблаговременных мероприятий на скважинах с целью уменьшения простоев скважин, или же оснащения промысла необходимым подземным оборудованием с целью минимизации простоев скважин из-за ПРС.
Успешность модели прогнозирования зависит от выбора корректного метода построения модели предиктивной аналитики.
Модели машинного обучения представляют собой математические алгоритмы, которые обучаются на данных и используются для прогнозирования или классификации новых данных. Существует множество различных моделей машинного обучения, и выбор определенной модели зависит от характера задачи, доступных данных и требуемых результатов. Основные методы модели машинного обучения [8]:
- Метод опорных векторов (Support vector machine) – используется для задач классификации и регрессии.
- Случайный лес (Random Forest) – деревья решений строятся на основе вопросов о признаках и позволяют делать прогнозы. Случайные леса – это ансамбль деревьев, что улучшает обобщающую способность модели.
- Градиентный бустинг (XGBoost) – ансамблевые методы, которые комбинируют несколько слабых моделей для создания более сильной и устойчивой модели.
- Нейронные сети (ANN) – моделирование, состоящее из искусственных нейронов, применяются в задачах на распознавание изображений и обработке естественного языка.
- Долгосрочная память (LSTM) – моделирование последовательных данных, учитывает долгосрочные зависимости в данных.
- Вариационные автоэнкодеры (VAE) – эффективный способ генерации новых данных, изучения структуры скрытого пространства. Инструмент для обучения вероятностных моделей и генерации новых данных, сохраняя при этом структуру входных данных.
Корректность модели предсказания можно определить с помощью обнаружения аномалий, целью является определение верной работы модели в активном режиме. Есть несколько способов обнаружения аномалий с использованием моделей машинного обучения: классификация (доступны помеченные данные разных классов), одноклассовая классификация (доступны помеченные данные только одного класса) и кластеризация (доступны не помеченные данные).
Обнаружение аномалий является одним из важных шагов в выявлении необычных и аномальных паттернов в данных, которые могут указывать на наличие проблем. На Рис. 4 указаны несколько методов, которые часто используются для обнаружения аномалий с использованием глубокого обучения.
Рис. 4 - Эффективные инструменты для обнаружения аномалий
В работе по предсказанию отказов подземного оборудования скважин авторами был использован один из методов градиентного бустинга LightGBM [5, 9], который помог модели лучше понимать последовательности данных на обычных и нормальных данных. Так как отказы скважин сопровождаются на всем протяжении эксплуатации скважин, для прогнозирования отказов были использованы исторические данные выбранного пилотного проекта, и задача сводилась к прогнозированию последовательности отказов за счет обучения модели на нормальных данных – данные, которые модель использовала в процессе обучения для понимания обычных закономерностей и понимания последовательности отказов скважин. На рисунке 5 показано количество аварий в течении одного года. Были рассмотрены 6 типов событий (классов): 0 – нет поломок, 1 – ГТМ, 2 – Обрыв штанги, 3 - Заклинивание насоса, 4 – Протирание штанги, 5 – Негерметичность НКТ, 6 – не работает насос.
Рис. 5 – Распределение аварий скважин пилотного месторождения
На Рис. 5 можно заметить, что общее количество аварий не превышает 5% общего количества событий на скважинах, из всех аварий наблюдается большое количество аварий типа ГТМ. Данную задачу авторы рассматривали, как задачу много классовой классификации.
Модель предсказания отказов была обучена на промысловых данных выбранного месторождения, в последствии, модель была проверена на выявление отклонений и аномалий в данных, которые не соответствуют обычным закономерностям. Общий объем данных был получен от одного из месторождений группы компаний АО НК КМГ. Данные представляют собой собранные данные по 2131 скважине и за период 1 год. Обучение модели было выполнено на выбранной случайным образом выборке данных. Обучающая выборка представляет собой массив данных из 16477 записей и 24 разных показателей. Валидирующая выборка состоит из 4191 записей и 24 показателя работы скважины.
Показателями работы скважины являются: 1) характеристики режима работы скважины ‑ забойное давление (Р заб), дебит нефти (Q нефти), дебит жидкости (Q жидкости), обводненность, газовый фактор (ГФ), вязкость нефти, воды, жидкости в пластовых условиях, объемный коэффициент нефти; 2) режим откачки ‑ тип насоса (диаметр), глубины спуска насоса (Н сп), число качаний, длина хода; 3) инклинометрия ствола скважины (темп набора пространственной кривизны, зенитный угол).
Теоретически и практически создание модели машинного обучения включает в себя несколько шагов, таких как, выбор модели, обучение и оценку модели (Рис. 6). Набор исторических данных работы скважин месторождения после прохождения предобработки данных были разделены на две части: 1 часть – для обучения модели, 2 часть – для проверки/тестирования производительности модели. Авторами для создания модели предсказания отказов подземного оборудования было использовано отношение 80% для обучения и 20% для тестирования. Модель LightGBM на валидирующем датасете показала следующий результат по метрике accuracy [4] равный 0.63 (максимальное значение по данной метрике является 1). Авторы считают, что полученные результаты являются недостаточно точными, но это является первым шагом по решению нетривиальной задачи. Для принятия объективного решения о превентивной остановке и ремонту скважины, авторы считают, что модель должна иметь метрику выше 0.75. Предложенная метрика является усреднением точности модели по всем классам. Так как авторы имеют датасет с высокой степенью разбалансированности данных в классах, авторы в следующих исследованиях планирую изучить направления по решению проблемы разбалансированности.
Рис. 6 – Карта создания модели машинного обучения
После проверки модели машинного обучения и оценки ее производительности может возникнуть необходимость внесения изменений для улучшения результатов. По результатам проверки модели предсказания отказов подземного оборудования авторами были предприняты несколько шагов для улучшения модели предсказания:
- Улучшение качества данных – проведена более тщательная предобработка данных путем создания новых признаков, балансировки классов;
- Добавление новых признаков – добавлены новые параметры режима работы скважины (режим откачки – длина хода, число качаний станка-качалки);
- Увеличение объема данных – для улучшения обобщения количество было увеличено количество данных;
- Выбор другой модели.
После внесения изменений в модель, авторами был повторно проведен процесс обучения и проверки модели для оценки улучшения модели. Все вышеперечисленные действия были применены авторами для улучшения точности предсказания авторами, точность предсказания значительно улучшилась после предпринятых действий. Согласно точности модели, а также предпринятым неоднократным улучшениям модели, авторы пришли к выводу о необходимости использования данных скважин, оснащенных датчиками телеметрии, в противном случае согласно проведенной работе по построению модели предсказания на исторических данных скважин основным шагом при построении модели является тщательная подготовка и оценка исторических данных скважины, а также немаловажную роль играет полнота исторических данных.
Результаты оценки модели машинного обучения показали возможность использования подходов машинного обучения по части предсказания отказов подземного оборудования путем предварительной подготовки данных для модели машинного обучения. В данной статье авторами была описана возможность и оценка применения методики прогнозирования отказов. Дальнейшие работы авторов будут направлены на использовании и тестировании методов исправления классового дисбаланса для разработки моделей прогнозирования.
Заключение
Машинное обучение для предсказания отказов глубинно-насосного оборудования представляет собой важный шаг в бесперебойной работе подземного оборудования скважины, и как результат скважины. Предсказание отказов в ШГН является необходимостью для обеспечения надежности, эффективности и безопасности процессов в нефтяной и газовой промышленности. Это позволяет сократить риски, оптимизировать производительность, снизить операционные расходы и увеличить срок службы подземного оборудования. Применение предсказания отказов в ШГН приводит к улучшению всей добычной системы и снижению эксплуатационных рисков за счет снижения количества проведенных ПРС и уменьшения сроков простоя скважин на ПРС.
В данной статье авторы провели оценку возможности применения подходов машинного обучения модели для прогнозирования отказов глубинно-насосного оборудования и поделились дальнейшими планами развития исследования.
В следующих исследованиях авторы продолжат развивать данное направление и решать нетривиальную практическую задачу предсказания отказов глубинно-насосного оборудования. Авторы планируют применять новые подходы по аугментации данных, которые должны улучшить качество модели машинного обучения.
About the authors
Laura Gibratovna Utemisova
KMG Engineering LLP
Author for correspondence.
Email: l.utemissova@niikmg.kz
ORCID iD: 0000-0003-4194-6727
Ведущий инженер службы цифровизации технологии добычи департамента нефтяного инжиниринга
Kazakhstan, AstanaTimur Zhumakanovich Merembayev
Институт информационных и вычислительных технологий КН МОН РК
Email: timur.merembayev@gmail.com
ORCID iD: 0000-0001-8185-235X
г. Алматы
Bakhbergen E. Bekbau
KMG Engineering LLP
Email: b.bekbau@kmge.kz
ORCID iD: 0000-0003-2410-1626
PhD
Kazakhstan, Nur-Sultan