Применение искусственного интеллекта в нефтегазовой отрасли: тренд или необходимость?

Аннотация

В последние десятилетия искусственный интеллект (ИИ) стремительно внедряется в нефтегазовую отрасль, охватывая различные этапы разведки и разработки месторождений. Современные методы анализа данных, машинное обучение и интеллектуальные системы управления позволяют значительно повысить точность интерпретации каротажных и геофизических данных, минимизировать риски и оптимизировать производственные процессы. В данной статье рассматриваются основные направления применения ИИ в нефтегазовой индустрии, анализируются текущие достижения и обсуждаются перспективы дальнейшего развития технологий.

Полный текст

Введение

Нефтегазовая отрасль в современных условиях сталкивается с целым рядом серьёзных вызовов: истощением традиционных месторождений, необходимостью разработки трудноизвлекаемых и труднодоступных залежей, а также высокой неопределённостью геологических данных. В этих условиях применение технологий искусственного интеллекта (ИИ) перестаёт быть просто отраслевым трендом и становится объективной необходимостью, позволяющей повышать эффективность и рентабельность как разведочных, так и добычных работ.

За последние десять лет распространённость ИИ в нефтегазовой сфере, особенно в области геологии и геофизики, значительно возросла. Это обусловлено тем, что объёмы поступающих данных — геолого-геофизических, данных по разработке и добыче, технологических параметров — ежегодно растут в геометрической прогрессии. Обработка столь масштабных массивов информации традиционными методами требует значительных временных и кадровых ресурсов, что сдерживает оперативность принятия решений и увеличивает издержки. Именно поэтому во всём мире активно внедряются решения на базе искусственного интеллекта и глубоких нейронных сетей, способные автоматизировать анализ и интерпретацию данных, сокращать сроки получения результатов, повышать точность прогнозов и снижать уровень неопределённости при принятии геолого-технических решений.

Таким образом, интеграция технологий ИИ в ключевые производственные процессы нефтегазовой отрасли уже сегодня выступает одним из важнейших инструментов повышения управляемости и эффективности разработки месторождений в условиях возрастающих технологических и экономических требований.

 

Основные положения

  1. Искусственный интеллект в каротаже

В процессе геологоразведки и разработки месторождений накапливается колоссальный объём информации, включая результаты геофизических исследований скважин (ГИС), зачастую по всей глубине интервалов исследования с шагом 10 см и по множеству кривых: гамма-каротаж (ГК), потенциал самопроизвольной поляризации (ПС), нейтронный каротаж (НК), нейтрон-нейтронный каротаж (ННК), гамма-гамма каротаж (ГГК), боковой каротаж (БК) и другие методы. Перед искусственным интеллектом ставится одна из ключевых задач — прогнозирование литологического состава пород по данным каротажа.

Для реализации данной задачи в обучающие выборки систем ИИ включаются данные о свойствах пород и их классификационные признаки (литологические названия и характеристики). На сегодняшний день существует широкий спектр алгоритмов искусственного интеллекта, применяемых в специализированном геологическом анализе. Необходимые исходные данные для обучения таких моделей либо уже имеются в распоряжении компаний, либо могут быть получены в рамках текущих исследований.

Отдельное направление применения ИИ связано с восполнением недостающих данных по старым скважинам. Как известно, исторически часть скважин исследовалась ограниченным комплексом методов, что не позволяет в полной мере охарактеризовать геологический разрез. В подобных случаях технологии искусственного интеллекта используются для восстановления и прогнозирования отсутствующих каротажных кривых и параметров, на основе имеющихся данных, что позволяет повысить информативность существующего фонда скважин.

Одним из новых и перспективных направлений внедрения ИИ в геологии является автоматизированное описание кернового материала. С применением технологий компьютерного зрения и глубокого обучения стало возможным проводить первичный анализ фотографий керна с целью оперативного получения информации о текстуре, цвете, трещиноватости и других параметрах пород. Это позволяет существенно ускорить процесс обработки кернового материала и повысить его объективность за счёт минимизации влияния человеческого фактора.

Из-за неоднородности пластов, сложности объектов разведки и разнообразных условий проведения работ необходимо разрабатывать новые методы измерений и сбора данных, в частности, методов передачи параметров из скважины. Внедрение искусственного интеллекта позволяет повысить точность, эффективность и безопасность работ.

 

Методология

1.1 Сбор и обработка данных

Зарубежные компании уже коммерциализировали решения для сбора данных и удаленного каротажа. Например, компания Schlumberger разработала Центр удаленного каротажа (Remote Logging Center), интеллектуальный тестер формации (Intelligent Formation Tester) и программное обеспечение Techlog для интеллектуальной обработки и интерпретации данных. Платформа iStar от Halliburton интегрирует автоматизацию, машинное обучение и искусственный интеллект для оценки запасов, что способствует более быстрому бурению и последовательной разработке месторождений. [1] В Китае нефтяные компании и научно-исследовательские институты ведут разработки в области сетевых наземных объектов, интеллектуальных лебедок, удаленного каротажа и начали применять первые результаты на практике. Также ведутся исследования по созданию интеллектуальных скважинных роботов. [2]

В мире развернуто 11 серверных центров и 14 удаленных каротажных центров с 108 инженерами, что позволяет проводить удаленные операции и экспертный анализ. Около 20% всех каротажных работ выполняется дистанционно, что составляет более 10 000 операций.

 

1.2. Автоматизированная интерпретация данных

Каротажные данные отличаются большим объемом и разнородностью, что затрудняет интерпретацию и приводит к множественности решений и неопределенности. Это делает процесс выделения продуктивных зон более сложным. В связи с этим остро стоит необходимость применения технологий искусственного интеллекта для повышения эффективности и точности интерпретации.

Применение ИИ в интерпретации каротажа охватывает автоматическую коррекцию глубины, автоматическое формирование отчетов, интеллектуальную стратификацию, реконструкцию кривых, идентификацию литологии, интерпретацию изображений каротажа, оценку параметров пластов, прогнозирование потенциала нефти и газа, предсказание скорости поперечной волны, идентификацию трещин и их заполнителей.

Реконструкция каротажных кривых основана на методах глубокого обучения, корреляционного анализа и других алгоритмах, что позволяет восстанавливать некорректные или пропущенные данные. Применяются такие алгоритмы, как нейросети, алгоритмы ансамблевого обучения и кластеризации. Например, метод реконструкции каротажных кривых с использованием рекуррентной нейросети (RNN) и сети LSTM (Long Short-Term Memory) оказался более точным, чем традиционные методы. [2]

Литологическая интерпретация возможна двумя способами:

  • Анализ образцов керна, включая фото шлифов, CT- и SEM-изображения. Современные программные пакеты, такие как Avizo и PerGeos,[3] могут автоматически определять литологию, но требуют значительных взаимодействий с оператором.
  • Определение литологии на основе каротажных кривых с использованием методов машинного обучения. Например, модель, построенная с использованием Boosting Tree, Decision Tree и Support Vector Machine, достигла точности более 80% при сравнении с результатами шламового анализа.

При интерпретации изображений каротажа данные преобразуются в визуальные изображения с использованием цветовой калибровки. Современные исследования сочетают глубокое обучение с обработкой изображений для автоматического распознавания геологических структур. Например, алгоритмы U-Net позволяют автоматически выделять границы геологических объектов, что значительно упрощает процесс интерпретации. Однако недостаток размеченных данных ограничивает дальнейшее развитие этих технологий. [4]

ИИ уже применяется для оценки параметров пластов, таких как пористость, проницаемость и насыщенность. Первые исследования использовали традиционные алгоритмы машинного обучения, такие как Support Vector Machine и линейную регрессию. Сегодня все больше ученых применяют глубинные нейросети (BP), LSTM, случайные леса (Random Forest) и GBDT (Gradient Boosting Decision Tree) для повышения точности расчетов. [5]

В рамках практической деятельности в области интерпретации скважинных данных автором настоящей статьи проводились работы по применению методов искусственного интеллекта для решения задач, связанных с анализом и классификацией данных геофизических исследований скважин (ГИС). На основании накопленного опыта можно выделить ряд ключевых положений и практических особенностей.

Любое построение корректной предсказательной модели с использованием ИИ начинается с тщательной оценки качества и структуры исходных данных. В первую очередь, как показывает практика автора, основным препятствием для успешного внедрения ИИ в задачи прогнозирования литологического состава пород по данным каротажа является отсутствие единой актуальной базы данных, а также неструктурированный характер хранения большого объёма материалов с наличием ошибочных и неполных данных.

Данные хранятся разрозненно: результаты исследований зачастую представлены в отдельных таблицах с различной структурой, оформлением и форматом заполнения. Реальная практика показала, что для полноценного применения алгоритмов ИИ необходимо привести все данные к единому формату и объединить их в единый массив, пригодный для последующей обработки.

Основной задачей ГИС является выделение продуктивных зон в геологическом разрезе, в частности определение таких параметров, как пористость, проницаемость, нефтенасыщенность, газонасыщенность и состав флюида. Особое значение имеют задачи, связанные с моделированием, поскольку литология напрямую влияют на построение гидродинамических моделей и определяют границы гидродинамических блоков, критически важных для эффективной разработки месторождения.

На практике анализ керна для определения состава породы требует значительных затрат времени и ресурсов, особенно с учётом необходимости бурения большого количества скважин. В этой связи были реализованы проекты по разработке и обучению моделей ИИ, способных определять состав породы по данным ГИС, без необходимости отбора керна.

Характеристики нефтяных скважин измеряются различными петрофизическими приборами. В рамках работы активно применялись такие параметры, как SP (потенциал собственной поляризации), CALI (кавераметрия), GR (гамма-каротаж), LLS (удельное сопротивление) и глубина (DEPT) в качестве входных данных для построения моделей классификации.

В 2020 году в рамках совместного проекта специалистов КМГИ, впервые на практике были протестированы и опробованы алгоритмы машинного обучения для классификации состава пород по данным месторождений АО НК КМГ. На основании этого опыта было установлено, что классические нейронные сети не обеспечивают достаточного качества классификации и не подходят для практического применения в задачах геологоразведки в текущих условиях.

На этапе тестирования выявились ключевые особенности разбиения данных: в первоначальных экспериментах разбиение осуществлялось по записям, а не по скважинам, что приводило к статистическим перекосам. Например, данные по одной скважине могли одновременно находиться как в обучающей, так и в тестовой выборке, что искажало итоговые метрики качества. В результате точность модели на тестовой выборке опускалась до 30%. В дальнейшем было принято решение о разбиении данных строго по скважинам, несмотря на уменьшение объема тестовой выборки.

В рамках этого же проекта была разработана и обучена модель классификатора на 10 пород. Для построения модели использовались два набора данных:
— данные по керну (20 скважин с 9 породами);
— данные по интерпретации ГИС (100 скважин с 10 породами).

После предварительной очистки от пропусков по шести основным признакам (SP, CALI, GR, LLS, DEPT) в выборке осталось 98 скважин. Очистка данных предполагала полное исключение записей с отсутствующими кривыми по любому из параметров. Шаг дискретизации по глубине составлял 10 см. В результате было сформировано около 450 тыс. строк по ГИС, из которых 115 тыс. строк содержали метки литологии и использовались для обучения и валидации модели.

Из опыта следует, что кавернометрия (CALI), гамма-каротаж (GR), каротаж удельного сопротивления (LLS), потенциал собственной поляризации (SP) и глубинные привязки (DEPT) выступают ключевыми переменными для построения рабочей модели классификации литологии. При этом наилучшие результаты были достигнуты при применении методов градиентного бустинга и ансамблевых моделей, а также с использованием более сложных архитектур глубоких нейронных сетей для обработки больших массивов данных.

Полученный опыт подтвердил, что несмотря на существующие ограничения и сложности, применение технологий искусственного интеллекта в интерпретации скважинных данных ГИС в реальных условиях Казахстана является перспективным направлением, требующим дальнейшего развития и тиражирования на уровне производственных структур.

По результатам анализа данных по 20 скважинам, для которых осуществлялся отбор керна, была выполнена попытка выделения литологии и последующего использования полученных данных в качестве обучающей выборки для построения модели искусственного интеллекта. В рамках данного этапа работы по керновому материалу было классифицировано 9 пород, отражающих различия в литологическом составе пород.

Однако практика показала, что обучение модели исключительно на данных керна не обеспечивает необходимой точности и устойчивости результатов из-за ограниченного объёма выборки и недостаточного количества представленных образцов по каждому из классов. В связи с этим для дальнейшего обучения и повышения качества модели было принято решение использовать расширенную выборку, основанную на данных ГИС, которые включали те же интервальные характеристики, что и керн.

В результате была сформирована 10-классовая обучающая выборка по данным ГИС, отражающая выделенные ранее породы. На рисунке 1 продемонстрирован пример такой выборки, где визуально видно, что часть пород хорошо разделяется по литологическим признакам, тогда как для других классов наблюдается частичное пересечение характеристик. Это указывает на необходимость дальнейшего уточнения методов предобработки и подбора оптимальных алгоритмов для повышения точности классификации.

 

Рисунок 1 - Пример 10 классовой обучающей выборки

 

Объединение выделенных по ГИС пород в породы по керну представляет собой самостоятельную задачу, обусловленную тем, что каждая порода по керновым данным является сложной структурой, состоящей из ряда взаимопересекающихся пород, расположенных в определённой последовательности.

В качестве примера приведено преобразование 10-классовой классификации пород в 5-классовую классификацию пород:

Класс 1 (песчаник крупнозернистый) соответствует 1-му классу пород.

Класс 2 (песчаник мелкозернистый) объединяет 2-й, 3-й и 4-й классы пород.

Класс 3 (алевролит) представлен 5-м классом пород.

Класс 4 (глинистый алевролит) включает 6-й, 7-й и 8-й классы пород.

Класс 5 (глина) объединяет 9-й и 10-й классы пород.

В обоих вариантах классификации разделение исходного набора данных на обучающую и валидационную выборки сохраняло исходные пропорции классов и не выявило значимого дисбаланса данных, в связи с чем применение методов балансировки выборок (таких как upscaling или downscaling) не предполагается. Соотношение тренировочной и тестовой выборок принято равным 70% и 30% соответственно.

Гистограммы для 5-классового и 10-классового вариантов представлены в рисунке 2. Такой формат графического представления позволяет легко сравнить распределение данных по классам для тренировочной и тестовой выборок.

 

Рисунок 2 - 5-и классовая и 10-и классовая модель

 

Для решения задачи автоматической классификации литологии на основе геофизических данных использованы два набора данных, представленных в формате LAS-файлов:

Набор 1: 20 скважин, данные основаны на результатах исследований керна (целевой признак —9 классов).

Набор 2: 100 скважин, данные основаны на интерпретации геофизических исследований скважин (ГИС), целевой признак —10 классов.

В качестве признаков использовались стандартные параметры ГИС: SPLLS, GR, CALI, DEPT — глубина, с шагом 10 см.

Для повышения устойчивости модели и учета геологической специфики было выполнено укрупнение исходных 10 классов до 5 обобщенных классов, ранее описанных выше.

Проведенные предварительные эксперименты показали, что обучение моделей на Наборе 1 (по данным керна) не обеспечивает приемлемого качества классификации, выраженного через метрику Сходимость (максимальное значение в диапазоне 0.55–0.60). В связи с этим в дальнейших расчетах использовался исключительно Набор 2, основанный на данных интерпретаций ГИС, позволяющий получить более стабильные и воспроизводимые результаты.

Ключевая задача проекта заключалась в разработке моделей именно для данных, основанных на ГИС, что позволяет масштабировать методику на полный фонд скважин. Для обеспечения качества итоговых моделей необходимо предусмотреть доступ к достаточному объему данных керновых исследований для валидации и контроля обученных моделей (Рис.3).

 

 

Рисунок 3 - Группировка классов

 

В процессе подготовки исходных данных для построения моделей было загружено 100 скважин, что соответствует общему объему в 1 900 000 строк. При этом значительная часть данных содержала пропуски различной природы. По результатам анализа установлено, что:

Полностью пустыми оказались около 452 000 строк (~25% от общего объема);

В 925 000 строках были неполные данные по ГИС-кривым;

Итоговый остаток после удаления пустых строк составил около 452 000 строк.

Из оставшихся данных только 115 000 строк (примерно 8% от исходного объема) содержат полный набор необходимых признаков и могут быть использованы для обучения и валидации моделей. Остальные 337 000 строк допустимо использовать лишь для прогнозных расчетов без последующей проверки качества.

Статистика по признакам показала следующие средние проценты пропусков:

  • Целевая переменная — около 94%;
  • CALI — около 33%;
  • GR — около 26%;
  • SP — около 75%;
  • LLS — около 43%.

Таким образом, изначально большой объем сырых данных значительно сокращается после обработки и удаления пропусков, что необходимо учитывать при построении и тестировании моделей машинного обучения.

Данные были разделены на обучающую и тестовую выборки. Тестовая выборка использовалась для проведения перекрёстной проверки с целью подбора оптимальных параметров модели. При этом данные теста применялись исключительно для оценки обобщающей способности модели и не использовались в процессе обучения.

В задачах контролируемого процесса обучения часто возникают проблемы смещения и дисперсии модели. Перекрёстная проверка (cross-validation) позволяет сбалансировать эти характеристики, снижая переобучение и повышая устойчивость модели к особенностям конкретного набора данных.

В рамках исследования были протестированы следующие алгоритмы машинного обучения (таблица 1 и 2):

Logistic Regression — использовалась в качестве базовой (vanilla) модели для целей сравнения. Является простым и быстрым алгоритмом, эффективно выявляющим линейные зависимости;

Random Forest — мощный ансамблевый метод, хорошо работающий на различных типах данных. Однако обученные модели могут занимать значительный объем памяти;

XGBoost — адаптивный градиентный бустинг, демонстрирующий высокую эффективность и скорость среди моделей своего класса. Отличается хорошим балансом между точностью и вычислительной сложностью.

Согласно результатам экспериментов, наилучшие показатели качества продемонстрировали модели Random Forest и XGBoost. При этом XGBoost обучается существенно дольше, но генерирует более компактную модель: например, модель Random Forest занимала около 18 ГБ памяти.

 

Таблица 1 - Сравнительная таблица рассматриваемых алгоритмов

                     (10 классовая)

 

Logistic Regression

Random Forest

XG-Boost

Точность /Accuracy Score

0,23

0,81

0,81

Среднее / F1 Macro Score

0,17

0,81

0,81

Средневзвешенное /F1 Weighted Score

0,19

0,81

0,81

Размер модели/ Model Size

0,02 mb

2 321 mb

609 mb

Скорость/Predict Speed (s)

0,01

4,3

129,7

 

Таблица 2 - Сравнительная таблица рассматриваемых алгоритмов

                     (5 классовая)

 

Logistic Regression

Random Forest

XG-Boost

Точность /Accuracy Score

0,49

0,90

0,90

Среднее / F1 Macro Score

0,34

0,88

0,88

Средневзвешенное /F1 Weighted Score

0,46

0,90

0,90

Размер модели/ Model Size

0,02 mb

619 mb

134 mb

Скорость/Predict Speed (s)

0,01

1,7

40,0

 

Для задачи ранжирования скважин была выбрана обученная модель на основе Random Forest с параметрами:

  • число деревьев — 250;
  • максимальная глубина деревьев — 45;
  • размер модели — 619 МБ для выборки с 5 классами и 2321 МБ для выборки с 10 классами;
  • точность модели (метрика качества на тестовой выборке) составила 0.9 и 0.8 соответственно.

В качестве признаков использовались как исходные геофизические кривые, так и производные признаки, такие как первая и вторая производные кривой SP, а также синтетические признаки, полученные с помощью арифметических операций над исходными данными.

В дополнение к Random Forest и XGBoost были протестированы также алгоритмы LightGBM, Decision Tree, Linear Regression и другие. По итогам сравнения наилучшие результаты показал алгоритм Random Forest, достигнув значения метрики качества 0.9.

В рамках данного исследования в качестве оптимального решения для поставленной задачи был выбран алгоритм Random Forest, продемонстрировавший наилучшее соотношение точности и вычислительной эффективности. Хотя алгоритм XGBoost показал аналогичные метрики качества, предпочтение было отдано Random Forest с учётом вышеописанного.

С учетом минимального целевого порога точности (точность> 0,85), была выбрана модель классификации с разделением на 5 классов. Такой подход обеспечил требуемый уровень обобщающей способности при сохранении интерпретируемости результатов.

Следует подчеркнуть, что представленные решения по выбору количества классов, алгоритма и его параметров не следует рассматривать как универсальные для более масштабных или разнородных наборов данных. Проведённый анализ ориентирован исключительно на демонстрацию предсказательной способности моделей в рамках данного проекта, ограниченного выборкой из 100 скважин.

Оценка производительности модели Random Forest на тестовой выборке показала высокий уровень точности — 0.9 при использовании 5-классовой схемы классификации, что подтверждает её применимость для ранжирования объектов в рассматриваемом контексте.

 

Таблица 3 - Сравнение двух моделей

 

Точность

Random Forest

Точность

Logystic Regression

Средняя

0,90

0,63

Точность по классу №1

0,92

0,55

Точность по классу №2

0,92

0,78

Точность по классу №3

0,75

0,61

Точность по классу №4

0,89

0,66

Точность по классу №5

0,93

0,57

 

Для более детального анализа качества классификации были рассчитаны показатели точности по каждому классу как для модели Random Forest, так и для логистической регрессии (таблица 3). Средняя точность модели Random Forest составила 0.90, что значительно превышает соответствующий показатель логистической регрессии — 0.63.

Разбивка по классам показала, что модель Random Forest демонстрирует устойчиво высокую точность для большинства категорий. Так, для классов №1, №2 и №5 точность составила 0.92, 0.92 и 0.93 соответственно. Несколько ниже точность наблюдается для класса №3 — 0.75, что, вероятно, связано с его внутренней неоднородностью или ограниченным числом объектов в выборке. Тем не менее, и в этом случае Random Forest превосходит логистическую регрессию, точность которой по данному классу составляет 0.61.

По всем пяти классам модель Random Forest обеспечивает стабильное и высокое качество классификации, тогда как логистическая регрессия демонстрирует более выраженную вариативность и менее удовлетворительные результаты — от 0.55 до 0.78.

Таким образом, сравнение точности по классам подтверждает преимущество алгоритма Random Forest в рассматриваемой задаче классификации скважин по выделенным категориям.

На рисунке 4 представлены распределения точности для моделей Random Forest и логистической регрессии.

График демонстрирует распределение точности моделей Random Forest и логистической регрессии.

Синяя кривая и столбцы — Random Forest: точность сконцентрирована в диапазоне 0.93–0.99, что свидетельствует о высокой стабильности и качестве модели.

Оранжевая кривая и столбцы — Logistic Regression: точность распределена шире и смещена к более низким значениям (около 0.49), что указывает на худшую предсказательную способность.

 

 

Рисунок 4 - Сравнение двух моделей

 

Анализ матриц ошибок показывает, что каждая из рассмотренных моделей демонстрирует различное поведение при классификации отдельных литологических классов. В целом, наибольшая точность достигается при распознавании песчаника, алевролита и глин, в то время как другие классы определяются менее уверенно.

Особенно стоит отметить, что глины стабильно показывают наивысшие значения F1-метрики при использовании как контролируемых, так и неконтролируемых алгоритмов. Это преимущество объясняется более широкой представленностью глин в разрезе, что обеспечивает лучшее обучение моделей на этом классе.

На рисунке 5 представлена визуализация результатов классификации фаций, полученных в результате применения обученной модели машинного обучения. Колонки с первой по пятую отражают входные каротажные параметры, используемые при обучении модели: гамма-каротаж (ГК), боковой каротаж (БК), коэффициент водонасыщенности (КВ), потенциометрический сигнал (ПС) и нормализованный ПС соответственно. Эти параметры представляют собой основную информацию о литологическом разрезе скважины и служат входными признаками для алгоритма классификации.

Шестая колонка содержит прогнозные данные по фациям, полученные с помощью обученной модели. В седьмой колонке приведены эталонные данные, полученные по результатам интерпретации профильными специалистами. Восьмая колонка отображает фации в виде цветовой шкалы (от 1 до 5), где каждому классу соответствует определённый цвет, что облегчает визуальное сопоставление между прогнозом и экспертной интерпретацией.

Сравнительный анализ показывает высокую степень сходимости между результатами, полученными моделью, и экспертной интерпретацией, включая как тонкослоистые, так и более протяжённые литологические интервалы. Коэффициент сходимости между модельной классификацией и экспертной разметкой на данной скважине приближается к 1, что свидетельствует о высокой точности и надёжности применённого подхода.

Таким образом, использование алгоритмов машинного обучения демонстрирует высокую эффективность в автоматизированной интерпретации фаций на основе стандартных каротажных данных и может служить надёжным инструментом в геологоразведочной практике.

 

 

Рисунок 5 - Использование обученной модели по сравнению с человеком

 

На текущий момент данная модель внедрена в информационную систему (далее ИС) КМГИ, предназначенную для оперативного прогнозирования литологии по каротажным данным (Используется 4 и 6 кривых). Скважинные данные загружаются в ИС. Далее обученная модель классифицирует каждый метр разреза, присваивая ему один из заранее определённых литологических типов. Результаты выводятся в виде цветокодированных колонок, сопоставимых с ручной интерпретацией специалистов, что позволяет оперативно корректировать стратиграфические модели и уточнять границы пластов (рисунок 6).

 

 

Рисунок 6 - Использование внедренных моделей в ИС

 

Информационная система обеспечивает визуализацию всех этапов – от исходных каротажных кривых до прогнозируемых литологий – в едином окне. Это позволяет быстро оценивать изменения фациальной обстановки.

Подобные подходы уже реализуются в интегрированном программном обеспечении в разных компаниях (Dream Cloud и CIFlog).

Таким образом, использование машинного обучения в сочетании с современными информационными системами позволяет повысить точность и скорость интерпретации каротажных данных, снизить зависимость от субъективного фактора и обеспечить постоянное улучшение прогностических моделей за счёт накопления новой информации.

 

1.3  Интегрированные программные решения

Крупнейшие мировые компании, такие как Schlumberger, разрабатывают интегрированные программные комплексы. Например, DELFI — это платформа для когнитивной разведки и разработки месторождений, включающая обработку и интерпретацию данных, стандартизацию, очистку и анализ. Программное обеспечение Techlog позволяет анализировать каротажные данные с помощью интеллектуальных алгоритмов.

В Китае разрабатываются собственные платформы, такие как Dream Cloud Collaboration Platform от CNPC, LEAD (интегрированное ПО для каротажной обработки и интерпретации) и CIFlog (многоскважинная оценка пластов). Развиваются технологии искусственного интеллекта для моделирования пластов, интерпретации каротажа и геонавигации при бурении горизонтальных скважин. [1]

 

2. Геофизическая разведка

Исследования в области "ИИ + геофизическая разведка" стремительно развиваются по всему миру. Геофизическая разведка исторически является одной из первых отраслей, где использовались цифровые технологии, включая высокопроизводительные вычисления, трехмерную визуализацию и компьютерные сети.

 

2.1. Оборудование для геофизической разведки

ИИ применяется в оборудовании для геофизической разведки, включая вибросейсморазведку, беспилотники и сейсмическую аппаратуру.

Интеллектуальная вибросейсморазведка позволяет адаптировать параметры работы (мощность, диапазон частот, время сканирования и фазу) в зависимости от условий на поверхности и глубинных геологических характеристик, повышая безопасность и снижая нагрузку на окружающую среду.

Беспилотники (БПЛА) используются для сбора геофизических данных, детальной топографической съемки, оценки рисков, мониторинга узловых точек, восстановления данных, доставки оборудования и спасательных операций.

Современные сейсмические системы включают проводные (G3i) и беспроводные (Hawk, eSeis, OBN – ocean bottom node) решения. Технологии OBN позволяют преодолевать ограничения, связанные с шумами, плохой проходимостью местности и узким диапазоном наблюдений.

 

Литературный обзор

Одним из ключевых направлений использования ИИ является интерпретация данных каротажа и сейсморазведки. Согласно исследованиям Wu et al. [9], глубокие нейросети, в частности сверточные (CNN) и рекуррентные сети (RNN), успешно применяются для автоматической классификации геофизических аномалий и идентификации разломов в сейсмических данных. Zhang et al. [1] отмечают, что модели машинного обучения позволяют повышать точность анализа геологических характеристик, сокращая время обработки информации.

Применение алгоритмов сегментации изображений, таких как U-Net, позволяет автоматически выделять границы геологических объектов [10]. Однако, как указывают авторы, отсутствие размеченных данных остается ключевой проблемой, ограничивающей дальнейшее развитие данной технологии.

ИИ также активно применяется в прогнозировании параметров пластов, таких как пористость, проницаемость и насыщенность [11]. В ранних работах использовались традиционные методы машинного обучения, включая метод опорных векторов (SVM) и линейную регрессию. В современных исследованиях отмечается рост применения глубинных нейросетей (BP, LSTM), случайных лесов (Random Forest) и градиентного бустинга (GBDT), что значительно повышает точность прогнозов [12].

 

 

Заключение

      Для Казахстана, обладающего крупными нефтегазовыми месторождениями, такими как Тенгиз, Кашаган и Карачаганак, внедрение искусственного интеллекта в разведку и разработку — это не просто тренд, а реальная необходимость. Мы сталкиваемся с серьезными вызовами: сложные геологические условия, высокая неоднородность пластов, возрастающие затраты на добычу и необходимость более рационального использования ресурсов.

ИИ уж

Введение

Нефтегазовая отрасль в современных условиях сталкивается с целым рядом серьёзных вызовов: истощением традиционных месторождений, необходимостью разработки трудноизвлекаемых и труднодоступных залежей, а также высокой неопределённостью геологических данных. В этих условиях применение технологий искусственного интеллекта (ИИ) перестаёт быть просто отраслевым трендом и становится объективной необходимостью, позволяющей повышать эффективность и рентабельность как разведочных, так и добычных работ.

За последние десять лет распространённость ИИ в нефтегазовой сфере, особенно в области геологии и геофизики, значительно возросла. Это обусловлено тем, что объёмы поступающих данных — геолого-геофизических, данных по разработке и добыче, технологических параметров — ежегодно растут в геометрической прогрессии. Обработка столь масштабных массивов информации традиционными методами требует значительных временных и кадровых ресурсов, что сдерживает оперативность принятия решений и увеличивает издержки. Именно поэтому во всём мире активно внедряются решения на базе искусственного интеллекта и глубоких нейронных сетей, способные автоматизировать анализ и интерпретацию данных, сокращать сроки получения результатов, повышать точность прогнозов и снижать уровень неопределённости при принятии геолого-технических решений.

Таким образом, интеграция технологий ИИ в ключевые производственные процессы нефтегазовой отрасли уже сегодня выступает одним из важнейших инструментов повышения управляемости и эффективности разработки месторождений в условиях возрастающих технологических и экономических требований.

 

Основные положения

  1. Искусственный интеллект в каротаже

В процессе геологоразведки и разработки месторождений накапливается колоссальный объём информации, включая результаты геофизических исследований скважин (ГИС), зачастую по всей глубине интервалов исследования с шагом 10 см и по множеству кривых: гамма-каротаж (ГК), потенциал самопроизвольной поляризации (ПС), нейтронный каротаж (НК), нейтрон-нейтронный каротаж (ННК), гамма-гамма каротаж (ГГК), боковой каротаж (БК) и другие методы. Перед искусственным интеллектом ставится одна из ключевых задач — прогнозирование литологического состава пород по данным каротажа.

Для реализации данной задачи в обучающие выборки систем ИИ включаются данные о свойствах пород и их классификационные признаки (литологические названия и характеристики). На сегодняшний день существует широкий спектр алгоритмов искусственного интеллекта, применяемых в специализированном геологическом анализе. Необходимые исходные данные для обучения таких моделей либо уже имеются в распоряжении компаний, либо могут быть получены в рамках текущих исследований.

Отдельное направление применения ИИ связано с восполнением недостающих данных по старым скважинам. Как известно, исторически часть скважин исследовалась ограниченным комплексом методов, что не позволяет в полной мере охарактеризовать геологический разрез. В подобных случаях технологии искусственного интеллекта используются для восстановления и прогнозирования отсутствующих каротажных кривых и параметров, на основе имеющихся данных, что позволяет повысить информативность существующего фонда скважин.

Одним из новых и перспективных направлений внедрения ИИ в геологии является автоматизированное описание кернового материала. С применением технологий компьютерного зрения и глубокого обучения стало возможным проводить первичный анализ фотографий керна с целью оперативного получения информации о текстуре, цвете, трещиноватости и других параметрах пород. Это позволяет существенно ускорить процесс обработки кернового материала и повысить его объективность за счёт минимизации влияния человеческого фактора.

Из-за неоднородности пластов, сложности объектов разведки и разнообразных условий проведения работ необходимо разрабатывать новые методы измерений и сбора данных, в частности, методов передачи параметров из скважины. Внедрение искусственного интеллекта позволяет повысить точность, эффективность и безопасность работ.

 

Методология

1.1 Сбор и обработка данных

Зарубежные компании уже коммерциализировали решения для сбора данных и удаленного каротажа. Например, компания Schlumberger разработала Центр удаленного каротажа (Remote Logging Center), интеллектуальный тестер формации (Intelligent Formation Tester) и программное обеспечение Techlog для интеллектуальной обработки и интерпретации данных. Платформа iStar от Halliburton интегрирует автоматизацию, машинное обучение и искусственный интеллект для оценки запасов, что способствует более быстрому бурению и последовательной разработке месторождений. [1] В Китае нефтяные компании и научно-исследовательские институты ведут разработки в области сетевых наземных объектов, интеллектуальных лебедок, удаленного каротажа и начали применять первые результаты на практике. Также ведутся исследования по созданию интеллектуальных скважинных роботов. [2]

В мире развернуто 11 серверных центров и 14 удаленных каротажных центров с 108 инженерами, что позволяет проводить удаленные операции и экспертный анализ. Около 20% всех каротажных работ выполняется дистанционно, что составляет более 10 000 операций.

 

1.2. Автоматизированная интерпретация данных

Каротажные данные отличаются большим объемом и разнородностью, что затрудняет интерпретацию и приводит к множественности решений и неопределенности. Это делает процесс выделения продуктивных зон более сложным. В связи с этим остро стоит необходимость применения технологий искусственного интеллекта для повышения эффективности и точности интерпретации.

Применение ИИ в интерпретации каротажа охватывает автоматическую коррекцию глубины, автоматическое формирование отчетов, интеллектуальную стратификацию, реконструкцию кривых, идентификацию литологии, интерпретацию изображений каротажа, оценку параметров пластов, прогнозирование потенциала нефти и газа, предсказание скорости поперечной волны, идентификацию трещин и их заполнителей.

Реконструкция каротажных кривых основана на методах глубокого обучения, корреляционного анализа и других алгоритмах, что позволяет восстанавливать некорректные или пропущенные данные. Применяются такие алгоритмы, как нейросети, алгоритмы ансамблевого обучения и кластеризации. Например, метод реконструкции каротажных кривых с использованием рекуррентной нейросети (RNN) и сети LSTM (Long Short-Term Memory) оказался более точным, чем традиционные методы. [2]

Литологическая интерпретация возможна двумя способами:

  • Анализ образцов керна, включая фото шлифов, CT- и SEM-изображения. Современные программные пакеты, такие как Avizo и PerGeos,[3] могут автоматически определять литологию, но требуют значительных взаимодействий с оператором.
  • Определение литологии на основе каротажных кривых с использованием методов машинного обучения. Например, модель, построенная с использованием Boosting Tree, Decision Tree и Support Vector Machine, достигла точности более 80% при сравнении с результатами шламового анализа.

При интерпретации изображений каротажа данные преобразуются в визуальные изображения с использованием цветовой калибровки. Современные исследования сочетают глубокое обучение с обработкой изображений для автоматического распознавания геологических структур. Например, алгоритмы U-Net позволяют автоматически выделять границы геологических объектов, что значительно упрощает процесс интерпретации. Однако недостаток размеченных данных ограничивает дальнейшее развитие этих технологий. [4]

ИИ уже применяется для оценки параметров пластов, таких как пористость, проницаемость и насыщенность. Первые исследования использовали традиционные алгоритмы машинного обучения, такие как Support Vector Machine и линейную регрессию. Сегодня все больше ученых применяют глубинные нейросети (BP), LSTM, случайные леса (Random Forest) и GBDT (Gradient Boosting Decision Tree) для повышения точности расчетов. [5]

В рамках практической деятельности в области интерпретации скважинных данных автором настоящей статьи проводились работы по применению методов искусственного интеллекта для решения задач, связанных с анализом и классификацией данных геофизических исследований скважин (ГИС). На основании накопленного опыта можно выделить ряд ключевых положений и практических особенностей.

Любое построение корректной предсказательной модели с использованием ИИ начинается с тщательной оценки качества и структуры исходных данных. В первую очередь, как показывает практика автора, основным препятствием для успешного внедрения ИИ в задачи прогнозирования литологического состава пород по данным каротажа является отсутствие единой актуальной базы данных, а также неструктурированный характер хранения большого объёма материалов с наличием ошибочных и неполных данных.

Данные хранятся разрозненно: результаты исследований зачастую представлены в отдельных таблицах с различной структурой, оформлением и форматом заполнения. Реальная практика показала, что для полноценного применения алгоритмов ИИ необходимо привести все данные к единому формату и объединить их в единый массив, пригодный для последующей обработки.

Основной задачей ГИС является выделение продуктивных зон в геологическом разрезе, в частности определение таких параметров, как пористость, проницаемость, нефтенасыщенность, газонасыщенность и состав флюида. Особое значение имеют задачи, связанные с моделированием, поскольку литология напрямую влияют на построение гидродинамических моделей и определяют границы гидродинамических блоков, критически важных для эффективной разработки месторождения.

На практике анализ керна для определения состава породы требует значительных затрат времени и ресурсов, особенно с учётом необходимости бурения большого количества скважин. В этой связи были реализованы проекты по разработке и обучению моделей ИИ, способных определять состав породы по данным ГИС, без необходимости отбора керна.

Характеристики нефтяных скважин измеряются различными петрофизическими приборами. В рамках работы активно применялись такие параметры, как SP (потенциал собственной поляризации), CALI (кавераметрия), GR (гамма-каротаж), LLS (удельное сопротивление) и глубина (DEPT) в качестве входных данных для построения моделей классификации.

В 2020 году в рамках совместного проекта специалистов КМГИ, впервые на практике были протестированы и опробованы алгоритмы машинного обучения для классификации состава пород по данным месторождений АО НК КМГ. На основании этого опыта было установлено, что классические нейронные сети не обеспечивают достаточного качества классификации и не подходят для практического применения в задачах геологоразведки в текущих условиях.

На этапе тестирования выявились ключевые особенности разбиения данных: в первоначальных экспериментах разбиение осуществлялось по записям, а не по скважинам, что приводило к статистическим перекосам. Например, данные по одной скважине могли одновременно находиться как в обучающей, так и в тестовой выборке, что искажало итоговые метрики качества. В результате точность модели на тестовой выборке опускалась до 30%. В дальнейшем было принято решение о разбиении данных строго по скважинам, несмотря на уменьшение объема тестовой выборки.

В рамках этого же проекта была разработана и обучена модель классификатора на 10 пород. Для построения модели использовались два набора данных:
— данные по керну (20 скважин с 9 породами);
— данные по интерпретации ГИС (100 скважин с 10 породами).

После предварительной очистки от пропусков по шести основным признакам (SP, CALI, GR, LLS, DEPT) в выборке осталось 98 скважин. Очистка данных предполагала полное исключение записей с отсутствующими кривыми по любому из параметров. Шаг дискретизации по глубине составлял 10 см. В результате было сформировано около 450 тыс. строк по ГИС, из которых 115 тыс. строк содержали метки литологии и использовались для обучения и валидации модели.

Из опыта следует, что кавернометрия (CALI), гамма-каротаж (GR), каротаж удельного сопротивления (LLS), потенциал собственной поляризации (SP) и глубинные привязки (DEPT) выступают ключевыми переменными для построения рабочей модели классификации литологии. При этом наилучшие результаты были достигнуты при применении методов градиентного бустинга и ансамблевых моделей, а также с использованием более сложных архитектур глубоких нейронных сетей для обработки больших массивов данных.

Полученный опыт подтвердил, что несмотря на существующие ограничения и сложности, применение технологий искусственного интеллекта в интерпретации скважинных данных ГИС в реальных условиях Казахстана является перспективным направлением, требующим дальнейшего развития и тиражирования на уровне производственных структур.

По результатам анализа данных по 20 скважинам, для которых осуществлялся отбор керна, была выполнена попытка выделения литологии и последующего использования полученных данных в качестве обучающей выборки для построения модели искусственного интеллекта. В рамках данного этапа работы по керновому материалу было классифицировано 9 пород, отражающих различия в литологическом составе пород.

Однако практика показала, что обучение модели исключительно на данных керна не обеспечивает необходимой точности и устойчивости результатов из-за ограниченного объёма выборки и недостаточного количества представленных образцов по каждому из классов. В связи с этим для дальнейшего обучения и повышения качества модели было принято решение использовать расширенную выборку, основанную на данных ГИС, которые включали те же интервальные характеристики, что и керн.

В результате была сформирована 10-классовая обучающая выборка по данным ГИС, отражающая выделенные ранее породы. На рисунке 1 продемонстрирован пример такой выборки, где визуально видно, что часть пород хорошо разделяется по литологическим признакам, тогда как для других классов наблюдается частичное пересечение характеристик. Это указывает на необходимость дальнейшего уточнения методов предобработки и подбора оптимальных алгоритмов для повышения точности классификации.

 

Рисунок 1 - Пример 10 классовой обучающей выборки

 

Объединение выделенных по ГИС пород в породы по керну представляет собой самостоятельную задачу, обусловленную тем, что каждая порода по керновым данным является сложной структурой, состоящей из ряда взаимопересекающихся пород, расположенных в определённой последовательности.

В качестве примера приведено преобразование 10-классовой классификации пород в 5-классовую классификацию пород:

Класс 1 (песчаник крупнозернистый) соответствует 1-му классу пород.

Класс 2 (песчаник мелкозернистый) объединяет 2-й, 3-й и 4-й классы пород.

Класс 3 (алевролит) представлен 5-м классом пород.

Класс 4 (глинистый алевролит) включает 6-й, 7-й и 8-й классы пород.

Класс 5 (глина) объединяет 9-й и 10-й классы пород.

В обоих вариантах классификации разделение исходного набора данных на обучающую и валидационную выборки сохраняло исходные пропорции классов и не выявило значимого дисбаланса данных, в связи с чем применение методов балансировки выборок (таких как upscaling или downscaling) не предполагается. Соотношение тренировочной и тестовой выборок принято равным 70% и 30% соответственно.

Гистограммы для 5-классового и 10-классового вариантов представлены в рисунке 2. Такой формат графического представления позволяет легко сравнить распределение данных по классам для тренировочной и тестовой выборок.

 

Рисунок 2 - 5-и классовая и 10-и классовая модель

 

Для решения задачи автоматической классификации литологии на основе геофизических данных использованы два набора данных, представленных в формате LAS-файлов:

Набор 1: 20 скважин, данные основаны на результатах исследований керна (целевой признак —9 классов).

Набор 2: 100 скважин, данные основаны на интерпретации геофизических исследований скважин (ГИС), целевой признак —10 классов.

В качестве признаков использовались стандартные параметры ГИС: SPLLS, GR, CALI, DEPT — глубина, с шагом 10 см.

Для повышения устойчивости модели и учета геологической специфики было выполнено укрупнение исходных 10 классов до 5 обобщенных классов, ранее описанных выше.

Проведенные предварительные эксперименты показали, что обучение моделей на Наборе 1 (по данным керна) не обеспечивает приемлемого качества классификации, выраженного через метрику Сходимость (максимальное значение в диапазоне 0.55–0.60). В связи с этим в дальнейших расчетах использовался исключительно Набор 2, основанный на данных интерпретаций ГИС, позволяющий получить более стабильные и воспроизводимые результаты.

Ключевая задача проекта заключалась в разработке моделей именно для данных, основанных на ГИС, что позволяет масштабировать методику на полный фонд скважин. Для обеспечения качества итоговых моделей необходимо предусмотреть доступ к достаточному объему данных керновых исследований для валидации и контроля обученных моделей (Рис.3).

 

 

Рисунок 3 - Группировка классов

 

В процессе подготовки исходных данных для построения моделей было загружено 100 скважин, что соответствует общему объему в 1 900 000 строк. При этом значительная часть данных содержала пропуски различной природы. По результатам анализа установлено, что:

Полностью пустыми оказались около 452 000 строк (~25% от общего объема);

В 925 000 строках были неполные данные по ГИС-кривым;

Итоговый остаток после удаления пустых строк составил около 452 000 строк.

Из оставшихся данных только 115 000 строк (примерно 8% от исходного объема) содержат полный набор необходимых признаков и могут быть использованы для обучения и валидации моделей. Остальные 337 000 строк допустимо использовать лишь для прогнозных расчетов без последующей проверки качества.

Статистика по признакам показала следующие средние проценты пропусков:

  • Целевая переменная — около 94%;
  • CALI — около 33%;
  • GR — около 26%;
  • SP — около 75%;
  • LLS — около 43%.

Таким образом, изначально большой объем сырых данных значительно сокращается после обработки и удаления пропусков, что необходимо учитывать при построении и тестировании моделей машинного обучения.

Данные были разделены на обучающую и тестовую выборки. Тестовая выборка использовалась для проведения перекрёстной проверки с целью подбора оптимальных параметров модели. При этом данные теста применялись исключительно для оценки обобщающей способности модели и не использовались в процессе обучения.

В задачах контролируемого процесса обучения часто возникают проблемы смещения и дисперсии модели. Перекрёстная проверка (cross-validation) позволяет сбалансировать эти характеристики, снижая переобучение и повышая устойчивость модели к особенностям конкретного набора данных.

В рамках исследования были протестированы следующие алгоритмы машинного обучения (таблица 1 и 2):

Logistic Regression — использовалась в качестве базовой (vanilla) модели для целей сравнения. Является простым и быстрым алгоритмом, эффективно выявляющим линейные зависимости;

Random Forest — мощный ансамблевый метод, хорошо работающий на различных типах данных. Однако обученные модели могут занимать значительный объем памяти;

XGBoost — адаптивный градиентный бустинг, демонстрирующий высокую эффективность и скорость среди моделей своего класса. Отличается хорошим балансом между точностью и вычислительной сложностью.

Согласно результатам экспериментов, наилучшие показатели качества продемонстрировали модели Random Forest и XGBoost. При этом XGBoost обучается существенно дольше, но генерирует более компактную модель: например, модель Random Forest занимала около 18 ГБ памяти.

 

Таблица 1 - Сравнительная таблица рассматриваемых алгоритмов

                     (10 классовая)

 

Logistic Regression

Random Forest

XG-Boost

Точность /Accuracy Score

0,23

0,81

0,81

Среднее / F1 Macro Score

0,17

0,81

0,81

Средневзвешенное /F1 Weighted Score

0,19

0,81

0,81

Размер модели/ Model Size

0,02 mb

2 321 mb

609 mb

Скорость/Predict Speed (s)

0,01

4,3

129,7

 

Таблица 2 - Сравнительная таблица рассматриваемых алгоритмов

                     (5 классовая)

 

Logistic Regression

Random Forest

XG-Boost

Точность /Accuracy Score

0,49

0,90

0,90

Среднее / F1 Macro Score

0,34

0,88

0,88

Средневзвешенное /F1 Weighted Score

0,46

0,90

0,90

Размер модели/ Model Size

0,02 mb

619 mb

134 mb

Скорость/Predict Speed (s)

0,01

1,7

40,0

 

Для задачи ранжирования скважин была выбрана обученная модель на основе Random Forest с параметрами:

  • число деревьев — 250;
  • максимальная глубина деревьев — 45;
  • размер модели — 619 МБ для выборки с 5 классами и 2321 МБ для выборки с 10 классами;
  • точность модели (метрика качества на тестовой выборке) составила 0.9 и 0.8 соответственно.

В качестве признаков использовались как исходные геофизические кривые, так и производные признаки, такие как первая и вторая производные кривой SP, а также синтетические признаки, полученные с помощью арифметических операций над исходными данными.

В дополнение к Random Forest и XGBoost были протестированы также алгоритмы LightGBM, Decision Tree, Linear Regression и другие. По итогам сравнения наилучшие результаты показал алгоритм Random Forest, достигнув значения метрики качества 0.9.

В рамках данного исследования в качестве оптимального решения для поставленной задачи был выбран алгоритм Random Forest, продемонстрировавший наилучшее соотношение точности и вычислительной эффективности. Хотя алгоритм XGBoost показал аналогичные метрики качества, предпочтение было отдано Random Forest с учётом вышеописанного.

С учетом минимального целевого порога точности (точность> 0,85), была выбрана модель классификации с разделением на 5 классов. Такой подход обеспечил требуемый уровень обобщающей способности при сохранении интерпретируемости результатов.

Следует подчеркнуть, что представленные решения по выбору количества классов, алгоритма и его параметров не следует рассматривать как универсальные для более масштабных или разнородных наборов данных. Проведённый анализ ориентирован исключительно на демонстрацию предсказательной способности моделей в рамках данного проекта, ограниченного выборкой из 100 скважин.

Оценка производительности модели Random Forest на тестовой выборке показала высокий уровень точности — 0.9 при использовании 5-классовой схемы классификации, что подтверждает её применимость для ранжирования объектов в рассматриваемом контексте.

 

Таблица 3 - Сравнение двух моделей

 

Точность

Random Forest

Точность

Logystic Regression

Средняя

0,90

0,63

Точность по классу №1

0,92

0,55

Точность по классу №2

0,92

0,78

Точность по классу №3

0,75

0,61

Точность по классу №4

0,89

0,66

Точность по классу №5

0,93

0,57

 

Для более детального анализа качества классификации были рассчитаны показатели точности по каждому классу как для модели Random Forest, так и для логистической регрессии (таблица 3). Средняя точность модели Random Forest составила 0.90, что значительно превышает соответствующий показатель логистической регрессии — 0.63.

Разбивка по классам показала, что модель Random Forest демонстрирует устойчиво высокую точность для большинства категорий. Так, для классов №1, №2 и №5 точность составила 0.92, 0.92 и 0.93 соответственно. Несколько ниже точность наблюдается для класса №3 — 0.75, что, вероятно, связано с его внутренней неоднородностью или ограниченным числом объектов в выборке. Тем не менее, и в этом случае Random Forest превосходит логистическую регрессию, точность которой по данному классу составляет 0.61.

По всем пяти классам модель Random Forest обеспечивает стабильное и высокое качество классификации, тогда как логистическая регрессия демонстрирует более выраженную вариативность и менее удовлетворительные результаты — от 0.55 до 0.78.

Таким образом, сравнение точности по классам подтверждает преимущество алгоритма Random Forest в рассматриваемой задаче классификации скважин по выделенным категориям.

На рисунке 4 представлены распределения точности для моделей Random Forest и логистической регрессии.

График демонстрирует распределение точности моделей Random Forest и логистической регрессии.

Синяя кривая и столбцы — Random Forest: точность сконцентрирована в диапазоне 0.93–0.99, что свидетельствует о высокой стабильности и качестве модели.

Оранжевая кривая и столбцы — Logistic Regression: точность распределена шире и смещена к более низким значениям (около 0.49), что указывает на худшую предсказательную способность.

 

 

Рисунок 4 - Сравнение двух моделей

 

Анализ матриц ошибок показывает, что каждая из рассмотренных моделей демонстрирует различное поведение при классификации отдельных литологических классов. В целом, наибольшая точность достигается при распознавании песчаника, алевролита и глин, в то время как другие классы определяются менее уверенно.

Особенно стоит отметить, что глины стабильно показывают наивысшие значения F1-метрики при использовании как контролируемых, так и неконтролируемых алгоритмов. Это преимущество объясняется более широкой представленностью глин в разрезе, что обеспечивает лучшее обучение моделей на этом классе.

На рисунке 5 представлена визуализация результатов классификации фаций, полученных в результате применения обученной модели машинного обучения. Колонки с первой по пятую отражают входные каротажные параметры, используемые при обучении модели: гамма-каротаж (ГК), боковой каротаж (БК), коэффициент водонасыщенности (КВ), потенциометрический сигнал (ПС) и нормализованный ПС соответственно. Эти параметры представляют собой основную информацию о литологическом разрезе скважины и служат входными признаками для алгоритма классификации.

Шестая колонка содержит прогнозные данные по фациям, полученные с помощью обученной модели. В седьмой колонке приведены эталонные данные, полученные по результатам интерпретации профильными специалистами. Восьмая колонка отображает фации в виде цветовой шкалы (от 1 до 5), где каждому классу соответствует определённый цвет, что облегчает визуальное сопоставление между прогнозом и экспертной интерпретацией.

Сравнительный анализ показывает высокую степень сходимости между результатами, полученными моделью, и экспертной интерпретацией, включая как тонкослоистые, так и более протяжённые литологические интервалы. Коэффициент сходимости между модельной классификацией и экспертной разметкой на данной скважине приближается к 1, что свидетельствует о высокой точности и надёжности применённого подхода.

Таким образом, использование алгоритмов машинного обучения демонстрирует высокую эффективность в автоматизированной интерпретации фаций на основе стандартных каротажных данных и может служить надёжным инструментом в геологоразведочной практике.

 

 

Рисунок 5 - Использование обученной модели по сравнению с человеком

 

На текущий момент данная модель внедрена в информационную систему (далее ИС) КМГИ, предназначенную для оперативного прогнозирования литологии по каротажным данным (Используется 4 и 6 кривых). Скважинные данные загружаются в ИС. Далее обученная модель классифицирует каждый метр разреза, присваивая ему один из заранее определённых литологических типов. Результаты выводятся в виде цветокодированных колонок, сопоставимых с ручной интерпретацией специалистов, что позволяет оперативно корректировать стратиграфические модели и уточнять границы пластов (рисунок 6).

 

 

Рисунок 6 - Использование внедренных моделей в ИС

 

Информационная система обеспечивает визуализацию всех этапов – от исходных каротажных кривых до прогнозируемых литологий – в едином окне. Это позволяет быстро оценивать изменения фациальной обстановки.

Подобные подходы уже реализуются в интегрированном программном обеспечении в разных компаниях (Dream Cloud и CIFlog).

Таким образом, использование машинного обучения в сочетании с современными информационными системами позволяет повысить точность и скорость интерпретации каротажных данных, снизить зависимость от субъективного фактора и обеспечить постоянное улучшение прогностических моделей за счёт накопления новой информации.

 

1.3  Интегрированные программные решения

Крупнейшие мировые компании, такие как Schlumberger, разрабатывают интегрированные программные комплексы. Например, DELFI — это платформа для когнитивной разведки и разработки месторождений, включающая обработку и интерпретацию данных, стандартизацию, очистку и анализ. Программное обеспечение Techlog позволяет анализировать каротажные данные с помощью интеллектуальных алгоритмов.

В Китае разрабатываются собственные платформы, такие как Dream Cloud Collaboration Platform от CNPC, LEAD (интегрированное ПО для каротажной обработки и интерпретации) и CIFlog (многоскважинная оценка пластов). Развиваются технологии искусственного интеллекта для моделирования пластов, интерпретации каротажа и геонавигации при бурении горизонтальных скважин. [1]

 

2. Геофизическая разведка

Исследования в области "ИИ + геофизическая разведка" стремительно развиваются по всему миру. Геофизическая разведка исторически является одной из первых отраслей, где использовались цифровые технологии, включая высокопроизводительные вычисления, трехмерную визуализацию и компьютерные сети.

 

2.1. Оборудование для геофизической разведки

ИИ применяется в оборудовании для геофизической разведки, включая вибросейсморазведку, беспилотники и сейсмическую аппаратуру.

Интеллектуальная вибросейсморазведка позволяет адаптировать параметры работы (мощность, диапазон частот, время сканирования и фазу) в зависимости от условий на поверхности и глубинных геологических характеристик, повышая безопасность и снижая нагрузку на окружающую среду.

Беспилотники (БПЛА) используются для сбора геофизических данных, детальной топографической съемки, оценки рисков, мониторинга узловых точек, восстановления данных, доставки оборудования и спасательных операций.

Современные сейсмические системы включают проводные (G3i) и беспроводные (Hawk, eSeis, OBN – ocean bottom node) решения. Технологии OBN позволяют преодолевать ограничения, связанные с шумами, плохой проходимостью местности и узким диапазоном наблюдений.

 

Литературный обзор

Одним из ключевых направлений использования ИИ является интерпретация данных каротажа и сейсморазведки. Согласно исследованиям Wu et al. [9], глубокие нейросети, в частности сверточные (CNN) и рекуррентные сети (RNN), успешно применяются для автоматической классификации геофизических аномалий и идентификации разломов в сейсмических данных. Zhang et al. [1] отмечают, что модели машинного обучения позволяют повышать точность анализа геологических характеристик, сокращая время обработки информации.

Применение алгоритмов сегментации изображений, таких как U-Net, позволяет автоматически выделять границы геологических объектов [10]. Однако, как указывают авторы, отсутствие размеченных данных остается ключевой проблемой, ограничивающей дальнейшее развитие данной технологии.

ИИ также активно применяется в прогнозировании параметров пластов, таких как пористость, проницаемость и насыщенность [11]. В ранних работах использовались традиционные методы машинного обучения, включая метод опорных векторов (SVM) и линейную регрессию. В современных исследованиях отмечается рост применения глубинных нейросетей (BP, LSTM), случайных лесов (Random Forest) и градиентного бустинга (GBDT), что значительно повышает точность прогнозов [12].

 

 

Заключение

      Для Казахстана, обладающего крупными нефтегазовыми месторождениями, такими как Тенгиз, Кашаган и Карачаганак, внедрение искусственного интеллекта в разведку и разработку — это не просто тренд, а реальная необходимость. Мы сталкиваемся с серьезными вызовами: сложные геологические условия, высокая неоднородность пластов, возрастающие затраты на добычу и необходимость более рационального использования ресурсов.

ИИ уже помогает нашей нефтегазовой отрасли решать эти задачи. Автоматизированный анализ геологоразведочных данных, прогнозирование продуктивности скважин и моделирование пластов на основе машинного обучения позволяют нам повышать эффективность работы. Казахстанские компании начинают активно использовать технологии цифровых двойников, интеллектуального управления добычей и автоматизированной интерпретации сейсмических данных. [6, 7, 8]

Наша страна уверенно движется в сторону цифровизации нефтегазовой отрасли. В условиях глобальной конкуренции и требований устойчивого развития нам необходимо активнее внедрять ИИ, чтобы повышать коэффициент извлечения нефти, снижать издержки и минимизировать экологическое воздействие. Искусственный интеллект — это не просто инструмент, а один из ключей к будущему нашей энергетики.

е помогает нашей нефтегазовой отрасли решать эти задачи. Автоматизированный анализ геологоразведочных данных, прогнозирование продуктивности скважин и моделирование пластов на основе машинного обучения позволяют нам повышать эффективность работы. Казахстанские компании начинают активно использовать технологии цифровых двойников, интеллектуального управления добычей и автоматизированной интерпретации сейсмических данных. [6, 7, 8]

Наша страна уверенно движется в сторону цифровизации нефтегазовой отрасли. В условиях глобальной конкуренции и требований устойчивого развития нам необходимо активнее внедрять ИИ, чтобы повышать коэффициент извлечения нефти, снижать издержки и минимизировать экологическое воздействие. Искусственный интеллект — это не просто инструмент, а один из ключей к будущему нашей энергетики.

×

Список литературы

  1. 1. Цифровая платформа iStar от Halliburton Sperry Drilling
  2. 2. Zhang, Y., Wang, L., & Li, R. (2020). Application of Deep Learning in Seismic Facies Classification. Journal of Petroleum Exploration and Production Technology, 10(4), 981-995.
  3. 3. PerGeos | Use Case Gallery | Thermo Fisher Scientific
  4. 4. .ПРИМЕНЕНИЕ НЕЙРОННОЙ СЕТИ АРХИТЕКТУРЫ U-Net ДЛЯ СЕГМЕНТАЦИИ СТМ-ИЗОБРАЖЕНИЙ – тема научной статьи по компьютерным и информационным наукам читайте бесплатно текст научно-исследовательской работы в электронной библиотеке КиберЛенинка
  5. 5. http://repo.ssau.ru/handle/Perspektivnye-informacionnye-tehnologii/PRIMENENIE-GLUBOKIH-NEIRONNYH-SETEI-OSNOVANNYH-NA-LSTM-DLYa-REShENIYa-ZADACh-KLASSIFIKACII-89864
  6. 6. ТОО «СП «Казгермунай». (2019). Интеллектуальное месторождение: Опыт внедрения цифровых технологий в Казахстане. Retrieved from https://www.kmg.kz
  7. 7. Тенгизшевройл (ТШО). (2024). Как искусственный интеллект применяется в Тенгизшевройл. Retrieved from https://www.tengizchevroil.com
  8. 8. АО «Каспий нефть». (2022). Цифровизация месторождений и повышение эффективности добычи. Forbes Kazakhstan. Retrieved from https://forbes.kz
  9. 9. Wu, X., Lin, T., & Chen, L. (2021). "Seismic Fault Detection Using Convolutional Neural Networks." Geophysics, 86(4), 273-289.
  10. 10. М. В. Ронкин, Е. Н. Акимова, В. Е. Мисилов, К. И. Решетников, Обзор применения глубоких нейронных сетей и параллельных архитектур в задачах фрагментации горных пород, Вестн. ЮУрГУ. Сер. Выч. матем. информ., 2023, том 12, выпуск 4, 5–54
  11. 11. Jiang, H., Wang, F., & Sun, Y. (2019). "Lithology Identification Using Machine Learning Algorithms: A Comparative Analysis." Journal of Petroleum Exploration and Production Technology, 9(4), 235-248.
  12. 12. Phan, S., Nguyen, D., & Tran, H. (2021). "AI-Based Seismic Inversion Using Generative Adversarial Networks." Journal of Petroleum Science and Engineering, 198, 107334.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© ДУКЕСОВА Н.К., Курмангалиев Д.Ж., Абилгазиева А.Ш., Аяганова А.И.,

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах